MERGE替代INSERT批量插入并返回ID的性能优化求助

阿华AIGC实验室

2026-5-26

批量插入+获取生成ID的性能优化方案

这个场景我之前处理过类似的，1亿+数据量的批量插入确实容易遇到MERGE的性能瓶颈，尤其是你这种纯粹插入的场景，MERGE其实属于过度设计——毕竟ON 0=1的条件永远不匹配，本质就是单纯的插入，但MERGE自带的匹配检查逻辑会在大数据量下放大额外开销。先把这个基础逻辑换掉，性能就能提升一大截：

用INSERT ... SELECT配合OUTPUT子句替代MERGE，既能完成批量插入，也能获取生成的ID，而且开销更低：

INSERT INTO [TargetTable] (col1, col2, ...)
OUTPUT inserted.ID -- 这里直接获取插入后生成的ID
SELECT col1, col2, ... FROM [SourceTable]

接下来针对你执行计划里的三个高占比操作，逐个击破：

1. 消除`Sort`操作（占比26%）

Sort一般是因为SQL Server需要把源数据调整成匹配目标表聚集索引的顺序，才能高效写入。解决思路是让源数据本身就是有序的：

给源表（或临时存储的源数据）创建与目标表聚集索引顺序一致的索引。比如目标表聚集索引是自增ID或者CreateTime，就给源表按这个列建索引，避免插入前的排序开销。

如果用临时表存源数据，创建时直接指定匹配目标表的聚集索引：

CREATE TABLE #TempSource (
    col1 INT,
    col2 VARCHAR(50),
    PRIMARY KEY CLUSTERED (col1) -- 和目标表聚集索引顺序保持一致
)

2. 降低索引插入开销（Index Insert 40% + Clustered Index Merge 20%）

这两个操作的核心问题是索引维护的开销过大，尤其是目标表有多个非聚集索引时，每插入一行都要更新所有非聚集索引：

临时禁用非聚集索引：如果批量插入期间没有其他业务读写目标表，可以先禁用所有非聚集索引，插入完成后再重建（重建比单纯启用更能整理碎片）：
```
-- 禁用所有非聚集索引
ALTER INDEX ALL ON [TargetTable] DISABLE;

-- 执行批量插入操作...

-- 重建索引（自动启用并消除碎片）
ALTER INDEX ALL ON [TargetTable] REBUILD;
```

维护聚集索引碎片：1亿+数据的表，聚集索引很容易产生碎片，导致插入时频繁页分裂。先检查碎片率：

SELECT name, avg_fragmentation_in_percent 
FROM sys.dm_db_index_physical_stats(DB_ID(), OBJECT_ID('TargetTable'), 1, NULL, 'DETAILED');

如果碎片率超过30%，重建聚集索引；10%-30%之间则重组：

ALTER INDEX PK_TargetTable ON [TargetTable] REBUILD; -- 重建
-- 或者 ALTER INDEX PK_TargetTable ON [TargetTable] REORGANIZE; -- 重组

添加TABLOCK提示：给插入语句加上WITH (TABLOCK)，让SQL Server获取表级锁，减少逐行/逐页加锁的开销，同时在大容量日志模式下还能启用最小日志记录，大幅降低日志生成量：
```
INSERT INTO [TargetTable] WITH (TABLOCK) (col1, col2, ...)
OUTPUT inserted.ID
SELECT col1, col2, ... FROM [SourceTable]
```

3. 优化批量插入的批次与日志策略

调整批次大小：你当前每次插1万行，可以测试更大的批次（比如5万、10万）——更大的批次能减少事务次数和日志刷新的开销，但要注意不要超过服务器内存承受范围，避免内存溢出。
临时切换到大容量日志模式：如果数据库当前是完整恢复模式，批量插入会产生海量日志。可以临时切换模式，完成插入后再切回：
```
ALTER DATABASE YourDatabase SET RECOVERY BULK_LOGGED;

-- 执行批量插入...

ALTER DATABASE YourDatabase SET RECOVERY FULL;
```
注意：切换前要确保当前日志已经备份，避免数据丢失风险。

4. 其他进阶优化

改用分区表：如果目标表已经有1亿+数据，建议按时间、ID范围等维度做分区。分区表插入时只会操作对应分区，减少锁范围和索引维护的开销，还能提升并行处理能力。
禁用行级触发器：如果目标表有行级触发器，批量插入时会逐行触发，带来巨大开销。可以临时禁用触发器，插入完成后再启用：
```
DISABLE TRIGGER ALL ON [TargetTable];
-- 插入操作...
ENABLE TRIGGER ALL ON [TargetTable];
```

最后再强调：替换MERGE为INSERT ... SELECT + OUTPUT是基础优化，再结合上面的索引、日志、批次调整，你的插入耗时应该能从几百秒降到几十秒甚至更低。

内容的提问来源于stack exchange，提问作者LINQ2Vodka