如何用Python和openpyxl按唯一ID筛选Excel行并复制到模板工作簿？

阿华AIGC实验室

2026-5-21

解决Excel按唯一标识符筛选并复制到模板的问题

嘿，我完全懂你这个困扰——openpyxl的AutoFilter功能真的有点“中看不中用”，只能设置筛选规则，却没法直接把筛选后的结果提取出来复制到模板里。别慌，这里有两个实用的解决方案，帮你搞定这个需求：

方案一：用Pandas快速处理（推荐大数据场景）

Pandas处理表格数据的效率超高，尤其适合你的巨型工作簿，代码也简洁易懂。步骤如下：

读取源工作簿的所有数据
根据唯一标识符筛选目标行
加载模板工作簿
将筛选后的数据写入模板的指定位置
保存最终结果

代码示例

import pandas as pd
from openpyxl import load_workbook

# 替换成你的实际参数
source_excel = "你的巨型工作簿.xlsx"
template_excel = "模板工作簿.xlsx"
result_excel = "筛选结果.xlsx"
id_col_name = "标识符"  # 源数据中标识符列的表头名称
target_id = "12345"  # 你要筛选的目标标识符

# 1. 读取源数据（保留表头）
source_data = pd.read_excel(source_excel, header=0)

# 2. 筛选目标标识符对应的所有行
filtered_data = source_data[source_data[id_col_name] == target_id]

# 3. 加载模板工作簿，准备写入
template_book = load_workbook(template_excel)
writer = pd.ExcelWriter(result_excel, engine="openpyxl")
writer.book = template_book

# 4. 将筛选数据写入模板的指定工作表（比如"结果页"），从第2行开始（跳过模板表头）
# index=False不写入行索引，header=False不写入表头（因为模板已有表头）
filtered_data.to_excel(writer, sheet_name="结果页", startrow=1, index=False, header=False)

# 5. 保存并关闭
writer.close()

优势

处理几十万行的巨型工作簿速度超快
代码简洁，无需手动遍历每一行
自动处理列对齐，不用担心错位问题

方案二：纯Openpyxl手动遍历（无需额外依赖）

如果你不想安装Pandas，也可以用openpyxl手动遍历每一行，判断标识符是否匹配，再复制到模板里。步骤如下：

加载源工作簿和模板工作簿
获取对应的工作表
遍历源工作表的每一行，检查标识符
将匹配的行复制到模板的指定位置
保存结果

代码示例

from openpyxl import load_workbook
from openpyxl.utils import get_column_letter

# 替换成你的实际参数
source_excel = "你的巨型工作簿.xlsx"
template_excel = "模板工作簿.xlsx"
result_excel = "筛选结果.xlsx"
id_col_index = 1  # 标识符所在的列（从1开始计数，比如第一列就是1）
target_id = "12345"  # 目标标识符
template_start_row = 2  # 模板中开始写入数据的行（假设第1行是表头）

# 1. 加载工作簿
source_wb = load_workbook(source_excel, data_only=True)
template_wb = load_workbook(template_excel)
source_ws = source_wb["源数据页"]  # 指定源数据的工作表名称
template_ws = template_wb["结果页"]  # 指定模板的工作表名称

# 2. 遍历源数据行（跳过表头，从第2行开始）
current_write_row = template_start_row
for row in source_ws.iter_rows(min_row=2, values_only=False):
    # 获取当前行的标识符值（因为row是0索引，列是1索引，所以减1）
    current_id = row[id_col_index - 1].value
    if current_id == target_id:
        # 复制每一列的内容到模板
        for col_idx, cell in enumerate(row, start=1):
            # 写入单元格值
            template_ws[f"{get_column_letter(col_idx)}{current_write_row}"].value = cell.value
            # 可选：复制单元格格式（字体、填充、边框等）
            # template_ws[f"{get_column_letter(col_idx)}{current_write_row}"].font = cell.font.copy()
            # template_ws[f"{get_column_letter(col_idx)}{current_write_row}"].fill = cell.fill.copy()
        current_write_row += 1

# 3. 保存结果
template_wb.save(result_excel)