如何使用python-docx读取Word文档指定内容后的表格？

如何使用python-docx读取Word文档指定内容后的表格？

阿华AIGC实验室

2026-5-29

基于文本标识提取Word文档中后续表格的Python方案

当然可以实现这个需求！这种不依赖表格序号、靠内容标记定位目标表格的场景非常实用，我会用python-docx库来给你一套可直接复用的代码——这是Python处理Word文档最主流的工具之一。

核心思路

我们需要按文档的原始顺序遍历所有内容元素（段落+表格），先定位到包含目标文本“6”的段落，然后继续往后查找，直到遇到第一个表格，这个表格就是我们要提取的目标。

步骤实现

1. 安装依赖库

首先确保你已经安装了python-docx：

pip install python-docx

2. 完整代码示例

下面的代码会帮你精准定位目标表格，并把表格内容转换成易处理的二维列表：

from docx import Document

def extract_table_after_text(doc_path, target_text):
    # 加载Word文档
    doc = Document(doc_path)
    target_found = False
    desired_table = None

    # 按顺序遍历文档中的所有主体元素（段落和表格）
    for elem in doc.element.body:
        # 判断当前元素是段落还是表格
        if elem.tag.endswith('p'):
            # 提取段落的纯文本（处理带格式的run）
            paragraph_text = ''.join([run.text for run in elem.iter() if run.text])
            # 检查是否包含目标文本
            if target_text in paragraph_text:
                target_found = True
                continue  # 找到目标后，继续往后找表格
        elif elem.tag.endswith('tbl'):
            # 如果已经找到目标文本，这就是我们要的表格
            if target_found:
                # 通过元素索引获取对应的表格对象
                desired_table = doc.tables[doc.index(elem)]
                break  # 找到后立即停止遍历，提升效率

    if not desired_table:
        return "未找到目标文本，或目标文本后没有表格"
    
    # 将表格内容转换为二维列表（方便后续处理）
    table_content = []
    for row in desired_table.rows:
        row_data = [cell.text.strip() for cell in row.cells]
        table_content.append(row_data)
    
    return table_content

# 测试使用
if __name__ == "__main__":
    # 替换成你的Word文档路径和目标文本
    result = extract_table_after_text("example.docx", "6")
    if isinstance(result, list):
        print("成功提取表格内容：")
        for row in result:
            print(row)
    else:
        print(result)

关键细节说明

为什么遍历doc.element.body？因为直接用doc.paragraphs和doc.tables会把段落和表格分开处理，无法保持它们在文档中的原始顺序，而doc.element.body能让我们按文档里的先后顺序逐个处理元素。
处理段落文本时，我们遍历了段落里的所有run：Word里的段落可能包含多个不同格式的文本片段（比如加粗、变色），这样能确保我们拿到完整的纯文本内容。
如果目标文本“6”在文档中出现多次，代码会提取第一个“6”之后的表格；如果需要提取最后一个“6”之后的表格，只需要把target_found = True改成每次遇到目标文本都更新这个标记即可。

额外提示

如果你的文档包含复杂格式（比如嵌套表格、分节符），可能需要对代码做微调，但这套逻辑对绝大多数常规Word文档都能完美适配。

内容的提问来源于stack exchange，提问作者Andrew VII

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠