如何在Java中复制docx页面至另一文档？附多页报告生成需求

阿华AIGC实验室

2026-5-25

刚好之前做过类似的自动化docx报告生成需求，用docx4j完全能搞定你的需求——复制单页模板、修改内容生成多页报告。下面给你详细拆解实现步骤和代码示例：

一、核心方案：Java + docx4j实现

1. 先明确docx的结构逻辑

首先得清楚：docx文档里并没有直接的“页面”对象，你的单页模板本质是一个Section（节），所以我们的核心操作是克隆这个Section，然后在每个克隆的Section里修改定制内容，最后把多个Section合并成新文档。

2. 准备依赖（Maven）

先确保项目里引入docx4j的核心依赖：

<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j-core</artifactId>
    <version>11.4.9</version> <!-- 用最新稳定版即可 -->
</dependency>
<dependency>
    <groupId>org.docx4j</groupId>
    <artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
    <version>11.4.9</version>
</dependency>

3. 具体实现代码

下面是完整的示例代码，包含加载模板、克隆Section、修改内容、保存新文档的全流程：

import org.docx4j.Docx4J;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;
import org.docx4j.wml.Body;
import org.docx4j.wml.SectPr;
import org.docx4j.wml.P;
import org.docx4j.wml.R;
import org.docx4j.wml.Text;

import java.io.File;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class DocxPageClone {
    public static void main(String[] args) throws Exception {
        // 1. 加载单页模板文档
        WordprocessingMLPackage templatePackage = Docx4J.load(new File("template.docx"));
        MainDocumentPart templateMainPart = templatePackage.getMainDocumentPart();
        Body templateBody = templateMainPart.getContents().getBody();
        
        // 获取模板的Section设置（单页模板只有一个Section）
        SectPr templateSectPr = templateBody.getSectPr();
        // 克隆模板的所有内容（段落、表格等）
        List<Object> templateContent = templateBody.getContent();

        // 2. 创建新的目标文档
        WordprocessingMLPackage targetPackage = WordprocessingMLPackage.createPackage();
        MainDocumentPart targetMainPart = targetPackage.getMainDocumentPart();
        Body targetBody = targetMainPart.getContents().getBody();

        // 3. 定义需要生成的页面数量和每个页面的定制内容
        Map<Integer, Map<String, String>> pageData = new HashMap<>();
        pageData.put(1, Map.of("${TITLE}", "第1页报告", "${CONTENT}", "这是第一页的定制内容"));
        pageData.put(2, Map.of("${TITLE}", "第2页报告", "${CONTENT}", "这是第二页的定制内容"));
        pageData.put(3, Map.of("${TITLE}", "第3页报告", "${CONTENT}", "这是第三页的定制内容"));

        // 4. 循环克隆页面并修改内容
        for (Map.Entry<Integer, Map<String, String>> entry : pageData.entrySet()) {
            Map<String, String> data = entry.getValue();
            
            // 克隆模板的内容到新的Body
            for (Object obj : templateContent) {
                Object clonedObj = Docx4J.clone(obj);
                targetBody.getContent().add(clonedObj);
            }
            // 添加Section设置（确保每页都是独立的页）
            targetBody.setSectPr((SectPr) Docx4J.clone(templateSectPr));

            // 5. 替换当前页面的变量
            replaceVariables(targetBody, data);
        }

        // 6. 保存生成的多页文档
        Docx4J.save(targetPackage, new File("multi-page-report.docx"));
        System.out.println("多页报告生成完成！");
    }

    // 自定义变量替换方法：遍历所有文本节点替换占位符
    private static void replaceVariables(Body body, Map<String, String> data) {
        // 获取Body里所有的段落
        List<Object> content = body.getContent();
        for (Object obj : content) {
            if (obj instanceof P paragraph) {
                // 遍历段落里的所有文本 run
                for (Object runObj : paragraph.getContent()) {
                    if (runObj instanceof R run) {
                        for (Object textObj : run.getContent()) {
                            if (textObj instanceof Text text) {
                                String textValue = text.getValue();
                                // 替换所有匹配的占位符
                                for (Map.Entry<String, String> entry : data.entrySet()) {
                                    textValue = textValue.replace(entry.getKey(), entry.getValue());
                                }
                                text.setValue(textValue);
                            }
                        }
                    }
                }
            }
            // 如果有表格，需要额外处理表格里的文本，这里可以扩展逻辑
            // else if (obj instanceof Tbl table) { ... }
        }
    }
}

4. 关键注意事项

变量占位符：建议在模板里用${TITLE}这种格式的占位符，方便替换。如果模板里有表格、图片等元素，需要在replaceVariables方法里扩展处理逻辑，比如遍历表格的单元格文本。
Section克隆：一定要克隆模板的SectPr，否则所有内容会挤在同一页，无法生成独立的页面。
样式保持：docx4j的clone方法会保留原模板的样式，所以克隆后的页面样式和模板一致。

二、备选方案（如果docx4j太复杂）

如果你觉得docx4j的API有点繁琐，也可以试试这些方案：

Apache POI：和docx4j类似，都是操作docx底层结构，优点是社区文档多，缺点是需要处理更多细节。
Freemarker + docx模板：先把docx另存为XML，在XML里插入Freemarker占位符，然后用Freemarker渲染生成XML，再转成docx。适合批量生成结构固定的报告。
Python + python-docx：如果允许用Python，这个库的API更简洁，几行代码就能完成页面复制和内容修改，适合快速开发。

内容的提问来源于stack exchange，提问作者Mukul Gupta