使用Apache POI 5.3.0实现Word文档最后一页添加特殊页脚的问题

阿华AIGC实验室

2026-4-15

Apache POI 5.3.0实现Word文档最后一页添加特殊页脚的问题

首先得给你说清楚你遇到的getPages()方法不准的核心原因：这个方法读的是Word文档元数据里的旧统计值，只有Word客户端打开文档并重新计算布局保存后，这个值才会更新。而Apache POI的XWPFDocument在内存里操作时，只是修改文档的XML结构，完全不会像Word那样实时渲染计算页数——所以哪怕你加了两倍的内容，这个值还是模板里的原始数字，哪怕写回文件再读也没用，因为POI不会帮你触发Word的布局计算。

接下来给你两个解决思路，优先推荐第一个（这是Word本身设计的正确用法，比你手动拆分段落靠谱多了）：

方案一：用Word的节功能实现最后一页特殊页脚（推荐）

你要的“最后一页页脚特殊”，其实Word本身就支持通过节的独立页脚设置来实现，根本不需要去拆分段落、计算页数这种绕路的操作。核心逻辑是：把文档最后一页（或最后一部分）设为独立的节，关闭这个节和前一节的页脚关联，然后给这个节设置自定义页脚。

用POI 5.3.0实现的大致代码如下：

// 1. 处理文档的节设置，准备创建最后一个独立节
CTBody body = document.getDocument().getBody();
CTSectPr originalSectPr = null;
if (body.getSectPr() != null) {
    // 复制原文档的页面设置（边距、纸张大小等），避免新节的页面格式乱掉
    originalSectPr = (CTSectPr) body.getSectPr().copy();
    body.unsetSectPr();
}

// 2. 创建一个带"下一页分节符"的段落，把最后一页拆成独立节
XWPFParagraph sectBreakPara = document.createParagraph();
CTP ctp = sectBreakPara.getCTP();
CTPPr ppr = ctp.getPPr() != null ? ctp.getPPr() : ctp.addNewPPr();
CTSectPr lastSectPr = ppr.getSectPr() != null ? ppr.getSectPr() : ppr.addNewSectPr();

// 设置分节符类型为"下一页"，这样新节从新的一页开始
lastSectPr.addNewType().setVal(STSectionMark.NEXT_PAGE);
// 继承原文档的页面设置
if (originalSectPr != null) {
    lastSectPr.setPgSz(originalSectPr.getPgSz());
    lastSectPr.setPgMar(originalSectPr.getPgMar());
}

// 3. 给最后一节设置独立的特殊页脚
XWPFHeaderFooterPolicy footerPolicy = document.getHeaderFooterPolicy();
if (footerPolicy == null) {
    footerPolicy = document.createHeaderFooterPolicy();
}

// 创建最后一节的页脚，关闭"链接到前一节"的设置
XWPFFooter lastPageFooter = footerPolicy.createFooter(STHdrFtr.DEFAULT);
// 关键：断开和前一节的页脚关联，这样这个节的页脚可以单独设置
lastPageFooter.getCTHdrFtr().addNewFtrRef().setType(STHdrFtr.LAST);
// 给特殊页脚添加内容
XWPFParagraph footerPara = lastPageFooter.createParagraph();
XWPFRun footerRun = footerPara.createRun();
footerRun.setText("这是最后一页的专属特殊页脚");
footerRun.setFontSize(10);
footerRun.setAlignment(ParagraphAlignment.CENTER);

这个方案的好处是完全符合Word的设计逻辑，不管你的段落跨不跨页，最后一节的页脚都是独立的，不需要手动处理任何拆分逻辑。

方案二：如果必须拆分段落（不推荐）

如果你因为某些特殊原因一定要拆分跨页的段落，那POI本身确实没有实时计算页数的能力，只能曲线救国：把内存中的文档转成PDF，用PDF的页数来判断。

需要额外引入Apache PDFBox的依赖（和POI 5.3.0兼容的版本选2.0.32即可），然后通过PDF的页数来判断：

<!-- 先加PDFBox的Maven依赖 -->
<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.32</version>
</dependency>

然后实现转PDF算页数的方法：

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.apache.poi.xwpf.converter.pdf.PdfOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;

import java.io.ByteArrayOutputStream;
import java.io.IOException;

public static int getActualPageCount(XWPFDocument document) throws IOException {
    // 把XWPFDocument转成PDF字节流
    ByteArrayOutputStream baos = new ByteArrayOutputStream();
    PdfOptions options = PdfOptions.create();
    PdfConverter.getInstance().convert(document, baos, options);
    
    // 用PDFBox读取PDF并获取页数
    try (PDDocument pdfDoc = PDDocument.load(baos.toByteArray())) {
        return pdfDoc.getNumberOfPages();
    } finally {
        baos.close();
    }
}

但这个方案有明显的缺点：转PDF的过程会消耗不少性能，而且PDF的渲染和Word客户端的渲染可能有细微差异，页数不一定完全一致，只能作为退而求其次的选择。

最后再提醒你：你的createSectionBreak方法其实只是加了个分页符，不是分节符——分页符只是换页，没法控制页脚的独立性，分节符才是控制节属性的关键。

备注：内容来源于stack exchange，提问作者Asya