从Word转存的PDF文件中提取原Word文档的创建日期元数据
好问题!我之前也碰到过类似的情况——默认情况下用Word转PDF时,确实会把元数据里的创建日期替换成PDF生成当天的日期,但还是有几种方法可以尝试提取原Word文档的创建信息:
检查PDF的高级自定义元数据
有些PDF转换工具(包括Word自带的“另存为PDF”,如果转换时勾选了保留文档属性)会把原Word的元数据嵌入到PDF的自定义字段里。你可以用Adobe Acrobat或者免费工具比如PDF XChange Editor打开PDF,找到「文档属性」(通常右键菜单里有),然后查看「高级」或「自定义元数据」标签,说不定能找到类似Original Create Date、Word:CreateDate这类和原Word文档相关的日期字段。用命令行工具解析元数据
推荐用exiftool这个强大的元数据提取工具,它能深挖PDF里的各种隐藏元数据。打开命令行,运行以下命令:exiftool -a -G1 -s yourfile.pdf输出结果里,你可以查找带有
Word:前缀的字段,或者XMP:CreateDate这类可能保留原始创建时间的条目——部分转换工具会把原Word的创建日期存在这些地方。尝试将PDF转回Word查看元数据
如果这个PDF不是扫描件(是可编辑的文本型PDF),你可以用Word的「打开PDF」功能直接把它转成Word文档,然后查看转后Word的「文件>信息>相关日期」里的创建日期。不过这个方法不一定百分百有效,要看PDF转换时是否保留了足够的原始信息,但值得一试。
另外补充一点:如果是自己把Word转PDF,想要保留原文档的创建日期,记得在「另存为PDF」的「选项」里勾选「文档属性」和「包含隐藏的文档属性」,这样元数据才会被携带到PDF里。但你现在是接收方,只能看对方转换时有没有做这个设置啦。
备注:内容来源于stack exchange,提问作者Kajlinko




