使用Mammoth转换DOCX到Markdown时图片无法正常显示求助
解决Mammoth转换DOCX后GitHub图片不显示的问题
这个问题挺常见的——Mammoth默认会把DOCX里的图片转成base64编码内嵌到Markdown里,但GitHub不支持这种内嵌方式,而且这种做法还会让你的Markdown文件变得臃肿,不利于版本控制。下面是两步就能搞定的解决方案:
1. 转换时提取图片到本地文件夹
修改你的Mammoth命令,加上--output-dir参数指定图片保存的目录(比如叫images):
mammoth git.docx --output-format=markdown --output-dir=images > git.md
执行这个命令后,Mammoth会把DOCX里的图片都提取到images文件夹,同时生成的git.md里的图片引用会变成相对路径格式,比如:

2. 提交图片文件夹到GitHub
别忘了把images文件夹和git.md一起提交到仓库:
git add git.md images/ git commit -m "Add converted markdown and images" git push
这样GitHub就能通过相对路径找到图片文件,正常显示了。
如果需要更灵活的图片命名或路径规则,你还可以用Mammoth的自定义转换脚本,但对大多数场景来说,上面的方法已经足够简单有效。
内容的提问来源于stack exchange,提问作者Santhosh




