解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程

Xpdf是用来处理和转换 PDF 的利器。项目中需要将 PDF 转换为图片,但是发现有的 PDF 文档转换缺失字体,而且下载 ttf格式的字体也不起作用,于是到官方文档才发现还需要配置字库,而且官方给出的是 pfb格式的字库,根据说明配置好后问题迎刃而解。

  • 官网地址:http://www.xpdfreader.com/

文章目录

  • 一、报错提示
  • 二、官网解决方案
    • 1. 下载字库
    • 2. 官网配置说明
  • 三、字库缺失
    • 1. 字库报错
  • 四、xpdfrc 完整配置
  • 五、配置示例下载

一、报错提示

以 pdftoppm 为例,再将 PDF 转换 为 ppm 格式图片的时候会提示缺少两个字体:Symbol、ZapfDingbats
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第1张图片
其他格式的转换工具也存在同样的问题
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第2张图片

二、官网解决方案

1. 下载字库

① 好巧,官网下载页中给出了这两个字体,下载后发现,这是两个 pfb格式的文件,Windows 根本不识别这个格式
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第3张图片
② 无法安装字体
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第4张图片

2. 官网配置说明

① 继续查看官网的 Support 板块,发现里面 有个 xpdfrc配置文件,里面有配置字体的方式
http://www.xpdfreader.com/xpdfrc-man.html
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第5张图片
② 于是我也新建了个名为 xpdfrc的文件,注意不要有后缀,然后把字体路径配置好
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第6张图片
③ 重新运行发现不报错了
在这里插入图片描述

三、字库缺失

1. 字库报错

① 还有的 PDF 更夸张,不仅报缺失字体,还缺少字库,于是又上网搜了一番,还是回归到了官网,发现人家有个中文语言包,可能就是用来解决这个问题的
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第7张图片
② 报错提示

C:\Users\Administrator\Desktop\pdftoppm>pdftoppm4.exe 11.pdf ./
Config Error: No display font for 'Symbol'
Config Error: No display font for 'ZapfDingbats'
Syntax Error: Unknown character collection 'Adobe-GB1'
Syntax Error: Couldn't find 'GBK2K-H' CMap file for 'Adobe-GB1' collection
Syntax Error: Unknown CMap 'GBK2K-H' for character collection 'Adobe-GB1'
Syntax Error: Failed to parse font object for 'SimHei'
Syntax Error: Unknown font tag 'F4'
Syntax Error (277443): No font in show
Syntax Error (277478): No font in show
Syntax Error (277513): No font in show
Syntax Error (277552): No font in show
Syntax Error: Unknown font tag 'F4'
Syntax Error (277610): No font in show
Syntax Error: Unknown font tag 'F4'
Syntax Error (277665): No font in show

② 下载中文包,发现这次格式更诡异了,不过看到里面有个 add-to-xpdfrc瞬间心领神会,觉得添上这个配置应该就行了,事实证明确实如此
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第8张图片

四、xpdfrc 完整配置

大家在运行目录下建个 xpdfrc 文件,然后复制这段配置,再改好路径即可,后面我给出下载地址

fontFile Symbol                ./xpdf-t1fonts/s050000l.pfb
fontFile ZapfDingbats          ./xpdf-t1fonts/d050000l.pfb

#----- begin Chinese Simplified support package (2011-sep-02)
cidToUnicode	Adobe-GB1	./chinese-simplified/Adobe-GB1.cidToUnicode
unicodeMap	ISO-2022-CN	./chinese-simplified/ISO-2022-CN.unicodeMap
unicodeMap	EUC-CN		./xpdf/chinese-simplified/EUC-CN.unicodeMap
unicodeMap	GBK		./chinese-simplified/GBK.unicodeMap
cMapDir		Adobe-GB1	./chinese-simplified/CMap
toUnicodeDir			./chinese-simplified/CMap
#fontFileCC	Adobe-GB1	/usr/..../NotoSansCJKsc-Regular.otf
#----- end Chinese Simplified support package

五、配置示例下载

① 压缩包附带语言包、语言包配置文件、官网下载的原文件,解压后可直接运行
解决Windows下xpdf转换中文pdf时报错字库缺失问题 - 图文教程_第9张图片
② 下载地址
https://download.csdn.net/download/zhichaosong/11527883

你可能感兴趣的:(Windows)