【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码

昨天导师给了新任务,需要我从一份英文书籍里面做450页的PPT出来,今早开工发现,虽然导师给的pdf看起来一点问题没有,但是当我尝试提高效率对pdf先来一波“操作”的时候,却发现,不论我用什么软件什么方法什么导出格式,明明非常清晰的文档出来却全是乱码。

问题

这是原本的pdf文档:
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第1张图片
内容大概就是这些,是一本关于故障诊断系统的外文文献,《Fault-Diagnosis Systems_ An Introduction from Fault Detection to Fault Tolerance》一共466页,当我正想试试新折腾的福昕阅读器高级版的功能时,一开始发现编辑功能啥的也都没问题
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第2张图片
还以为能够通过软件提高效率先导出个word或者ppt文件然后就只关注内容问题就可以了,没成想使用导出功能时,先是卡死到72%,然后输出的文件被自动删除,一开始我只以为是页数太多了所以未响应,
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第3张图片
然后我还试了LightPDF网页版 ,SmallPDF网页版本地版,迅捷 PDF 转换器本地版,officebox本地版以及其他方法,出来的都是一个样,全是乱码,完全不能用,我就想是不是pdf文件本身就有问题,看到网上有说是字体问题的,于是查看了一下pdf的属性
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第4张图片
涉及到几十种特殊字体,场面极其混乱,怪不得没有转换软件能够降伏的了,这里用福昕自带的转换功能对比一下效果:
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第5张图片
体验一下什么叫驴头不对马嘴哈哈。

然后我就想,不然就不转了,就用笨办法要啥复制啥,然后我才发现自己过于年轻
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第6张图片
没错,这是同一段话,惊不惊喜,意不意外,这活根本没法干啊,手敲得到猴年马月了,还不如自己出一本书呢。

软件

终于来到了这里,既然转换软件不好使,那么用OCR总可以吧,毕竟文档本身还是很清晰的,现在的问题就是,怎么样批量OCR然后还能保存下内容最好可以出word文档一类的。

首先考虑到福昕阅读器自带的快速OCR,发现原来的阅读器缺少组件
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第7张图片

解决

先放弃,然后从网上找到了今天的主角:ABBYY FineReader,当然了,这软件近十年版本从11升到了15,本着用新不用旧的原则,我先下了14,装了一遍发现,OCR是好用,但是体验版又戳到了我的痛处:上限100页,我的文献可是有466页。
【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第8张图片
最后只能硬着头皮找,中间浏览了大概有上百个网页,总算是让我找到了r软件的对应版本。

不过都差不多啦,最后也是终于解决了问题,导出了需要的word版本。专业确实是专业,虽然用了十来分钟,但是我电脑本身性能就一般,好在全自动啊。

【ABBYY FineReader】pdf文件很清晰但是复制或导出都是乱码_第9张图片
仅分享方法,希望大家都能高效办公。

你可能感兴趣的:(working)