你知道PDF转Word或Excel,但未必知道这些

本文没有用所谓的“史上最全”“一网打尽”“最全攻略”“秘籍全搞定”等当标题,但相信你看完以后会对PDF转换这个问题有更清晰的了解,并且找到“实用”的工具及方法,真正提高工作效率

注:阅读本文需有一定电脑知识,全文两千多字,背景介绍和正题约各占一半,小白及找“干货”用户可直接跳到后面正题部分。


 背景介绍:

PDF:Portable Document Format的简称,意为“可移植的/便携文档格式”,Adobe公司设计的文件格式。特点是无论任何操作系统(Windows,Unix还是苹果的Mac OS)、任何打印机上排版格式都不乱。


PDF转Word/Excel工具非常多,但大部分都有各种局限,限页数,限大小,限OCR、加水印,英文版对于中文用户不方便等等,想突破限制就不是免费使用了,况且,绝大部分其实就算付费了也并不能做到完美转换所有格式的文件。


就连专业OCR(光学字符识别,记住这个名词,后面会多次提到)功能强大的ABBYY FineReader也不能实现完美转换所有“图片型”的PDF文件。


请先接受这个事实。


一般来说,对于稍微复杂一点(表格、样式、图形多,使用了特殊内嵌字体)的文件,很多工具软件转换时格式样式会乱了或丢了,如果是重要数据转换错了影响就大了


OCR模式转换的时候,基本99%也会出现乱码等问题。当然,对于非图片型(以下暂且称为“文字数据型”)或相对简单标准的图片型PDF文件,相关实用工具转换还是比较靠谱、十分方便、甚至让你感到相见恨晚的。


简单介绍一下所谓的“文字数据型”和“图片型”PDF文件的区分:

小明用Word做了一份文件通知,通过“另存为/输出为PDF格式”生成了一个PDF文件(一般大公司都使用办公室公文管理软件或OA系统来行文收发,PDF文件加盖电子章方便操作),这个文件可以看做是“文字数据型”PDF文件(虽然电子章一般属于图片型,但是这里的文字层和电子章层是各自分开的,并没有形成一体)。

 图片来源:百度百科图层词条

小明又用Excel做了一份招标工程量清单,通过招投标软件生成了盖章版甚至有水印的PDF文件,和刚才说的通知文件一样,虽然严格来说有图片型印章和水印了,但这两个PDF文件都是通过Word或Excel及相关软件生成的(内部并没有形成一体),再通过相关工具软件转换回Word或Excel就比较容易实现且内容格式比较完美(不需要印章水印转换后也可删除)。

小明很能干,又接到个新任务,甲方通过资料室给我公司送来一份纸版文件,这个文件领导要看,领导正在高铁上呢,小明将纸版文件扫描成图片/PDF文件通过电子邮箱,还是微信吧(领导好像都爱用微信,手机查看方便)发给了领导。


这个文件是通过扫描仪/相机(光学)生成的文件(可理解为所有内容都在同一层面、是一体的),可以称做是“图片型”PDF文件,再想转换回Word或Excel就比较难且内容格式会不完美,需要用到OCR功能模式。


注:用Photoshop等图片处理类软件生成的文件虽然不是通过“光学”、也是电脑软件生成,但其格式属于图片类型标准,再形成的PDF文件属于“图片型”PDF文件。




 介绍完毕,进入正题干货:

A.在线版工具

 https://xpdf.net超级PDF

在PDF转换上如网站的slogan那样“免费,简单,强大”,美中不足是每小时最多6次免费转换,文件有大小限制(对于一般用户也够用了)。

文字型PDF转word网址:

https://xpdf.net/pdf-to-word

图片型PDF转word(OCR)网址:

https://xpdf.net/ocr-pdf-to-word


 https://smallpdf.com/cn

这个网站的功能也不多说了,搜索“PDF转Word”基本都能知道这个网站(还有迅捷PDF转换器、pdfdo等),没有超级PDF之前还挺不错。缺点是服务器在国外,速度稍慢,好像还有文件大小和页数限制,OCR模式不免费等。


反面教材:

 https://www.pdf.cn嗨格式PDF转换工具

在线没有OCR模式,对于“图片型”PDF文件也没有提示,直接给你转换成图片粘贴到Word里,这就叫PDF转Word了??转完不能编辑修改有毛用?宣称“文档转换成功率高,文档转换不改变原本排版,转换成功率高达99%”,这特么赤裸裸的文字游戏忽悠技术小白,不实质转换可不就“不改变原本排版”嘛!嗨格式,真是玩嗨了!差评


B.本地版工具

小明说:上面列出的好像都是在线转换工具,还有各种限制,我的文件比较大(能干Plus),在线上传转换速度慢,而且我的文件非常重要需要保密,担心上传到网站上不安全,有没有不用在线、速度快、功能强、简单点的本地软件?还要完全免费,万一花了钱转换的也不完美出现乱码或错误岂不是不值了。


马上可以告诉你,没有。天下没有免费的午餐,尤其是你还想吃大餐。


但是,但是,不用在线、速度快、功能强、简单点的本地软件是有的,只是不是完全免费。

(关于完全免费话题可以关注微信公众号“野望笔记”与我联系:)


1.下面隆重推出:

万兴科技(股票代码300624.SZ)的“万兴PDF专家”PDFelement

官网:https://www.wondershare.cn 


文件不算大(不到100M),下载安装完一般都能会用,具体操作不多说了,反正小明用该软件把他之前生成的盖章版有水印的招标工程量清单PDF文件又转换成Excel了,删除了盖章及水印,为了验证转换质量,不辞辛苦核对了上千条数据(能干Plus+),竟然全对!直呼相见恨晚。


其实对于通过Word或Excel及相关软件生成的“文字数据型”PDF文件,转换回去是基本功而已。


2.“图片型”PDF文件的转换工具推荐:

ABBYY FineReader

还记得前面说的名词“OCR光学字符识别”吧,其实万兴PDF专家及前文提到的在线超级PDF也有OCR功能,但论OCR专业程度来说,可能ABBYY是“地表最强”战队的。看他们卖那么高的价格就知道了。

这个软件相对大一点,试用版30天,页数限制99页,具体操作也不多说了,小明用该软件把他之前发给领导的扫描版“图片型”PDF文件转成了Word,由于文件页数不多、行文比较标准规范,转换效果又让小明相见恨晚+1


PS:ABBYY FineReader也会有转换识别错误的地方,可自行修改调整一下,整体来说效果是比较不错的(取决于“图片型”文件的清晰及标准程度)。


3.最后是两个官方出场

其实Office 2013版以上的Word也自带PDF转换功能!直接在Word里打开需要转换的PDF文件!


Adobe Acrobat DC(注意不是Adobe reader)文件菜单里也有导出到Word文档、Excel电子表格、PPT演示等功能!(还记得本文一开始介绍的吗?PDF格式是Adobe公司设计的啊) 


具体效果请各位自行试验研究吧,小明请我喝酒去了,不光因为之前的文件转换让他提高了工作效率,还因为他有一些PDF文件是加密了的,转换不了,继续有求于我:)


其实啊,上面提到的网站里就有答案(找找PDF解密:),当然PDF解密也有不用在线、速度快、功能强、简单点的本地软件,感兴趣的同学依然可以关注微信公众号“野望笔记”与我联系:)

你可能感兴趣的:(你知道PDF转Word或Excel,但未必知道这些)