大多数的我们对英文等识别比较好,科室一些繁体的软件又不适合我们。现在我们可以利用office2003
的组件microsoft office Document Imaging可以实现从PDF中任意提取任何页面的文字和图像等功能。
在日常工作学习中,有关的学术论文或学术报告或者课程教材等等都以pdf格式保存,如何把它们转换
成可编辑的JPG图片或者提取相应的重要信息。说说看最简单的提取方法!
打开PDF的文件资料,利用本身的文本提取工具可以完全提取了,但是有的PDF是增加了128位秘钥的,
想要提取是不会那么简单的,即使用软件或者简单复制的时候,出来的效果却是乱码之类的东西。
而且
单纯的用文本工具只能把PDF中的文字提取出来,其他的特效:图片等是无法显示出来的。
如果是报表的数据图呢?如何放到WORD里呢?
所以只有求助office2003的组件microsoft office
Document Imaging的功能了,即使它不是最好的,在ADOBE READER 那有一个“打印机”的图标,进入
后来到如下的画面,在名称那选择“microsoft office Document Imaging”,下面还有设置的打印范
围,可以选择所有的PDF文件或者选择想要提取的页面也可以,或者指定多少页到多少页都是可以实现
的,页面处理功能就是保持页面的大小或者根据你要打印的纸张的大小选择就可以了,页数就是处理后
的页数。
根据需要我最后进行了选择,什么都保持原来的大小和清晰度等,然后我们确认就可以了。之后会出现
“保存”的对话框,注意下面的文件名,可以更改或者改变的,但是下面的保存类型千万不要变,保持
MDI格式就可以了。
之后会出现所预览的页面,也就是你上面选择参数后的结果,这时候的图片和PDF还
是一样的。
Pdf转换成word转换器 http://www.cr173.com/soft/78361.html
pdf转换成word转换器 http://rj.baidu.com/soft/detail/21246.html?ald
Pdf转换成word转换器http://www.ddooo.com/softdown/57707.htm