使用Spire.Office自制一个进行批量格式转换(Pdf转换为Word)的工具
本文文末提供一个可将PDF转换为Word的小工具供下载。
我一直想找一个工具能够把我收集的一些PDF资料转换为Word版。最近偶然发现一个超级强大的工具Spire.Office for .NET可以做到这一点。
而且Spire.Office提供C#、VB的DLL供调用,还提供了丰富简洁的示例项目可供学习。
使用Spire.Office for .NET,开发人员可以创建更为广泛的应用。它使开发人员能够打开,创建,修改,转换,打印,查看微软Word ,Excel,PowerPoint,PDF文档。此外,它允许用户将数据导出到流行的文件,如MS Word / Excel/ RTF /Access,PowerPoint , PDF,XPS , HTML,XML ,Text, CSV , DBF ,Clipboard剪贴板, SYLK等。
作为一个独立的Office .NET组件,Spire.Office不需要在系统上安装微软Office文件,不需要COM组件支持。这也扩大了应用范围。此外,它在安全性,稳定性,可扩展性,速度,价格和功能方面更好的替代微软办公自动化。
你可以到(http://www.e-iceblue.com/)下载Spire.Office。
如下图所示,Spire.Office for .NET支持Word、PDF、XLS、HTML等格式的文档。就是说可以用Spire.Office for .NET创建、加载、修改(增删改查)文档,可以将一种格式的文档转换为另一种格式。于是我找到了把PDF转换为WORD的项目。
你可以在(http://www.e-iceblue.com/)下载最新的Spire.Office。或者留言联系我以获取上图所示的完整Demo项目。如需功能不受限制的DLL,可留言给我。我有一个临时license。
既然现有的Demo已经存在将PDF转换为Word的例子,我只需修改一些参数就能使用了。
首先,搜索找到"ToWord-VS2012"项目,打开之。
其中的代码很简单,如下:
//pdf file String file = @"..\..\..\..\..\..\Data\Sample5.pdf";
//open pdf document PdfDocument doc = new PdfDocument(); doc.LoadFromFile(file);
//convert to doc file. doc.SaveToFile("Sample5.doc", FileFormat.DOC); doc.Close();
//Launching the doc file. System.Diagnostics.Process.Start("Sample5.doc"); |
可见,只需加载一个PDF文件,然后用SaveToFile一个方法即可实现PDF到Word的转换!
下面我们就来制作一个小工具,实现PDF到Word的转换。
PDF to Word的界面很简单,如下图所示。
下面是我的一篇博文的PDF版。我的Word版已经丢失,我想试试用这个PDF to Word重新得到一个Word版。
打开PDF to Word,加载pdf文件,选择要保存到的位置,点击Start,立即就得到了word版文件!
打开看看newWord.doc,如下图所示。
的确是完全复原了Word里的内容。图片、文字、格式、颜色都吻合。虽然有些小地方的样式有些出入,但是很容易就可以改过来了。
Spire.Office还可以把PDF转换为HTML和XPS格式。我扩展了PDF to Word工具,增加了转换为HTML和XPS的功能。
下面是PDF转换为XPS的结果:
您可以在(链接: http://pan.baidu.com/s/1fUzgE 密码: kee6)下载PDF to Word。有任何问题和建议欢迎留言!
如果需要PDF to Word源码,请在本文留言处留言。