word转pdf前瞻

        话说现在的一个项目有个附件整理的功能是要求我去开发的,附件归档必须是pdf文件.服务器上相当一部分是word.这样一个word转pdf的功能就要求被做出来了.

经理说自己试过了用openoffice转出来的效果不是很理想,(我么去尝试,网上说的是这个2007版本有点不太有好)。

        1.第一个方案是先在服务器上下载下来,由本地调用win7系统的save as pdf,然后把转好的pdf上传到服务器。

            缺陷:浏览器是不可能在用户不选择文件的情况下帮用户把文件上传,这个方法就不可行了

         2.用java代码直接将word转pdf,参考了WORD转PDF,博主也很友好的回复了我的问题.

            缺陷:2007版本转换和save as pdf几乎一样,页眉页脚都出来了.但是没有图片,没图。   2003的更乱,加点链接什么的简直一塌糊涂.

         3.采用poi,itext   先将word转换成html  再把html转换成pdf

            缺陷:2003版本和2007版本都有一个很严重的问题,中文支持不太友好.于是查找了下原因,是需要添加字体,而且只有一直起作用.我就用正则把html里面所有的字体全部替换了font-family: SimSun;  再在写一个全局的字体  OK  解决.  然后发现中午不能换行,html会工具浏览器的大小或相关的样式换行,但是这个对html转pdf却没任何作用.网上查找了下,是因为英文是用空格作为换行的,然而中午却有问题了.   最致命的是word2007版本转html很多图片都是emf格式.pdf转换之后根本不现实. 问题又来了.emf转png(或者其他常见的gif,jpg) 速度很慢,一张100多k的需要几秒钟.考虑来考虑去还去决定抛弃了.  因为线上很多文档都是正式的合同附件,具有很高的要求.

        

        最后使用libreoffice4.3 在windows上安装后不知为何在我的电脑上不能识别命令,也不报错.

        公司的做基金项目,没网也不能自己安装软件,今天是周末就把好久没有开启的linux虚拟机打开了.N久没有弄linux从安装软件开始,最后还好命令一下子就起作用了,然后写了一个Main方法扔到上面去,敲打几个命令  文件正常的转换出来。

链接: http://pan.baidu.com/s/1bn8pz7D 密码: wwjg

你可能感兴趣的:(杂谈)