java实现word转pdf(功能转载)(亲测验证)

转载自​​​​​​​java将Word转换成PDF三种方法

作者https://blog.csdn.net/weixin_38409915 

亲测三种方法

第一种方法新版本word会报错,转换不了,询问了下其他网友同出现问题

第三种方法可以转换,但是编码不一样,我们业务上传的百度文库,百度审核人员反馈的是文件不识别

所以尽量使用第二种,亲测有效,编码大部分都识别

jacob.jar包下载地址 https://download.csdn.net/download/qq_37241221/86404350

需要 window 环境

积分设置的0分,如果以后出现需要积分下载联系我重改下,官方会自动变动积分数

贴上代码避免原帖子以后失效跳转不了

import java.io.File;

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

/**
 * 效果最好的一种方法,但是需要 window 环境,而且速度是最慢的需要安装 msofficeWord 以及 SaveAsPDFandXPS.exe (
 * word 的一个插件,用来把 word 转化为 pdf,可以不用安装,本次未安装测试通过 )
 */
public class WordToPdf {

    private static final int wdFormatPDF = 17; // PDF 格式

    public void wordToPDF(String sfileName, String toFileName) {

        System.out.println("启动 Word...");
        long start = System.currentTimeMillis();
        ActiveXComponent app = null;
        Dispatch doc = null;
        try {
            app = new ActiveXComponent("Word.Application");
            app.setProperty("Visible", new Variant(false));
            Dispatch docs = app.getProperty("Documents").toDispatch();
            doc = Dispatch.call(docs, "Open", sfileName).toDispatch();
            System.out.println("打开文档..." + sfileName);
            System.out.println("转换文档到 PDF..." + toFileName);
            File tofile = new File(toFileName);
            if (tofile.exists()) {
                tofile.delete();
            }
            Dispatch.call(doc, "SaveAs", toFileName, // FileName
                    wdFormatPDF);
            long end = System.currentTimeMillis();
            System.out.println("转换完成..用时:" + (end - start) + "ms.");

        } catch (Exception e) {
            System.out.println("========Error:文档转换失败:" + e.getMessage());
        } finally {
            Dispatch.call(doc, "Close", false);
            System.out.println("关闭文档");
            if (app != null)
                app.invoke("Quit", new Variant[]{});
        }
        // 如果没有这句话,winword.exe进程将不会关闭
        ComThread.Release();
    }

    public static void main(String[] args) {
        WordToPdf d = new WordToPdf();
        d.wordToPDF("E:\\JianBao\\downloadPath\\上海骄成机电设备有限公司企业发展分析报告.docx", "E:\\JianBao\\downloadPath\\上海骄成机电设备有限公司企业发展分析报告.pdf");
    }

}

扩充总结:转换后的pdf是文字型pdf,我们业务是上传到百度文库,但是文库有个确定就是百度官方将手机上浏览器浏览方式默认显示为阅读模式,百度模式分两种,一种是原版一种是阅读,原版好理解就是原先啥样式就是啥样式,阅读模式是为了考虑到使用手机流量的用户节省流量,自动解析将pdf里认为不必要的东西给过滤掉,比如背景图这种,这样非常影响手机浏览器显示样式,但是客户还要全显示,最后没辙只能将文字型pdf转换为图片型pdf,就是用文字pdf全分解截图成图片再合并新的pdf,没办法只能这么搞

你可能感兴趣的:(后端,java)