晋文子上

PDF技术（四）-Java实现Html转PDF文件

html转换为pdf的关键技术是如何处理网页中复杂的css样式、以及中文乱码处理。

各实现对比表

于Windows平台进行测试：

		基于IText	基于FlyingSaucer	基于WKHtmlToPdf	基于pd4ml
跨平台性		跨平台	跨平台	跨平台	跨平台
是否安装软件		否	否	需安装WKHtmlToPdf	否
是否收费		免费	免费	免费	收费
转换Html	效率	速度快	未测	速度慢。相比URL来说，效率较慢。能忽略一些html语法或资源是否存在问题。	速度快。部分CSS样式不支持。
转换Html	效果	存在样式失真问题。对html语法有一定要求	存在样式失真问题。对html语法有较高要求。	失真情况较小大部分网页能按Chome浏览器显示的页面转	部分CSS样式有问题。
转换URL	效率	未测	未测	效率不是特别高	未测
转换URL	效果	未测	未测	部分网页由于其限制，或将出现html网页不完整。	未测
优点		不需安装软件、转换速度快	不需安装软件、转换速度快	生成PDF质量高	不需要安装软件、转换速度快
缺点		对html标签严格，少一个结束标签就会报错；服务器需要安装字体	对html标签严格，少一个结束标签就会报错；服务器需要安装字体	需要安装软件、时间效率不高	对部分CSS样式不支持。
评价

综合：使用WKHtmlToPdf效果（样式）最好。但速度较慢（对于文件来说）。其余均有大大小小的失真问题。

	分页	图片	表格	链接	中文	特殊字符	整体样式	速度
IText	支持	支持	支持	支持	支持	支持	失真问题	快
FlyingSaucer	未知	未知	未知	未知	未知	未知	未知	快
WKHtmlToPdf	支持	支持	支持	支持	支持	支持	很好	慢
pd4ml	支持	支持	支持	支持	支持	支持	失真问题	快

html网页完整转换为pdf，所有的方案均有不足。

itext有时并不能满足需求，不能兼容html的样式，且从html页面导出的图片到pdf中也并不好处理。

Flying Sauser实现html2pdf，纠错能力差，支持多种中文字体（部分样式不能识别），且对html的格式也是十分的严格，如果用一种模版的话用Flying Sauser技术倒是不错的选择，但对于不规则的html导出pdf就并不是那么的适用。

PD4ML实现html2pdf，速度快，纠错能力强可以过滤不规则的html标记，支持多种中文字体，支持css。

WKHtmlToPdf效果最好，但转换速度慢。

1. wkhtmltopdf（速度慢、需要安装软件）

wkhtmltopdf是一个用webkit网页渲染引擎开发的用来将html转成 pdf的工具，可跟多种脚本语言进行集成来转换文档，有windows、linux等平台版本。官网地址 http://wkhtmltopdf.org/

技术特点：

Wkhtmltopdf可直接把浏览器中浏览的网页转换成一个pdf，他是一个把html页面转换成pdf的软件（需要安装在服务器上）。使用时可通过java代码调用cmd指令完成网页转换为pdf的功能。

功能测试：

直接在cmd里输入测试指令，可查看处理进度。

原理：

使用wkhtmltopdf工具对url或html进行转换

使用命令:

Wkhtmltopdf https:baidu.com /usr/local/temp/baidu.pdf

安装

下载地址：https://wkhtmltopdf.org/downloads.html

wkhtmltopdf安装方法

1.解压wkhtmltox.tar到某个文件夹$DIR

2.设置环境变量

vim /etc/profile

在最后一行加 export PATH=$DIR/wkhtmltox/bin:$PATH 保存退出、

source /etc/profile

3.运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libXrender.so.1: cannot open shared object file: No such file or directory这个错，请运行 apt-get/yum install libXrender*

运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libfontconfig.so.1: cannot open shared object file: No such file or directory这个错，请运行apt-get/yum install libfontconfig*

运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libXext.so.6: cannot open shared object file: No such file or directory这个错，请运行 apt-get/yum install libXext*

运行 wkhtmltopdf

yum install xorg-x11-fonts-75dpi.noarch

yum install xorg-x11-fonts-Type1.noarch

yum install icu.x86_64

yum install libjpeg

yum install libpng

优点：

支持中文、图片、CSS等

缺点：

有时对于html文件的转化可能比较慢，对于url的转化速度较快。存在失真情况

具体实现：

Java调用命令。

public class HtmlToPdf {

    // wkhtmltopdf在系统中的路径
    private static String toPdfTool = Consts.WEB.CONVERSION_PLUGSTOOL_PATH_WINDOW;

    /**
     * html转pdf
     *
     * @param srcPath
     *            html路径，可以是硬盘上的路径，也可以是网络路径
     * @param destPath
     *            pdf保存路径
     * @return 转换成功返回true
     */
    public static boolean convert(String srcPath, String destPath) {
        File file = new File(destPath);
        File parent = file.getParentFile();
        // 如果pdf保存路径不存在，则创建路径
        if (!parent.exists()) {
            parent.mkdirs();
        }
        StringBuilder cmd = new StringBuilder();
        if (System.getProperty("os.name").indexOf("Windows") == -1) {
            // 非windows 系统
            toPdfTool = Consts.WEB.CONVERSION_PLUGSTOOL_PATH_LINUX;
        }
        cmd.append(toPdfTool);
        cmd.append(" ");
        cmd.append(" \"");
        cmd.append(srcPath);
        cmd.append("\" ");
        cmd.append(" ");
        cmd.append(destPath);

        System.out.println(cmd.toString());
        boolean result = true;
        try {
            Process proc = Runtime.getRuntime().exec(cmd.toString());
            HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
            HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
            error.start();
            output.start();
            proc.waitFor();
        } catch (Exception e) {
            result = false;
            e.printStackTrace();
        }

        return result;
    }

    public static void main(String[] args) {
//        HtmlToPdf.convert("http://www.baidu.com", "F:/pdf/baidu.pdf");
        String filename = "JAVA将图片转换成pdf文件-CSDN博客";
        HtmlToPdf.convert("F:/pdf/"+filename+".html", "F:/pdf/"+filename+".pdf");
//        HtmlToPdf.convert("http://api.gyingyuan.com/", "F:/pdf/"+ UUID.randomUUID().toString()+".pdf");
//        HtmlToPdf.convert("https://www.aliyun.com/jiaocheng/285649.html", "F:/pdf/baidu.pdf");
    }
}

public class HtmlToPdfInterceptor extends Thread {
    private InputStream is;

    public HtmlToPdfInterceptor(InputStream is){
        this.is = is;
    }

    @Override
    public void run(){
        try{
            InputStreamReader isr = new InputStreamReader(is, "utf-8");
            BufferedReader br = new BufferedReader(isr);
            String line = null;
            while ((line = br.readLine()) != null) {
                System.out.println(line.toString()); //输出内容
            }
        }catch (IOException e){
            e.printStackTrace();
        }
    }
}

效果：

URL转换

对于url转会遇到一些网站限制的问题。

https://blog.csdn.net/m0_38138387/article/details/79314260

如果转为html则效率较慢，但能很大程度比较完美地转换

文件转换：速度较慢，失真情况比较小

68.225s

2. PhantomJS（样式有问题，需要安装软件）

PhantomJS是一个基于webkit内核的无头浏览器，即没有UI界面，即它是一个浏览器，只是其内的点击、翻页等人为相关操作需要程序设计实现。它提供javaScript API接口，即通过编写JS程序可以直接与webkit内核交互，在此之上可以结合java语言等，通过java调用js等相关操作，从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。它同时提供windows、linux、mac等不同os的安装使用包，也就是说可以在不同平台上二次开发采集项目或是自动项目测试等工作。官网地址http://phantomjs.org/

PhantomJS可做网页分析，功能很多，本次仅调用网页的截图功能。在cmd中的测试如下：

URL转

测试效果并没有wkhtmltopdf好。

html2pdf.js

var page = require('webpage').create();
var system = require('system');
 
////读取命令行参数，也就是js文件路径。
if (system.args.length === 1) {
  console.log('Usage: loadspeed.js ');
//这行代码很重要。凡是结束必须调用。否则phantomjs不会停止
  phantom.exit();
}
page.settings.loadImages = true;  //加载图片
page.settings.resourceTimeout = 30000;//超过10秒放弃加载
//截图设置，
//page.viewportSize = {
//  width: 1000,
//  height: 3000
//};
var address = system.args[1];
page.open(address, function(status) {
	
	function checkReadyState() {//等待加载完成将页面生成pdf
        setTimeout(function () {
            var readyState = page.evaluate(function () {
                return document.readyState;
            });
 
            if ("complete" === readyState) {
                
				page.paperSize = { width:'297mm',height:'500mm',orientation: 'portrait',border: '1cm' };
				var timestamp = Date.parse(new Date());
				var pdfname = 'HT_'+timestamp + Math.floor(Math.random()*1000000);
				var outpathstr = "E:/POMFiles/HTPDF/"+pdfname+".pdf";
				page.render(outpathstr);
				//page.render("c://test.png");
				//console.log就是传输回去的内容。
				console.log("生成成功");
				console.log("$"+outpathstr+"$");
				phantom.exit(); 
				
            } else {
                checkReadyState();
            }
        },1000);
    }
    checkReadyState();
});

PhantomJS对bootstap的样式支持较好。对css3的新特性如圆形图片样式支持行不好。部分页面样式会失效。对于echart图表展示,也可直接导出

3. IText(技术老旧，对样式不支持)

iText是一个第三方报表java插件，可以在后端利用java随意生成、转化pdf文件，提供了很多api，比较灵活

IText实现html2pdf，速度快，纠错能力差，支持中文（要求HTML使用unicode编码），但中支持一种中文字体，开源。

原理：

使用IText将HTML文件转化为PDF文件

优点：

速度快，支持中文（要求HTML使用unicode编码）、开源

缺点：

纠错能力差，

对CSS样式支持不是很好。

失真情况可能比较大

具体实现：


    org.eclipse.birt.runtime.3_7_1
    com.lowagie.text
    2.1.7


    org.xhtmlrenderer
    flying-saucer-pdf
    9.0.8


    com.itextpdf
    itextpdf
    5.4.2

Java代码

ITextRenderer renderer = new ITextRenderer();
ITextFontResolver fontResolver = renderer.getFontResolver();
fontResolver.addFont("/Users/hehe/share/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
OutputStream os = new FileOutputStream("/Users/hehe/Desktop/iTextPDF.pdf");
String htmlstr = HttpHandler.sendGet("http://localhost:10086/test/iTextPDF.html");//HttpHandler.sendGet只是单纯获得指定网页的html字符串内容
renderer.setDocumentFromString(htmlstr);
renderer.layout();
renderer.createPDF(os);

以上只是简单利用html字符串来生成pdf，需要注意的是：
1、如果页面中有中文，服务器端需要下载字体库simsun.ttc，在后台进行引用，同时在页面的样式中加入对应字体的定义，如：body{font-family: SimSun;}，否则中文无法渲染（中文处渲染出来的效果是空白）；
2、页面中如果有图片，如果图片引用是绝对路径或者base64则不用考虑，如果是相对路径，需要在后台用renderer.getSharedContext().setBaseURL("图片绝对路径目录");来指定图片路径，否则图片无法渲染。
3、要转化的页面必须是标准的XHTML页面，有一处不符合规范就会报错，小编再试的时候就经常报诸如org.xml.sax.SAXParseException;lineNumber: 24; columnNumber: 6;元素类型 "span" 必须由匹配的结束标记 " 终止"之类的错误，所以如果要用iText来大量爬取网络中的页面的话，还是放弃吧，毕竟网上很多页面都是不标准的~

public class HtmlToPdfUtils {
    /*** 默认中文字体   */
    private static final String FONT = "C:\\Windows\\Fonts\\simhei.ttf";
    public static void htmlToPdf(String sourcePath,String tagetPath) throws IOException {
        htmlToPdf(sourcePath,tagetPath,FONT);
    }
    public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath) throws IOException {
        htmlToPdf(sourcePath,tagetPath,fontPath,PageSize.TABLOID);
    }
    public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath,PageSize pageSize) throws IOException {
        // 默认source路径下装载有css、image、以及html等文件的文件夹
        htmlToPdf(sourcePath,tagetPath,fontPath,pageSize,FileUtils.GetFilePath(sourcePath));
    }
    public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath,PageSize pageSize,String baseuri) throws IOException {
        PdfWriter writer = new PdfWriter(tagetPath);
        PdfDocument pdf = new PdfDocument(writer);

        pdf.setTagged();
        // 设置pdf页面大小
        pdf.setDefaultPageSize(pageSize); 
        ConverterProperties properties = new ConverterProperties();
        FontProvider fontProvider = new DefaultFontProvider();
        // 字体
        FontProgram fontProgram = FontProgramFactory.createFont(fontPath);
        fontProvider.addFont(fontProgram);
        properties.setFontProvider(fontProvider); 
        //properties.setBaseUri(html);
        properties.setBaseUri(baseuri); 
        MediaDeviceDescription mediaDeviceDescription = new MediaDeviceDescription(MediaType.SCREEN);
        mediaDeviceDescription.setWidth(pageSize.getWidth());
        properties.setMediaDeviceDescription(mediaDeviceDescription); 
        // 转化
        convertToPdf(sourcePath,pdf, properties);
    }

    private static void convertToPdf(String sourcePath,PdfDocument pdf,ConverterProperties properties ) throws IOException {
        InputStream inputStream = new FileInputStream(sourcePath);
        // 转化
//        HtmlConverter.convertToPdf(new FileInputStream(sourcePath), pdf, properties);
        HtmlConverter.convertToPdf(inputStream, pdf, properties);
        inputStream.close();
    }
    public static void main(String[] args) throws IOException {
        htmlToPdf("F:\\pdf\\1.html","F:\\pdf\\est-04.pdf");
    }
}

效果：

Converting HTML to PDF _ iText Developers.html

消耗时间：3660

CSS样式丢失：

JAVA 将图片转换成pdf文件 - CSDN博客.html

消耗时间：7609

样式同样丢失问题

itext html转pdf布局问题_百度搜索.html

消耗时间：5485

4. Flying Sauser(技术老旧，对样式不支持)

Flying Sauser实现html2pdf，纠错能力差，支持中文、支持简单的页面和样式，开源

对html代码要求很严格。极易出现中文乱码问题

优点：

支持多种中文字体（部分样式不能识别），开源

缺点：

纠错能力差，对CSS支持不是很好。当页面内容较长时，处理时间慢

具体实现：

public class Html2Pdf {
    /**
     * HTML代码转PDF文档
     *
     * @param content 待转换的HTML代码
     * @param storagePath 保存为PDF文件的路径
     */
    public static void parsePdf(String content, String storagePath) {
        FileOutputStream os = null;
        try {
            File file = new File(storagePath);
            if(!file.exists()) {
                file.createNewFile();
            }
            os = new FileOutputStream(file);

            ITextRenderer renderer = new ITextRenderer();
//解决中文支持问题
//            ITextFontResolver resolver = renderer.getFontResolver();
//            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
//            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
            renderer.setDocumentFromString(content);
// 解决图片的相对路径问题,图片路径必须以file开头
// renderer.getSharedContext().setBaseURL("file:/");
            renderer.layout();
            renderer.createPDF(os);

        } catch (DocumentException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }finally {
            if(null != os) {
                try {
                    os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
    }

    /**
     * 对Html要求特别严格
     * @param args
     * @throws IOException
     */
    public static void main(String[] args) throws IOException {
        String htmlFilePath = "";
        htmlFilePath = "F:/pdf/IText实现对PDF文档属性的基本设置 - 半亩池光 - 博客园.html";
        StringBuilder content = new StringBuilder();
        BufferedInputStream in;
        byte[] bys = new byte[1024];
        int len;
        in = new BufferedInputStream(new FileInputStream(htmlFilePath));
        while ((len = in.read(bys)) != -1) {
            content.append(new String(bys, 0, len));
        }
        String html = closeHTML(content.toString());
        html = html.replace(" "," ");

        parsePdf(html,"F:/pdf/wahaha.pdf");

    }

    public static String closeHTML(String str){
        List arrTags = new ArrayList();
        arrTags.add("br");
        arrTags.add("hr");
        arrTags.add("link");
        arrTags.add("meta");
        arrTags.add("img");
        arrTags.add("input");
        for(int i=0;i=0){
                    int tagEnd = str.indexOf(">",tagStart);
                    j = tagEnd;
                    String preCloseTag = str.substring(tagEnd-1,tagEnd);
                    if(!"/".equals(preCloseTag)){
                        String preStr = str.substring(0,tagEnd);
                        String afterStr = str.substring(tagEnd);
                        str = preStr + "/" + afterStr;
                    }
                }else{
                    break;
                }
            }
        }
        return str;
    }

}

5. PD4ML（样式有问题）

PD4ML是纯Java的类库，使用HTML、CSS作为页面布局和内容定义格式来生成PDF文档的强大工具，可以简化最终用户生成PDF的工作。参考网站：http://www.pd4ml.com

优点：

支持中文、对html代码不严格、速度较快

支持的HTML标签、CSS属性较全，转换失真比较小，可以使用HTML+CSS实现精确的布局控制。

对网页文件标签、CSS语法错误的容错性比较好。

对不用额外的控制，就支持图片的转化输出。

缺点：

存在样式失真问题，CSS支持较不好。

不开源，最新的demo版本，下载测试以后，发现不支持中文转换。必须购买商业版本才可以。（这里很坑，测试乱码问题通不过，后面发现是本来就不支持）。

破解后的一些旧版本可以解决乱码问题，但是支持的css样式没有新版本的全。

具体实现：

public class HtmlToPDFUtil {
	public static void main(String[] args) throws Exception {
		//HtmlToPDFUtil htmlToPDFUtil = new HtmlToPDFUtil();
		HtmlToPDFUtil.generatePDF_2(new File("F:\\pdf/demo_ch_pd4ml.pdf"),
				"F:\\pdf/flying saucer 使用中的一些问题 (java导出pdf) - 真的勇士，敢于直面这扯淡的人生 - ITeye博客.htm");

		//File pdfFile = new File("D:/Test/test3.pdf");
//		String pdfPath = "D:/Test1/mmt";
//
//		File file = new File(pdfPath);
//		if (!file.exists()) {
//			file.mkdirs();
//		}
//		String pdfName = "aa.pdf";
//		File pdfFile = new File(pdfPath+File.separator+pdfName);
//		StringBuffer html = new StringBuffer();
//		html.append("")
//				.append("")
//				.append("")
//				.append("").append("")
//				//.append("")
//				.append("")
//				.append("显示中文aaaaaaaaaa")
//				.append("").append("");
//		StringReader strReader = new StringReader(html.toString());
//		HtmlToPDFUtil.generatePDF_1(pdfFile, strReader);

	}

	// 手动构造HTML代码
	public static void generatePDF_1(File outputPDFFile, StringReader strReader)
			throws Exception {
		FileOutputStream fos = new FileOutputStream(outputPDFFile);
		PD4ML pd4ml = new PD4ML();
		pd4ml.setPageInsets(new Insets(20, 10, 10, 10));
		pd4ml.setHtmlWidth(950);
		pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));
		pd4ml.useTTF("java:fonts", true);		
		//pd4ml.setDefaultTTFs("KaiTi_GB2312", "KaiTi_GB2312", "KaiTi_GB2312");
		pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");
		pd4ml.enableDebugInfo();
		pd4ml.render(strReader, fos);
	}

	// HTML代码来自于HTML文件
	public static void generatePDF_2(File outputPDFFile, String inputHTMLFileName)
			throws Exception {
		FileOutputStream fos = new FileOutputStream(outputPDFFile);
		PD4ML pd4ml = new PD4ML();
		pd4ml.setPageInsets(new Insets(20, 10, 10, 10));
		pd4ml.setHtmlWidth(950);
		pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));

		pd4ml.useTTF("java:fonts", true);
		pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");
		pd4ml.enableDebugInfo();
		pd4ml.render("file:" + inputHTMLFileName, fos);
	}

}

pd4browser和pd4fonts是生成的

乱码解决方案：
https://blog.csdn.net/u014769730/article/details/54375836

测试结果：

对CSS有一定的要求

部分Html能支持：

6. Sferyx：（样式有问题）

官网：https://www.sferyx.com/pdfgenerator/html-to-pdf-java.htm

支持URL、支持文件。支持中文，对html文件几乎无要求。样式不佳，中文字体支持不佳。

具体实现

引入Java包：PDFGenerator.jar

代码：

        PDFGenerator pdfGenerator=new PDFGenerator();
        pdfGenerator.setMarginsForStandardPageFormat (10,10,10,10);
//        pdfGenerator.setCharset ("utf-8");
        pdfGenerator.setCharset("ISO-10646-UCS-2");
//        pdfGenerator.generatePDFFromURL ("https://blog.csdn.net/gisboygogogo/article/details/77601308",
        pdfGenerator.generatePDFFromURL ("F:\\pdf\\1.html",
                "F:\\pdf/pdfgenerator-test1.pdf",
                "A4", "Portrait");

样式问题：

7. jPDFWriter（样式有问题、对html文件支持不好）

具体实现：

//        URL url = new URL("https://www.baidu.com/");
//        PageFormat pf = new PageFormat();
//        PDFDocument pdfDoc = PDFDocument.loadHTML (url, pf, true);
//        pdfDoc.saveDocument ("F:\\pdf\\output.pdf");
        File f1 = new File ("F:\\pdf\\1.html");
        PDFDocument pdfDoc = PDFDocument.loadHTML(f1.toURI().toURL(), new PageFormat (), false);
        pdfDoc.saveDocument ("F:\\pdf\\output.pdf");

效果：

并不是很好，虽然支持中文

其他未知方案。。。。。。。。。。

在线转换方案：

仅支持URL，但能很好地转换，效果较好，速度较快。但收费，且为第三方服务，或有信息安全性问题。

如果不考虑html文件安全性的话，可以考虑。

以转CSDN及百度搜索网页为测试例。

1. restpack

官网：https://restpack.io/

能很好保持样式，且支持中文，速度快。价格相比较优惠。

测试效果：

实现方法：

HttpResponse response = Unirest.post("https://restpack.io/api/html2pdf/v5/convert")
  .header("x-access-token", "TOKEN")
  .body("url=http%3A%2F%2Fgoogle.com&json=true")
  .asString();

2. pdfshift

官网：https://pdfshift.io

能很好保持样式，且支持中文，速度快。价格相比较优惠。

测试效果：

实现方法：

String encoding = Base64.getEncoder().encodeToString("YOUR_API_KEY:".getBytes());
HttpPost httppost = new HttpPost("https://api.pdfshift.io/v2/convert/");
httppost.setHeader("Authorization", "Basic " + encoding);
httppost.setHeader("Content-type", "application/json");

HttpEntity postingString = new StringEntity("{\"source\":\"https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=PhantomJS%20html%E8%BD%ACpdf&oq=PhantomJS&rsv_pq=c942451400041f65&rsv_t=3566cYExdLkZv6pJRhDXeda3WgHs37R3GASuPvnEGrOmBl9Lur2EMGyfdF8&rqlang=cn&rsv_enter=1&rsv_sug3=15&rsv_sug1=4&rsv_sug7=100&rsv_sug2=0&inputT=6104&rsv_sug4=6105\",\"landscape\":false,\"use_print\":false}");
httppost.setEntity(postingString);

CloseableHttpClient client = HttpClients.createDefault();
try (CloseableHttpResponse response = client.execute(httppost)) {
    HttpEntity entity = response.getEntity();
    // Use the entity
}

3.其他（不考虑的方案）

1. pdfmyurl（网站反应慢）

官网：http://pdfmyurl.com/

转化效率极低，速度极其慢

2. pdflayer（不支持中文）

官网：https://pdflayer.com/

不支持中文。虽然能很好保持样式。

个人总结：

到现在未知并为找到完美的方案。各种方案都有缺点，但是在线转换的方案转化效率以及对CSS等支持程度比较好。也不知道他们这些内部是如何实现的。

参考链接：

http://blog.csdn.net/ouyhong123/article/details/26401967

http://blog.csdn.net/tengdazhang770960436/article/details/41320079

http://www.cnblogs.com/jasondan/p/4108263.html

http://blog.csdn.net/accountwcx/article/details/46785437

http://blog.csdn.net/zdtwyjp/article/details/5769353

免费开源 PDFsam Basic 一键搞定合并拆分旋转等 8 大 PDF 基础操作阿文软件园开源软件 windows 电脑
各位办公小能手们！今天给大家介绍一款超厉害的免费开源多功能PDF处理工具——PDFsamBasic，它主要就是为咱这些有基础PDF文档编辑需求的人准备的。先说说它的核心功能哈。第一个是PDF合并，能把好几个PDF文件合成一个，你还能选合并全部或者指定页面范围，像“1-10,14,25-”这种都没问题，书签、表单合并这些细节它也能处理得明明白白。第二个是PDF拆分，可以按页码、文件大小、书签级别来拆
如何提高工作技能,以及往什么方向提高,也许面试官会告诉你 sexy_cyber
面试官问啥,钻研啥,通常面试官都会在一条线上逐渐深挖,一直问到最底层,来试探你的技术深度,算不算资深
JAVA无人系统台球室源码自助开台约球交友系统源码小程序
全域无人化运营革命：JAVA无人系统台球室源码解析（支持茶室/棋牌/KTV多业态）在共享经济与无人化浪潮的推动下，全球自助娱乐市场规模突破千亿美元，传统台球室、棋牌室面临人力成本高、运营效率低、用户粘性弱等痛点。JAVA无人系统台球室源码以SpringBoot+MyBatisPlus+MySQL为核心技术栈，通过Uni-app跨端开发实现小程序/H5/APP全渠道覆盖，集成AI裁判、社交裂变、多支
PDF 拆分合并PDFSam：开源免费多文件合并 + 按页码拆分本地处理文哥工具箱1 电脑开源软件软件构建
各位打工人和学生党们，你知道吗，处理PDF文件简直是咱们的日常噩梦啊，尤其是遇到要合并好几个文件，或者从中抠几页出来的时候，简直头大如斗！今天给你们安利一个神仙工具，PDFSam，听我的，不好用你回来打我（开玩笑的啦）！这家伙可是开源免费的，完全不用你掏一分钱，软件下载地址安装包它能干嘛呢，可太多了！你想把好几个PDF拧成一股绳？没问题，合并功能分分钟搞定。想把一个大PDF拆成小的？也行！按页码拆
python爬虫技术——基础知识、实战南瓜AI python 爬虫 scrapy
参考文献：Python爬虫入门(一)（适合初学者）-CSDN博客一、常用爬虫工具包Scrapy语言:Python特点:高效、灵活的爬虫框架，适合大型爬虫项目。BeautifulSoup语言:Python特点:用于解析HTML和XML，简单易用。Selenium语言:Python/Java/C#特点:支持浏览器自动化，适合处理JavaScript渲染的网页。Requests语言:Python特点:简
软考“平替“——工信部信创证书来了！现在考超容易！ PMP项目管理人工智能系统架构 IT 信创工信部软考职场和发展
很多IT行业的宝子都知道软考证书的含金量，但是软考高项的难度也不低，不少人都需要二战三战，但是现在“平替”信创证书来了，难度降级，含金量不变！现在考超容易，新证书出台的前面几次考试，宽松到套模板就能拿分！一、什么是信创？信创即信息技术应用创新，其本质是打破西方技术垄断的「数字新基建」，而由工信部教育与考试中心直接颁发的信创证书，已成为衡量数字化人才硬实力的「国标认证」。这也表明，被写入「十四五」规
有源电力滤波器matlab仿真实验报告,基于Matlab有源电力滤波器APF的仿真研究
目前，对有源电力滤波器的研究越来越广泛。一方面，研究者众多，不仅有高等院校、研究所，而且也有许多电力局、大型企业等；另一方面，研究涉及谐波检测方法、控制策略、PWM波的形成等有源滤波技术的各个方面，对谐波检测控制方法和谐波检测电路的实现方法研究尤其活跃，出现了许多新的方法，这些方法都是旨在提高谐波检测的实时性和检测精度，因为谐波检测方法及谐波检测电路的实时性和检测精度对有源电力滤波器的滤波性能起着
matlab达林算法的电加热炉温度控制,基于单片机的电加热炉温度控制算法与仿真研究[1]...
收稿日期：2011－11作者简介：张宇驰(1978—)，男，硕士，讲师，研究方向为自动控制与机电一体化。基于单片机的电加热炉温度控制算法与仿真研究张宇驰(湖南工业职业技术学院，湖南长沙410208)摘要：介绍几种基于单片机的电加热炉温度控制算法，通过对PID控制算法仿真、SMITH控制算法仿真、大林算法仿真的比较分析，仿真结果验证了大林控制算法的稳定性和鲁棒性较好，几乎没有超调量，且稳态误差小。关
金属表面划痕检测实践指南 - 使用OpenCV IYA1738
本文还有配套的精品资源，点击获取简介：在机器视觉领域，表面划痕检测是一项关键技术，特别是在金属表面。本文深入探索了如何使用OpenCV库在VisualStudio2019环境下进行表面划痕检测。主要技术包括图像作差、动态阈值处理、边缘检测以及形态学操作。通过这些方法，我们可以有效地从金属表面图像中提取划痕特征。本文详细描述了实施表面划痕检测的步骤，包括图像读取、差分图像计算、阈值处理、边缘检测优化
5D_PDF_Creator：便捷高效的PDF打印机软件安装指南 CeLaMbDa
本文还有配套的精品资源，点击获取简介：PDF打印机是一种虚拟工具，通过模拟打印过程将各种文件格式转换为PDF。本文介绍的5D_PDF_Creator旨在为用户提供一种高效的PDF文件生成方案，无需水印，支持多种文档格式转换。本文详述了安装该软件的步骤、特点及应用场景，如电子书制作、文档隐私保护、便于协作和无损保存等。1.PDF打印机定义及应用背景1.1PDF打印机的基本概念PDF打印机是一种虚拟打
前端转后端学习路线整理
一、背景本人是一名Web前端开发，技术栈是Vue和React，不会Node。之前学过，但是因为一些原因（比如没有使用场景，很多概念无法理解，学完就忘等）一直也没有掌握。因为在CMS部门耳濡目染时间久了，感觉不学点后端有点说不过去，而且学起来之后发现也挺有兴趣的。但是对于一名前端开发（而且在学校的时候基本没学习）来说要学习的内容实在太多了，开始的困难在于理清各种技术都是干什么的以及它们之间的关系。现
GIMP 3.0 中文版下载与安装全指南，附软件下载链接
GIMP（GNUImageManipulationProgram）作为开源图像处理领域的标杆工具，其3.0版本在技术架构上实现了多项突破：界面与性能升级基于GTK3重构的UI支持高分辨率屏幕，SVG图标体系带来更现代的视觉体验；引入多线程渲染与SIMD指令集加速，滤镜处理效率提升300%+非破坏性编辑机制通过图层版本控制与历史状态隔离，实现图像修改与原始数据的分离，这一特性对专业设计流程至关重要跨
某银行基于容器负载均衡信创替代，实现完整全自动对外服务暴露的流水线实践
一、背景介绍外部硬件负载均衡作为容器业务统一入口的架构模式已在我行运行3年之久，通过长时间的容器云平台使用经验与负载均衡运维经验积累，在我行容器云环境形成一套特有的负载均衡适配模型，现部署模式下实现了应用上线人员以自服务的形式将容器服务对外暴露。根据2022年1月银保监会办发[2022]2号中关于科技能力建设的指导意见，坚持关键技术自主可控原则，降低外部依赖、避免单一依赖。为配合推进指导意见，同时
程序员的一生：代码、挑战与无限可能 Jay_MIng 开发语言 php linux 运维 nginx java python
程序员的职业生涯呈现出鲜明的阶段性特征，每个阶段都面临不同的挑战与机遇：成长期（22-30岁）：黄金学习期。在这个阶段中的你身体机能处于巅峰，自由时间也充沛，你大多是一个人，没有太多的压力，核心任务是构建技术根基。从学校的书本知识到企业级开发实战的跨越在此阶段完成，需掌握团队协作、版本控制、代码测试等工程化能力。黄金期（30-45岁）：上有老下有小的负重攀登期。技术能力达到高峰，却面临家庭责任挤压
对象的本质：OOP编程核心揭秘止观止计算机科学 OOP 面对对象编程
引言面向对象编程（OOP）革命性地重塑了软件开发，其核心在于“对象”——一种模拟现实实体的计算模型。对象不仅是数据容器，更是封装了状态和行为的自治单元，使程序从指令序列转变为交互网络。通过本解析，我们将层层递进，揭示对象在OOP中的根本角色：从定义延伸到设计实践，帮助读者跨越语言差异（如Java、Python或C++），掌握这一范式的精髓。章节构建遵循技术演进：先解剖对象本质，再关联OOP支柱，最
一文讲透HTML语义化标签
文章目录语义化标签概述HTML标签及其含义常见HTML5语义化标签语义化标签对搜索引擎（SEO）的影响提升搜索引擎排名增强可访问性改善用户体验语义化标签案例各标签作用说明语义化标签概述HTML语义化是指使用恰当的标签来准确表达内容的结构和含义，使网页不仅对人类开发者可读，也能被搜索引擎、辅助技术等更好地理解和处理。例如，用表示页眉，表示独立内容区块，提升页面可访问性和SEO效果。HTML标签及其含
web前端入门到实战：CSS实现8种炫酷按钮大前端世界
今天给大家分享8种炫酷按钮的CSS实现。1.3D按钮1现在的主流是扁平化的设计，拟物化的设计比较少见了，所以我们仅从技术角度去分析如何实现这个3D按钮该按钮的立体效果主要由按钮多出的左、下两个侧面衬托出来，我们可以使用box-shadow模拟出这两个侧面：HTML：3DButton1CSS:.button-3d-1{position:relative;background:orangered;bo
如何区别HTML和HTML5？代码的余温 html html5 前端
要区分HTML（通常指HTML4及更早版本）和HTML5，主要可以从以下关键方面进行比较：一、文档声明区别二、语义化标签对比用途HTML4标签HTML5新标签头部区域导航栏内容区块独立文章侧边栏页脚主要内容区✅HTML5通过语义化标签取代了泛滥的，提升可读性和SEO三、多媒体支持差异四、图形技术演进constctx=document.getElementById('myCanvas').getCo
AI人工智能领域多模态大模型的发展历程回顾 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
AI人工智能领域多模态大模型的发展历程回顾关键词：AI人工智能、多模态大模型、发展历程、技术演变、应用场景摘要：本文旨在全面回顾AI人工智能领域多模态大模型的发展历程。通过对不同阶段核心概念、算法原理、数学模型等方面的深入剖析，结合实际项目案例，探讨其在各个领域的应用场景。同时，推荐相关的学习资源、开发工具和重要论文著作，最后总结多模态大模型的未来发展趋势与挑战，并对常见问题进行解答。1.背景介绍
分布式操作系统 - 1.分布式系统概论 IT斜杆青年分布式操作系统分布式网络
文章目录1.概念和特点1.1概念1.2需解决问题1.3中间件1.4分布式系统特点2.设计目标2.1支持资源共享2.2透明性2.3开放性（1）OpenSystem（2）特点2.4可伸缩性（1）规模可伸缩性（2）地理位置可伸缩性（3）管理可伸缩性（4）实现可伸缩性采用的技术减少通信延迟将服务分割并分布化部署副本（replication）与缓存（caching）（5）易犯错误2.5高性能3.类型3.1高
游卡，快手，蓝禾26届秋招/提前批/实习内推 u010022905 算法 c语言前端关卡设计游戏美术
游卡，快手，蓝禾26届秋招/提前批/实习内推①游戏大厂-游卡26秋招内推【岗位】产品策划，发型运营，程序技术，美术表现，职能综合【一键内推】https://app.mokahr.com/m/campus_apply/yokagames/41940?recommendCode=DS5y8jth&hash=%23%2Fjobs#/jobs【内推码】DS5y8jth①快手2026届快STAR-X提前批校
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
Rock Robotic-无人机测绘 moonsims 人工智能
RockRobotic-无人机测绘RockRobotic公司简介RockRobotic是一家总部位于美国的无人机测绘技术公司，专注于：高精度LiDAR载荷系统一体化三维测绘解决方案云端数据处理平台（RockCloud）公司定位于“LiDAR即服务”，为工程师、测绘师提供即插即用的硬件+简单易用的软件服务。目标用户群：土地测绘公司、电力巡检、地籍建模、林业资源单位等。RockRobotic产品发展历
Specim推出便携式高光谱相机：可检测假冒艺术品和犯罪现场血迹 ggtdfgfdg 数码相机
芬兰specim高光谱相机高光谱(Hyperspectral)相机可以见到人类肉眼不能直接看到的内容，甚至可以分析物体的成分。只是这类设备通常又大又笨重，因此大多只能放在实验室用用。好消息是，芬兰VTT技术研究中心剥离出来的SpecimOy公司，刚刚推出了一款便携式的高光谱相机，它就是SpecimIQ。该相机能够收入可见光和近红外光谱范围内的不同波长，然后对物体表面的反射光成像。SpecimIQ采
计算机专业考研复试全攻略——从笔试到机试，从英语面试到项目答辩的完整解决方案
一、复试备战全景规划1.1复试全流程解析复制初试成绩公布→复试分数线确认→资格审查→专业课笔试→英语能力测试→综合面试→机试（部分院校）→拟录取公示时间管理建议（以3月复试为例）：复制1月：专业课基础复习+英语口语积累2月：强化核心考点+项目经验整理3月：模拟面试训练+热点技术追踪1.2复试评分维度拆解考核模块占比核心考察点专业课笔试40%-50%知识体系完整性、计算思维能力英语面试15%-20%
元宇宙：技术乌托邦与数字化未来——基于技术哲学的分析
一、技术哲学视域下的元宇宙本质哲学源流与技术基因的双重映射理想世界的千年回响：从柏拉图洞穴隐喻中的影子世界，到普特南“钵中之脑”对虚拟与现实界限的消弭，元宇宙的构想深植于人类对平行世界的永恒追问。中国传统神话中“天人二元结构”的意象，与元宇宙虚实融合的特性形成跨时空呼应。技术促逼（Gestell）的现代性批判：海德格尔的“座架理论”揭示，技术作为“促逼”将世界异化为资源储备。元宇宙通过VR/AR、
回顾2022 星空梦想plus 学习轨迹总结
今年的学习可谓是毁誉参半，欠缺的方面就是对未来技术的探索并没有取得预期的成果，拖了许多的进度，但愿者最后这个月，能跟上原本的学习进度。值得肯定的方向呢是对自己未来发展的大胆探索，突破了原有的枷锁桎梏，找到了另一条探索出路，从长远来看，我的这次大胆探索是大有裨益的，对未来相机的技术能更好的，更精准，更稳健的把握住。不单单是对相机技术追求的精益求精，不单是对相机上层，框架层，硬件抽象层，驱动层
送别太医大力稳重
我经常心怀感激，因为和公司最优秀的工程师坐在一个办公室，而且就在邻桌。他对技术有一种罕见的狂热，对每个细节都有偏执狂式的要求。他工作的时候不苟言笑，但聊起天来又语出惊人。他是个旁观者，但喜欢不经意的欣喜。我熟悉他的语气，他讲到什么都慢条斯理，又在无意中流露出自己智识与经验上的优越感。这自信让我敬佩，或许也会导致某种交流无法顺畅进行。他很少承认办公室其他人对自己带来工作上的影响，除去赞扬过我曾经写过
强化学习------DDPG算法 ZPC8210 算法 numpy matplotlib
一、前言DeepDeterministicPolicyGradient(DDPG)算法是DeepMind团队提出的一种专门用于解决连续控制问题的在线式(on-line)深度强化学习算法，它其实本质上借鉴了DeepQ-Network(DQN)算法里面的一些思想。论文和源代码如下：论文：https://arxiv.org/pdf/1509.02971.pdf代码：https://github.com/
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

PDF技术（四）-Java实现Html转PDF文件

各实现对比表

1. wkhtmltopdf（速度慢、需要安装软件）

技术特点：

功能测试：

原理：

使用命令:

安装

优点：

缺点：

具体实现：

效果：

2. PhantomJS（样式有问题，需要安装软件）

html2pdf.js

3. IText(技术老旧，对样式不支持)

原理：

优点：

缺点：

具体实现：

效果：

4. Flying Sauser(技术老旧，对样式不支持)

优点：

缺点：

具体实现：

5. PD4ML（样式有问题）

优点：

缺点：

具体实现：

测试结果：

6. Sferyx：（样式有问题）

具体实现

7. jPDFWriter（样式有问题、对html文件支持不好）

效果：

其他未知方案。。。。。。。。。。

在线转换方案：

1. restpack

测试效果：

实现方法：

2. pdfshift

测试效果：

实现方法：

3.其他（不考虑的方案）

参考链接：

你可能感兴趣的:(PDF技术)