来杯特仑苏

PDF技术 -Java实现Html转PDF文件

转载：https://blog.csdn.net/qq_34190023/article/details/82999702

html转换为pdf的关键技术是如何处理网页中复杂的css样式、以及中文乱码处理。

各实现对比表

于Windows平台进行测试：

		基于IText	基于FlyingSaucer	基于WKHtmlToPdf	基于pd4ml
跨平台性		跨平台	跨平台	跨平台	跨平台
是否安装软件		否	否	需安装WKHtmlToPdf	否
是否收费		免费	免费	免费	收费
转换Html	效率	速度快	未测	速度慢。相比URL来说，效率较慢。能忽略一些html语法或资源是否存在问题。	速度快。部分CSS样式不支持。
转换Html	效果	存在样式失真问题。对html语法有一定要求	存在样式失真问题。对html语法有较高要求。	失真情况较小大部分网页能按Chome浏览器显示的页面转	部分CSS样式有问题。
转换URL	效率	未测	未测	效率不是特别高	未测
转换URL	效果	未测	未测	部分网页由于其限制，或将出现html网页不完整。	未测
优点		不需安装软件、转换速度快	不需安装软件、转换速度快	生成PDF质量高	不需要安装软件、转换速度快
缺点		对html标签严格，少一个结束标签就会报错；服务器需要安装字体	对html标签严格，少一个结束标签就会报错；服务器需要安装字体	需要安装软件、时间效率不高	对部分CSS样式不支持。
评价

综合：使用WKHtmlToPdf效果(样式)最好。但速度较慢(对于文件来说)。其余均有大大小小的失真问题。

	分页	图片	表格	链接	中文	特殊字符	整体样式	速度
IText	支持	支持	支持	支持	支持	支持	失真问题	快
FlyingSaucer	未知	未知	未知	未知	未知	未知	未知	快
WKHtmlToPdf	支持	支持	支持	支持	支持	支持	很好	慢
pd4ml	支持	支持	支持	支持	支持	支持	失真问题	快

html网页完整转换为pdf，所有的方案均有不足。

itext有时并不能满足需求，不能兼容html的样式，且从html页面导出的图片到pdf中也并不好处理。

Flying Sauser实现html2pdf，纠错能力差，支持多种中文字体(部分样式不能识别)，且对html的格式也是十分的严格，如果用一种模版的话用Flying Sauser技术倒是不错的选择，但对于不规则的html导出pdf就并不是那么的适用。

PD4ML实现html2pdf，速度快，纠错能力强可以过滤不规则的html标记，支持多种中文字体，支持css。

WKHtmlToPdf效果最好，但转换速度慢。

1. wkhtmltopdf(速度慢、需要安装软件)

wkhtmltopdf是一个用webkit网页渲染引擎开发的用来将html转成 pdf的工具，可跟多种脚本语言进行集成来转换文档，有windows、linux等平台版本。官网地址 http://wkhtmltopdf.org/

技术特点：

Wkhtmltopdf可直接把浏览器中浏览的网页转换成一个pdf，他是一个把html页面转换成pdf的软件(需要安装在服务器上)。使用时可通过java代码调用cmd指令完成网页转换为pdf的功能。

功能测试：

直接在cmd里输入测试指令，可查看处理进度。

原理：

使用wkhtmltopdf工具对url或html进行转换

使用命令:

Wkhtmltopdf https:baidu.com /usr/local/temp/baidu.pdf

安装

下载地址：https://wkhtmltopdf.org/downloads.html

wkhtmltopdf安装方法

1.解压wkhtmltox.tar到某个文件夹$DIR

2.设置环境变量

vim /etc/profile

在最后一行加 export PATH=$DIR/wkhtmltox/bin:$PATH 保存退出、

source /etc/profile

3.运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libXrender.so.1: cannot open shared object file: No such file or directory这个错，请运行 apt-get/yum install libXrender*

运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libfontconfig.so.1: cannot open shared object file: No such file or directory这个错，请运行apt-get/yum install libfontconfig*

运行 wkhtmltopdf 报wkhtmltopdf: error while loading shared libraries: libXext.so.6: cannot open shared object file: No such file or directory这个错，请运行 apt-get/yum install libXext*

运行 wkhtmltopdf

yum install xorg-x11-fonts-75dpi.noarch

yum install xorg-x11-fonts-Type1.noarch

yum install icu.x86_64

yum install libjpeg

yum install libpng

优点：

支持中文、图片、CSS等

缺点：

有时对于html文件的转化可能比较慢，对于url的转化速度较快。存在失真情况

具体实现：

Java调用命令。

 1 public class HtmlToPdf {
 2  
 3     // wkhtmltopdf在系统中的路径
 4     private static String toPdfTool = Consts.WEB.CONVERSION_PLUGSTOOL_PATH_WINDOW;
 5  
 6     /**
 7      * html转pdf
 8      *
 9      * @param srcPath
10      *            html路径，可以是硬盘上的路径，也可以是网络路径
11      * @param destPath
12      *            pdf保存路径
13      * @return 转换成功返回true
14      */
15     public static boolean convert(String srcPath, String destPath) {
16         File file = new File(destPath);
17         File parent = file.getParentFile();
18         // 如果pdf保存路径不存在，则创建路径
19         if (!parent.exists()) {
20             parent.mkdirs();
21         }
22         StringBuilder cmd = new StringBuilder();
23         if (System.getProperty("os.name").indexOf("Windows") == -1) {
24             // 非windows 系统
25             toPdfTool = Consts.WEB.CONVERSION_PLUGSTOOL_PATH_LINUX;
26         }
27         cmd.append(toPdfTool);
28         cmd.append(" ");
29         cmd.append(" \"");
30         cmd.append(srcPath);
31         cmd.append("\" ");
32         cmd.append(" ");
33         cmd.append(destPath);
34  
35         System.out.println(cmd.toString());
36         boolean result = true;
37         try {
38             Process proc = Runtime.getRuntime().exec(cmd.toString());
39             HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
40             HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
41             error.start();
42             output.start();
43             proc.waitFor();
44         } catch (Exception e) {
45             result = false;
46             e.printStackTrace();
47         }
48  
49         return result;
50     }
51  
52     public static void main(String[] args) {
53 //        HtmlToPdf.convert("http://www.baidu.com", "F:/pdf/baidu.pdf");
54         String filename = "JAVA将图片转换成pdf文件-CSDN博客";
55         HtmlToPdf.convert("F:/pdf/"+filename+".html", "F:/pdf/"+filename+".pdf");
56 //        HtmlToPdf.convert("http://api.gyingyuan.com/", "F:/pdf/"+ UUID.randomUUID().toString()+".pdf");
57 //        HtmlToPdf.convert("https://www.aliyun.com/jiaocheng/285649.html", "F:/pdf/baidu.pdf");
58     }
59 }

 1 public class HtmlToPdfInterceptor extends Thread {
 2     private InputStream is;
 3  
 4     public HtmlToPdfInterceptor(InputStream is){
 5         this.is = is;
 6     }
 7  
 8     @Override
 9     public void run(){
10         try{
11             InputStreamReader isr = new InputStreamReader(is, "utf-8");
12             BufferedReader br = new BufferedReader(isr);
13             String line = null;
14             while ((line = br.readLine()) != null) {
15                 System.out.println(line.toString()); //输出内容
16             }
17         }catch (IOException e){
18             e.printStackTrace();
19         }
20     }
21 }

效果：

URL转换

对于url转会遇到一些网站限制的问题。

https://blog.csdn.net/m0_38138387/article/details/79314260

如果转为html则效率较慢，但能很大程度比较完美地转换

文件转换：速度较慢，失真情况比较小

68.225s

2. PhantomJS(样式有问题，需要安装软件)

PhantomJS是一个基于webkit内核的无头浏览器，即没有UI界面，即它是一个浏览器，只是其内的点击、翻页等人为相关操作需要程序设计实现。它提供javaScript API接口，即通过编写JS程序可以直接与webkit内核交互，在此之上可以结合java语言等，通过java调用js等相关操作，从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。它同时提供windows、linux、mac等不同os的安装使用包，也就是说可以在不同平台上二次开发采集项目或是自动项目测试等工作。官网地址http://phantomjs.org/

PhantomJS可做网页分析，功能很多，本次仅调用网页的截图功能。在cmd中的测试如下：

URL转

测试效果并没有wkhtmltopdf好。

html2pdf.js

 1 var page = require('webpage').create();
 2 var system = require('system');
 3  
 4 读取命令行参数，也就是js文件路径。
 5 if (system.args.length === 1) {
 6   console.log('Usage: loadspeed.js ');
 7 //这行代码很重要。凡是结束必须调用。否则phantomjs不会停止
 8   phantom.exit();
 9 }
10 page.settings.loadImages = true;  //加载图片
11 page.settings.resourceTimeout = 30000;//超过10秒放弃加载
12 //截图设置，
13 //page.viewportSize = {
14 //  width: 1000,
15 //  height: 3000
16 //};
17 var address = system.args[1];
18 page.open(address, function(status) {
19     
20     function checkReadyState() {//等待加载完成将页面生成pdf
21         setTimeout(function () {
22             var readyState = page.evaluate(function () {
23                 return document.readyState;
24             });
25  
26             if ("complete" === readyState) {
27                 
28                 page.paperSize = { width:'297mm',height:'500mm',orientation: 'portrait',border: '1cm' };
29                 var timestamp = Date.parse(new Date());
30                 var pdfname = 'HT_'+timestamp + Math.floor(Math.random()*1000000);
31                 var outpathstr = "E:/POMFiles/HTPDF/"+pdfname+".pdf";
32                 page.render(outpathstr);
33                 //page.render("c://test.png");
34                 //console.log就是传输回去的内容。
35                 console.log("生成成功");
36                 console.log("$"+outpathstr+"$");
37                 phantom.exit(); 
38                 
39             } else {
40                 checkReadyState();
41             }
42         },1000);
43     }
44     checkReadyState();
45 });

PhantomJS对bootstap的样式支持较好。对css3的新特性如圆形图片样式支持行不好。部分页面样式会失效。对于echart图表展示,也可直接导出

3. IText(技术老旧，对样式不支持)

iText是一个第三方报表java插件，可以在后端利用java随意生成、转化pdf文件，提供了很多api，比较灵活

IText实现html2pdf，速度快，纠错能力差，支持中文(要求HTML使用unicode编码)，但中支持一种中文字体，开源。

原理：

使用IText将HTML文件转化为PDF文件

优点：

速度快，支持中文(要求HTML使用unicode编码)、开源

缺点：

纠错能力差，

对CSS样式支持不是很好。

失真情况可能比较大

具体实现：


    org.eclipse.birt.runtime.3_7_1
    com.lowagie.text
    2.1.7


    org.xhtmlrenderer
    flying-saucer-pdf
    9.0.8


    com.itextpdf
    itextpdf
    5.4.2

Java代码

1 ITextRenderer renderer = new ITextRenderer();
2 ITextFontResolver fontResolver = renderer.getFontResolver();
3 fontResolver.addFont("/Users/hehe/share/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
4 OutputStream os = new FileOutputStream("/Users/hehe/Desktop/iTextPDF.pdf");
5 String htmlstr = HttpHandler.sendGet("http://localhost:10086/test/iTextPDF.html");//HttpHandler.sendGet只是单纯获得指定网页的html字符串内容
6 renderer.setDocumentFromString(htmlstr);
7 renderer.layout();
8 renderer.createPDF(os);

以上只是简单利用html字符串来生成pdf，需要注意的是：
1、如果页面中有中文，服务器端需要下载字体库simsun.ttc，在后台进行引用，同时在页面的样式中加入对应字体的定义，如：body{font-family: SimSun;}，否则中文无法渲染(中文处渲染出来的效果是空白)；
2、页面中如果有图片，如果图片引用是绝对路径或者base64则不用考虑，如果是相对路径，需要在后台用renderer.getSharedContext().setBaseURL("图片绝对路径目录");来指定图片路径，否则图片无法渲染。
3、要转化的页面必须是标准的XHTML页面，有一处不符合规范就会报错，小编再试的时候就经常报诸如org.xml.sax.SAXParseException;lineNumber: 24; columnNumber: 6;元素类型 "span" 必须由匹配的结束标记 " 终止"之类的错误，所以如果要用iText来大量爬取网络中的页面的话，还是放弃吧，毕竟网上很多页面都是不标准的~

 1 public class HtmlToPdfUtils {
 2     /*** 默认中文字体   */
 3     private static final String FONT = "C:\\Windows\\Fonts\\simhei.ttf";
 4     public static void htmlToPdf(String sourcePath,String tagetPath) throws IOException {
 5         htmlToPdf(sourcePath,tagetPath,FONT);
 6     }
 7     public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath) throws IOException {
 8         htmlToPdf(sourcePath,tagetPath,fontPath,PageSize.TABLOID);
 9     }
10     public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath,PageSize pageSize) throws IOException {
11         // 默认source路径下装载有css、image、以及html等文件的文件夹
12         htmlToPdf(sourcePath,tagetPath,fontPath,pageSize,FileUtils.GetFilePath(sourcePath));
13     }
14     public static void htmlToPdf(String sourcePath,String tagetPath,String fontPath,PageSize pageSize,String baseuri) throws IOException {
15         PdfWriter writer = new PdfWriter(tagetPath);
16         PdfDocument pdf = new PdfDocument(writer);
17  
18         pdf.setTagged();
19         // 设置pdf页面大小
20         pdf.setDefaultPageSize(pageSize); 
21         ConverterProperties properties = new ConverterProperties();
22         FontProvider fontProvider = new DefaultFontProvider();
23         // 字体
24         FontProgram fontProgram = FontProgramFactory.createFont(fontPath);
25         fontProvider.addFont(fontProgram);
26         properties.setFontProvider(fontProvider); 
27         //properties.setBaseUri(html);
28         properties.setBaseUri(baseuri); 
29         MediaDeviceDescription mediaDeviceDescription = new MediaDeviceDescription(MediaType.SCREEN);
30         mediaDeviceDescription.setWidth(pageSize.getWidth());
31         properties.setMediaDeviceDescription(mediaDeviceDescription); 
32         // 转化
33         convertToPdf(sourcePath,pdf, properties);
34     }
35  
36     private static void convertToPdf(String sourcePath,PdfDocument pdf,ConverterProperties properties ) throws IOException {
37         InputStream inputStream = new FileInputStream(sourcePath);
38         // 转化
39 //        HtmlConverter.convertToPdf(new FileInputStream(sourcePath), pdf, properties);
40         HtmlConverter.convertToPdf(inputStream, pdf, properties);
41         inputStream.close();
42     }
43     public static void main(String[] args) throws IOException {
44         htmlToPdf("F:\\pdf\\1.html","F:\\pdf\\est-04.pdf");
45     }
46 }

效果：

Converting HTML to PDF _ iText Developers.html

消耗时间：3660

CSS样式丢失：

JAVA 将图片转换成pdf文件 - CSDN博客.html

消耗时间：7609

样式同样丢失问题

itext html转pdf布局问题_百度搜索.html

消耗时间：5485

4. Flying Sauser(技术老旧，对样式不支持)

Flying Sauser实现html2pdf，纠错能力差，支持中文、支持简单的页面和样式，开源

对html代码要求很严格。极易出现中文乱码问题

优点：

支持多种中文字体(部分样式不能识别)，开源

缺点：

纠错能力差，对CSS支持不是很好。当页面内容较长时，处理时间慢

具体实现：

 1 public class Html2Pdf {
 2     /**
 3      * HTML代码转PDF文档
 4      *
 5      * @param content 待转换的HTML代码
 6      * @param storagePath 保存为PDF文件的路径
 7      */
 8     public static void parsePdf(String content, String storagePath) {
 9         FileOutputStream os = null;
10         try {
11             File file = new File(storagePath);
12             if(!file.exists()) {
13                 file.createNewFile();
14             }
15             os = new FileOutputStream(file);
16  
17             ITextRenderer renderer = new ITextRenderer();
18 //解决中文支持问题
19 //            ITextFontResolver resolver = renderer.getFontResolver();
20 //            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
21 //            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
22             renderer.setDocumentFromString(content);
23 // 解决图片的相对路径问题,图片路径必须以file开头
24 // renderer.getSharedContext().setBaseURL("file:/");
25             renderer.layout();
26             renderer.createPDF(os);
27  
28         } catch (DocumentException e) {
29             e.printStackTrace();
30         } catch (IOException e) {
31             e.printStackTrace();
32         }finally {
33             if(null != os) {
34                 try {
35                     os.close();
36                 } catch (IOException e) {
37                     e.printStackTrace();
38                 }
39             }
40         }
41     }
42  
43     /**
44      * 对Html要求特别严格
45      * @param args
46      * @throws IOException
47      */
48     public static void main(String[] args) throws IOException {
49         String htmlFilePath = "";
50         htmlFilePath = "F:/pdf/IText实现对PDF文档属性的基本设置 - 半亩池光 - 博客园.html";
51         StringBuilder content = new StringBuilder();
52         BufferedInputStream in;
53         byte[] bys = new byte[1024];
54         int len;
55         in = new BufferedInputStream(new FileInputStream(htmlFilePath));
56         while ((len = in.read(bys)) != -1) {
57             content.append(new String(bys, 0, len));
58         }
59         String html = closeHTML(content.toString());
60         html = html.replace(" "," ");
61  
62         parsePdf(html,"F:/pdf/wahaha.pdf");
63  
64     }
65  
66     public static String closeHTML(String str){
67         List arrTags = new ArrayList();
68         arrTags.add("br");
69         arrTags.add("hr");
70         arrTags.add("link");
71         arrTags.add("meta");
72         arrTags.add("img");
73         arrTags.add("input");
74         for(int i=0;i=0){
78                     int tagEnd = str.indexOf(">",tagStart);
79                     j = tagEnd;
80                     String preCloseTag = str.substring(tagEnd-1,tagEnd);
81                     if(!"/".equals(preCloseTag)){
82                         String preStr = str.substring(0,tagEnd);
83                         String afterStr = str.substring(tagEnd);
84                         str = preStr + "/" + afterStr;
85                     }
86                 }else{
87                     break;
88                 }
89             }
90         }
91         return str;
92     }
93  
94 }

5. PD4ML(样式有问题)

PD4ML是纯Java的类库，使用HTML、CSS作为页面布局和内容定义格式来生成PDF文档的强大工具，可以简化最终用户生成PDF的工作。参考网站：http://www.pd4ml.com

优点：

支持中文、对html代码不严格、速度较快

支持的HTML标签、CSS属性较全，转换失真比较小，可以使用HTML+CSS实现精确的布局控制。

对网页文件标签、CSS语法错误的容错性比较好。

对不用额外的控制，就支持图片的转化输出。

缺点：

存在样式失真问题，CSS支持较不好。

不开源，最新的demo版本，下载测试以后，发现不支持中文转换。必须购买商业版本才可以。(这里很坑，测试乱码问题通不过，后面发现是本来就不支持)。

破解后的一些旧版本可以解决乱码问题，但是支持的css样式没有新版本的全。

具体实现：

 1 public class HtmlToPDFUtil {
 2     public static void main(String[] args) throws Exception {
 3         //HtmlToPDFUtil htmlToPDFUtil = new HtmlToPDFUtil();
 4         HtmlToPDFUtil.generatePDF_2(new File("F:\\pdf/demo_ch_pd4ml.pdf"),
 5                 "F:\\pdf/flying saucer 使用中的一些问题 (java导出pdf) - 真的勇士，敢于直面这扯淡的人生 - ITeye博客.htm");
 6  
 7         //File pdfFile = new File("D:/Test/test3.pdf");
 8 //        String pdfPath = "D:/Test1/mmt";
 9 //
10 //        File file = new File(pdfPath);
11 //        if (!file.exists()) {
12 //            file.mkdirs();
13 //        }
14 //        String pdfName = "aa.pdf";
15 //        File pdfFile = new File(pdfPath+File.separator+pdfName);
16 //        StringBuffer html = new StringBuffer();
17 //        html.append("")
18 //                .append("")
19 //                .append("")
20 //                .append("").append("")
21 //                //.append("")
22 //                .append("")
23 //                .append("显示中文aaaaaaaaaa")
24 //                .append("").append("");
25 //        StringReader strReader = new StringReader(html.toString());
26 //        HtmlToPDFUtil.generatePDF_1(pdfFile, strReader);
27  
28     }
29  
30     // 手动构造HTML代码
31     public static void generatePDF_1(File outputPDFFile, StringReader strReader)
32             throws Exception {
33         FileOutputStream fos = new FileOutputStream(outputPDFFile);
34         PD4ML pd4ml = new PD4ML();
35         pd4ml.setPageInsets(new Insets(20, 10, 10, 10));
36         pd4ml.setHtmlWidth(950);
37         pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));
38         pd4ml.useTTF("java:fonts", true);        
39         //pd4ml.setDefaultTTFs("KaiTi_GB2312", "KaiTi_GB2312", "KaiTi_GB2312");
40         pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");
41         pd4ml.enableDebugInfo();
42         pd4ml.render(strReader, fos);
43     }
44  
45     // HTML代码来自于HTML文件
46     public static void generatePDF_2(File outputPDFFile, String inputHTMLFileName)
47             throws Exception {
48         FileOutputStream fos = new FileOutputStream(outputPDFFile);
49         PD4ML pd4ml = new PD4ML();
50         pd4ml.setPageInsets(new Insets(20, 10, 10, 10));
51         pd4ml.setHtmlWidth(950);
52         pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));
53  
54         pd4ml.useTTF("java:fonts", true);
55         pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");
56         pd4ml.enableDebugInfo();
57         pd4ml.render("file:" + inputHTMLFileName, fos);
58     }
59  
60 }

pd4browser和pd4fonts是生成的

乱码解决方案：
https://blog.csdn.net/u014769730/article/details/54375836

测试结果：

对CSS有一定的要求

部分Html能支持：

6. Sferyx：(样式有问题)

官网：https://www.sferyx.com/pdfgenerator/html-to-pdf-java.htm

支持URL、支持文件。支持中文，对html文件几乎无要求。样式不佳，中文字体支持不佳。

具体实现

引入Java包：PDFGenerator.jar

代码：

1         PDFGenerator pdfGenerator=new PDFGenerator();
2         pdfGenerator.setMarginsForStandardPageFormat (10,10,10,10);
3 //        pdfGenerator.setCharset ("utf-8");
4         pdfGenerator.setCharset("ISO-10646-UCS-2");
5 //        pdfGenerator.generatePDFFromURL ("https://blog.csdn.net/gisboygogogo/article/details/77601308",
6         pdfGenerator.generatePDFFromURL ("F:\\pdf\\1.html",
7                 "F:\\pdf/pdfgenerator-test1.pdf",
8                 "A4", "Portrait");

样式问题：

7. jPDFWriter(样式有问题、对html文件支持不好)

具体实现：

1 //        URL url = new URL("https://www.baidu.com/");
2 //        PageFormat pf = new PageFormat();
3 //        PDFDocument pdfDoc = PDFDocument.loadHTML (url, pf, true);
4 //        pdfDoc.saveDocument ("F:\\pdf\\output.pdf");
5         File f1 = new File ("F:\\pdf\\1.html");
6         PDFDocument pdfDoc = PDFDocument.loadHTML(f1.toURI().toURL(), new PageFormat (), false);
7         pdfDoc.saveDocument ("F:\\pdf\\output.pdf");

效果：

并不是很好，虽然支持中文

其他未知方案。。。。。。。。。。

在线转换方案：

仅支持URL，但能很好地转换，效果较好，速度较快。但收费，且为第三方服务，或有信息安全性问题。

如果不考虑html文件安全性的话，可以考虑。

以转CSDN及百度搜索网页为测试例。

1. restpack

官网：https://restpack.io/

能很好保持样式，且支持中文，速度快。价格相比较优惠。

使用实例：

https://www.cnblogs.com/IT-study/p/13738157.html

2. pdfshift

官网：https://pdfshift.io

能很好保持样式，且支持中文，速度快。价格相比较优惠。

测试效果：

实现方法：

 1 String encoding = Base64.getEncoder().encodeToString("YOUR_API_KEY:".getBytes());
 2 HttpPost httppost = new HttpPost("https://api.pdfshift.io/v2/convert/");
 3 httppost.setHeader("Authorization", "Basic " + encoding);
 4 httppost.setHeader("Content-type", "application/json");
 5  
 6 HttpEntity postingString = new StringEntity("{\"source\":\"https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=PhantomJS%20html%E8%BD%ACpdf&oq=PhantomJS&rsv_pq=c942451400041f65&rsv_t=3566cYExdLkZv6pJRhDXeda3WgHs37R3GASuPvnEGrOmBl9Lur2EMGyfdF8&rqlang=cn&rsv_enter=1&rsv_sug3=15&rsv_sug1=4&rsv_sug7=100&rsv_sug2=0&inputT=6104&rsv_sug4=6105\",\"landscape\":false,\"use_print\":false}");
 7 httppost.setEntity(postingString);
 8  
 9 CloseableHttpClient client = HttpClients.createDefault();
10 try (CloseableHttpResponse response = client.execute(httppost)) {
11     HttpEntity entity = response.getEntity();
12     // Use the entity
13 }

3.其他(不考虑的方案)

1. pdfmyurl(网站反应慢)

官网：http://pdfmyurl.com/

转化效率极低，速度极其慢

2. pdflayer(不支持中文)

官网：https://pdflayer.com/

不支持中文。虽然能很好保持样式。

个人总结：

到现在未知并为找到完美的方案。各种方案都有缺点，但是在线转换的方案转化效率以及对CSS等支持程度比较好。也不知道他们这些内部是如何实现的。

参考链接：

http://blog.csdn.net/ouyhong123/article/details/26401967

http://blog.csdn.net/tengdazhang770960436/article/details/41320079

http://www.cnblogs.com/jasondan/p/4108263.html

http://blog.csdn.net/accountwcx/article/details/46785437

http://blog.csdn.net/zdtwyjp/article/details/5769353

用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
Java中的批处理优化：使用Spring Batch处理大规模数据的实践微赚淘客系统开发者@聚娃科技 java spring batch
Java中的批处理优化：使用SpringBatch处理大规模数据的实践大家好，我是微赚淘客返利系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在处理大规模数据的场景中，批处理是一个非常常见且必要的操作。Java中的SpringBatch是一个强大的框架，能够帮助我们高效地执行复杂的批处理任务。本文将带大家了解如何使用SpringBatch处理大规模数据，并通过代码示例展示如何实现高效的批
js递归性能优化啃火龙果的兔子开发DEMO javascript 开发语言 ecmascript
JavaScript递归性能优化递归是编程中强大的技术，但在JavaScript中如果不注意优化可能会导致性能问题甚至栈溢出。以下是几种优化递归性能的方法：1.尾调用优化(TailCallOptimization,TCO)ES6引入了尾调用优化，但只在严格模式下有效：'usestrict';//普通递归functionfactorial(n){if(n===1)return1;returnn*fa
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
Java静态static详解 Obltv Java基础 java
更多内容请看我的个人网站date:2025-06-04tags:八股基础静态变量特点被该类的所有对象共享不属于对象，属于类优先于对象存在，随着类的加载而加载调用方式类名调用对象名调用（不推荐）静态方法没有this关键字publicclassStudent{privateStringname;privateintage;privateStringteacherName;publicvoidshow(
Java中多态的一些见解
更多内容请看我的个人网站多态初识调用成员的特点成员变量：编译看左边，运行看左边成员方法：编译看左边，运行看右边多态在调用成员变量时为什么是父类的，但是方法是子类的?一句话解释：在编译时（静态绑定），成员变量是根据引用类型（也就是声明的类型）来决定的；在运行时（动态绑定），方法是根据对象的实际类型（也就是new出来的类型）来决定的。举个经典例子classParent{publicStringname
Java中的值传递 Obltv Java基础 java 开发语言
更多内容请看我的个人网站date:2025-06-01tags:八股基础Java中只有值传递什么是值传递值传递（PassbyValue）调用方法时，传递的是参数的值，是原始数据的一个副本。方法内部改变这个副本，不影响原始数据。什么是引用传递引用传递（PassbyReference）调用方法时，传递的是变量的地址（指针），方法内部对这个引用的任何更改，都会影响原始对象的引用。举例一个方法不能修改一个
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
瑞芯微RK3506工业芯片实例方案解析：从架构到场景的深度实践淡远-九鼎创展科技架构嵌入式硬件人工智能电脑
一、芯片技术架构解析瑞芯微RK3506作为2024年第四季度推出的工业级MPU，采用三核Cortex-A7（1.5GHz）+单核Cortex-M0（200MHz）的异构架构，形成独特的"3+1"处理核心组合。这种设计通过AMP多核调度技术，实现了Linux、RTOS、Bare-metal系统的混合运行，典型配置如"2×A7运行Linux（HMI交互）+1×A7运行RTOS（协议处理）+M0裸机（实
代码随想录算法训练营第52天 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿 Amor_Fati_Yu 算法 java 数据结构
101.孤岛的总面积importjava.util.*;publicclassMain{privatestaticintcount=0;privatestaticfinalint[][]dir={{0,1},{1,0},{-1,0},{0,-1}};//四个方向privatestaticvoidbfs(int[][]grid,intx,inty){Queueque=newLinkedList=gr
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
将字符串数组String[]转换成List的三种方法积极向上的Elbert java学习 java 开发语言
通过Arrays.asList(strArray)方式,将数组转换List后，不能对List增删，只能查改，否则抛异常。String[]strArray=newString[2];Listlist=Arrays.asList(strArray)；list.add("1");//此处会报错原因解析：Arrays.asList(strArray)返回值是java.util.Arrays类中一个私有静态
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
Java Fork/Join 框架详解 empti_ 数据结构与算法 java
JavaFork/Join框架详解Fork/Join框架是Java7引入的一个并行编程框架，专门设计用来高效地实现分治算法（Divide-and-Conquer）。它通过工作窃取（Work-Stealing）算法来最大化多核处理器的利用率。一、核心概念1.基本组成ForkJoinPool：特殊的线程池，管理工作线程ForkJoinTask：表示任务的抽象类，有两个重要子类：RecursiveAct
Java注解的实现原理 empti_ Java基础 java
Java注解的实现原理Java注解的实现涉及Java语言规范、编译器处理和JVM支持等多个层面。下面我将详细解释注解在Java中的实现机制。一、注解的本质注解本质上是一种特殊的接口，所有注解类型都隐式继承自java.lang.annotation.Annotation接口。当你定义一个注解时：public@interfaceMyAnnotation{Stringvalue();}编译器实际上会生成
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
RK3566系统移植 | 基于rk-linux-sdk移植uboot（2017.09） Mculover666 linux
文章目录一、测试已有的配置二、移植到fireflyROC-RK3566开发板1.新建单板2.新建设备树3.编译4.测试一、测试已有的配置查看rksdk中提供的uboot中对于rk3566的配置：rk3566.config内容如下：CONFIG_BASE_DEFCONFIG="rk3568_defconfig"CONFIG_LOADER_INI="RK3566MINIALL.ini"因为rk3566
Linux I/O 文件操作详解：从系统调用到实际工程应用平凡灵感码头 linux学习 linux 运维服务器
一、写在前面在Linux或任何类Unix操作系统中，文件是一切的核心——无论是硬盘上的文本文件，还是串口设备、GPIO寄存器、甚至网络接口，几乎都被抽象为“文件”。理解Linux下的I/O文件操作机制，不仅是嵌入式开发的基础，也是进行系统编程与底层控制的关键。二、I/O的本质：一切皆文件Linux将外设抽象成文件的方式，统一了对各种资源的操作模型。你可以用open打开串口设备/dev/ttyS0，
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

PDF技术 -Java实现Html转PDF文件

各实现对比表

1. wkhtmltopdf(速度慢、需要安装软件)

技术特点：

功能测试：

原理：

使用命令:

安装

优点：

缺点：

具体实现：

效果：

2. PhantomJS(样式有问题，需要安装软件)

html2pdf.js

3. IText(技术老旧，对样式不支持)

原理：

优点：

缺点：

具体实现：

效果：

4. Flying Sauser(技术老旧，对样式不支持)

优点：

缺点：

具体实现：

5. PD4ML(样式有问题)

优点：

缺点：

具体实现：

测试结果：

6. Sferyx：(样式有问题)

具体实现

7. jPDFWriter(样式有问题、对html文件支持不好)

效果：

其他未知方案。。。。。。。。。。

在线转换方案：

1. restpack

使用实例：

2. pdfshift

测试效果：

实现方法：

3.其他(不考虑的方案)

参考链接：

你可能感兴趣的:(乱码,html,python,java,linux)