在做系统的时候,由于是电子政务,很多时候都需要将数据制作成PDF的文档,然后在各个部门之间盖章。我使用的是采用Itext生成pdf。
iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。iText的安装非常方便,下载jar文件后,只需要在系统的CLASSPATH中加入jar的路径,在程序中就可以使用iText类库了。
但是中途又遇到了一些问题。这个控件使用起来很简单,它的简单实例如下:
用iText生成PDF文档需要5个步骤:
①建立com.lowagie.text.Document对象的实例。
Document document =new Document();
②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。
PDFWriter.getInstance(document,new FileOutputStream("Helloworld.PDF"));
③打开文档。
document.open();
④向文档中添加内容。
document.add(newParagraph("Hello World"));
⑤关闭文档。
document.close();
通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"HelloWorld"。
上面只是一个简单的实例,还达不到项目需求的功能。在项目中需求是这样的,使用kindeditor(一个文本编辑器)将客户编辑的数据,连同格式一起存入数据库,然后再在数据库将这段html代码读取出来。打印成pdf。
这里面有几个关键点:
1.存入数据库的是编辑器产生的html代码片段,它生成什么代码,不好控制,而且生成的不是标准的html文档,只是一个部分,没有html头信息等。
2.解析的时候是将html取出来,然后生成pdf文档,再供用户下载。
3.需要一个html解析器,把html翻译成页面形式,防止到pdf中。要不pdf会把html代码也打印出来。
解决这几个技术点,我采用以下办法。
1.将从数据库读取出来的html代码去合并html头信息等。这样就参数一个标准的html文档,包括html,title,body标签等。
2.然后使用ITextRenderer将组合的字符串解析成pdf。存入mongodb数据库。
3.从mongoDB数据库中读取pdf文件,下载下来。
这里需要注意的就是,kindeditor生成的标签有的有问题,解析不了,比如font-family就不能解析。所以需要编辑htmlTag属性,把她去掉。具体方法请见:http://wolf123.blog.163.com/blog/static/17505429820127305757/
实现代码如下:
import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.io.FileOutputStream; import java.io.OutputStream; import org.xhtmlrenderer.pdf.ITextFontResolver; import org.xhtmlrenderer.pdf.ITextRenderer; import org.xml.sax.SAXException; import com.lowagie.text.DocumentException; import com.lowagie.text.pdf.BaseFont; /** * 将html字符串解析成pdf,返回文件流。采用单例模式 * @ClassName: DownloadMDBPDF * @author * @date 2012-11-29 下午08:34:48 */ public class DownloadMDBPDF { private static DownloadMDBPDF instance = null; private DownloadMDBPDF() { } public static DownloadMDBPDF getInstance() { if (instance == null) { instance = new DownloadMDBPDF(); } return instance; } /** * @throws SAXException * @throws IOException * @throws DocumentException * 取值 * @param @param key * @param @return * @return String * @throws */ public InputStream createPDFS(String content) throws DocumentException, IOException, SAXException { long startTime = System.currentTimeMillis(); // 获取开始时间 String outputFile = "D:/MT_applications/MT/temp.pdf"; OutputStream os = new FileOutputStream(outputFile); ITextRenderer render = new ITextRenderer(); ITextFontResolver fontResolver = render.getFontResolver(); fontResolver.addFont("C:/Windows/fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); StringBuffer html = new StringBuffer(); // DOCTYPE 必需写否则类似于 这样的字符解析会出现错误 html.append("<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">"); html.append("<html xmlns=\"http://www.w3.org/1999/xhtml\">").append("<head>").append("<meta http-equiv=\"Content-Type\" content=\"text/html; charset=UTF-8\" />").append("<style type=\"text/css\" mce_bogus=\"1\">body {font-family: SimSun;margin:10px 10px 10px 10px;}"); html.append("p {margin:5px 0;}"); html.append("table {border-collapse:collapse;}"); html.append("img {border:0;}"); html.append("noscript {display:none;}"); html.append("table.ke-zeroborder td {border:1px dotted #AAA;}"); html.append("</style>").append("</head>").append("<body>"); html.append(content); html.append("</body></html>"); long endTime = System.currentTimeMillis(); // 获取结束时间 System.err.println("程序运行时间: " + (endTime - startTime) + "ms-----------"); // 解析html生成pdf render.setDocumentFromString(html.toString()); render.layout(); render.createPDF(os); os.close(); // 将生成的pdf读取成输出流,供客户端下载。 File file = new File(outputFile); InputStream is = new FileInputStream(file); endTime = System.currentTimeMillis(); // 获取结束时间 System.err.println("程序运行时间: " + (endTime - startTime) + "ms------------"); return is; } }
上面返回的是输出流。这个输出流需要存入mongoDB数据库中。然后使用的时候读取下了。关于mongoDB的读写在以后的文章中介绍。