JAVA解析PDF内容

不废话,很简单,超实用。表格,图片都可以解析,
1下载**Spire.Pdf.jar**,

点击此处下载jar包

2代码

public static void main(String[] args)  {
	try {
		PdfDocument doc = new PdfDocument();
		doc.loadFromFile("E:\\pdf\\test.pdf");
		StringBuilder sb = new StringBuilder();
		PdfPageBase page;
		for (int i = 0; i < doc.getPages().getCount(); i++) {
			//获取每一行的page对象
			page = doc.getPages().get(i);
			sb.append(page.extractText(true));
			//这个if中是图片的解析输出
			if (page.extractImages() != null) {
				for (BufferedImage image : page.extractImages()) {
					if (image != null) {
						//指定输出图片名,指定图片格式,后缀自己换
						File output = new File("E:\\pdf\\img.png");
						ImageIO.write(image, "PNG", output);
					}
				}
			}
		}
		System.out.println(sb);
		doc.close();
	} catch (Exception e) {
		e.printStackTrace();
	}
}

 源文件

JAVA解析PDF内容_第1张图片

解析的文本

JAVA解析PDF内容_第2张图片

解析的图片

JAVA解析PDF内容_第3张图片

 

测试通过的点个赞

你可能感兴趣的:(pdf解析)