使用apache pdfbox读取pdf 实例

public   static   void  main(String[] args)  throws  Exception  {
    InputStream inputStream 
= new BufferedInputStream(
            
new FileInputStream(new File("d:\\work\\lt.pdf")));
    PDDocument pdfDocument 
= PDDocument.load(inputStream);
    StringWriter writer 
= new StringWriter();
    PDFTextStripper stripper 
= new PDFTextStripper();
    stripper.writeText(pdfDocument, writer);
    String contents 
= writer.getBuffer().toString();
    System.out.println(
"文档内容:"+contents);
    PDDocumentInformation documentInformation 
= pdfDocument.getDocumentInformation();
    System.out.println(
"标题:"+documentInformation.getTitle());
}

}
需要jar包:
pdfbox-1.4.0.jar
fontbox-1.4.0.jar

你可能感兴趣的:(使用apache pdfbox读取pdf 实例)