Python:解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比
pdf是个异常坑爹的东西,有很多处理pdf的库,但是没有完美的。一、pdfminer3kpdfminer3k是pdfminer的python3版本,主要用于读取pdf中的文本。网上有很多pdfminer3k的代码示例,看过以后,只想吐槽一下,太复杂了,有违python的简洁。frompdfminer.pdfparserimportPDFParser,PDFDocumentfrompdfminer.