Python解析PDF:支持本地/在线文档的解析、提取文本及表格信息(采用pdfplumber包)
番外话被PDF折磨了两年多,今天终于找到一个比较好的解析方案,是用pdfplumber包解析的,并做了一些封装。之前用pdfminer解析的效果很一般,提取效果无法忍受的那种。把解析方法写出来后,我自己也是老泪纵横,给大家分享一下注意事项pdfplumber是对pdfminer的再封装,最好先安装pdfminer3k,再安装pdfplumber,否则代码很容易报错源码#-*-coding:utf-