pip install pdfplumber
pdf = pdfplumber.open(r"D:\Desktop\xxx.pdf")
# 新建一个pandas表
df = pandas.DataFrame()
# 读取pdf内所有的表
for page in pdf.pages[0:len(pdf.pages)]:
# 自动读取表格信息,返回列表
table = page.extract_table()
if page.page_number == 1:
table_df = pandas.DataFrame(table[2:], columns=table[1])
else:
table_df = pandas.DataFrame(table[1:], columns=table[0])
df = df.append(table_df)