编辑pdf - pdfplumber的使用

1.安装

pip install pdfplumber

2.打开pdf

pdf = pdfplumber.open(r"D:\Desktop\xxx.pdf")

3.读取pdf里面所有的表格

# 新建一个pandas表
df = pandas.DataFrame()

# 读取pdf内所有的表
for page in pdf.pages[0:len(pdf.pages)]:
    # 自动读取表格信息,返回列表
    table = page.extract_table()
    if page.page_number == 1:
        table_df = pandas.DataFrame(table[2:], columns=table[1])
    else:
        table_df = pandas.DataFrame(table[1:], columns=table[0])
    df = df.append(table_df)

你可能感兴趣的:(python,python)