python学习之路:合并多个excel文件、合并多个pdf文件

**关键点:

  • python中的os模块
  • python中的pandas中的concat
  • python中的PyPDF2模块**

1、合并多个Excel文件

import os
import pandas as pd

file_dir = r'C:\Users\liujunke\Desktop\python_test\9. just_test\many_excel'
data=pd.DataFrame()
df = pd.DataFrame()
for root,dirs,files in os.walk(file_dir): #files就是取得了many_excel文件夹中的所有excel名
    for name in files:
        df = pd.read_excel(str('many_excel/'+ name),header=5) #每个files中的excel名,读取并放入df
        data = pd.concat([data,df]) #利用循环合并所有excel
        df = pd.DataFrame()
data.to_excel('测试合并得到汇总excel文件.xlsx')

2、合并多个pdf文件

import os
import PyPDF2

file_dir = r'C:\Users\liujunke\Desktop\python_test\9. just_test\many_pdf'
filenames = []
for root,dirs,files in os.walk(file_dir): #获得man_pdf文件夹中的所有pdf文件名
    pass

filenames = files  

merger = PyPDF2.PdfFileMerger() #创建一个合并的对象
for filename in filenames: 
    merger.append(PyPDF2.PdfFileReader(str('many_pdf/' + filename))) #循环持续装入pdf文件
    
merger.write('测试合并得到的汇总.pdf')  #写入新pdf文件中

你可能感兴趣的:(python学习之路)