python合并多个Excel表格

作为新手,之前写过一些的python小功能,但转眼又忘了,现在想把之前写过的常见的实用简单的小功能重新修改下,放到上面来。

项目需求如下:

一个文件夹下面有很多个文件夹,每个文件下里面又有多个相同结构的Excel文件,结构如下面的截图,把所有的Excel记录合并到一个表格中。

image

首先找出目标文件夹下面的所有Excel表格

import os
#获取目标文件夹下的所有Excel文件路径,并保存到file_path中
def get_all_file(raw_path):
    all_file=os.walk(raw_path)
    file_path=[]
    for i in all_file:
        if i[2]==[]:
            continue
        for each_file in i[2]:
            if '.xl' in each_file:#可能为xls或者xlsx
                a_path=os.path.join(i[0],each_file)
                file_path.append(a_path)
    return file_path

获取了所有文件路径后就是合并Excel文件。
之前本来打算用xlrd之外的模块,但发现现在的xlrd已经支持读取xlsx文件了。

import xlrd
import xlwt
def hebing_xls(file_path,save_path,all_sheet=False):
    #创建一个新的xls文件
    workbook = xlwt.Workbook(encoding='utf-8',style_compression=0)
    sheet = workbook.add_sheet("sheet1",cell_overwrite_ok = True)
    num=1#从每个文件的第二列开始复制
    for each in file_path:
        data = xlrd.open_workbook(each)
        #all_sheet 是考虑到可以一个Excel文件有多个表格,sheet1,sheet2之类的,用于辨别
        if all_sheet==True:
            sheet_num=len(data.sheet_names())
        else:
            sheet_num=1
        for index in range(sheet_num):    
            table = data.sheets()[index]
            hang=table.nrows
            lie=table.ncols
            #读取第一行,写入标题行
            if num==1:
                first_row = table.row_values(0)
                for each in first_row:
                    sheet.write(0,first_row.index(each),each) 
            #只有标题行,没有记录,则不合并
            if hang<2:
                continue
            else:
                for i in range(hang)[1:]:
                            for j in range(lie):
                                a=table.cell(i,j).value                
                                sheet.write(num,j,a)
                            num=num+1
            #print (num, 'finish')
            workbook.save(save_path)

下面附上完整代码

import xlrd
import os
import xlwt

def get_all_file(raw_path):
    all_file=os.walk(raw_path)
    file_path=[]
    for i in all_file:
        if i[2]==[]:
            continue
        for each_file in i[2]:
            if '.xl' in each_file:
                bet_path=os.path.join(i[0],each_file)
                file_path.append(bet_path)
    return file_path

def hebing_xls(file_path,save_path,all_sheet=False):
    workbook = xlwt.Workbook(encoding='utf-8',style_compression=0)
    sheet = workbook.add_sheet("sheet1",cell_overwrite_ok = True)
    num=1
    for each in file_path:
        data = xlrd.open_workbook(each)
        #all_sheet表示是否每个表格都读取
        if all_sheet==True:
            sheet_num=len(data.sheet_names())
        else:
            sheet_num=1
        for index in range(sheet_num):    
            table = data.sheets()[index]
            hang=table.nrows
            lie=table.ncols
            #读取第一行,写入标题行
            if num==1:
                first_row = table.row_values(0)
                for each in first_row:
                    sheet.write(0,first_row.index(each),each) 
            #只有标题行,没有记录,则不合并
            if hang<2:
                continue
            else:
                for i in range(hang)[1:]:
                            for j in range(lie):
                                a=table.cell(i,j).value                
                                sheet.write(num,j,a)
                            num=num+1
            #print (num, 'finish')
            workbook.save(save_path)
if __name__ == '__main__':
    raw_path=r'G:\project\data'
    save_path=r'G:\hebing.xls'
    file_path=get_all_file(raw_path)
    hebing_xls(file_path,save_path,True)
    print('end')

你可能感兴趣的:(python合并多个Excel表格)