pandas 从一个目录的多个文件中读取指定单元格组成列重新建立新表格

一、思路

1、获取文件路径

2、建立指定单元格空列表

3、读取数据添加到单元格列表,形成序列

4、建立数据字典

5、建立DataFrame

6、存入文件

二、例子

#导包

import pandas as pd

import os

# 指定文件夹的路径

firstPath = '/data/course_data/jixiao'

# 获取到 excel 文件夹下所有文件的名字

filename = os.listdir(firstPath)

#建立指定单元格空列表

datelist = []

namelist = []

sectionlist = []

postlist = []

leaderlist = []

ratelist = []

leader_ratelist = []

# 使用循环拼接路径

for secondPath in result:

    # 拼接路径

    filePath=os.path.join(firstPath,secondPath)

    # 读取数据文件

    df = pd.read_excel(filePath,header=None)

    # 获取数据

    datelist.append(df.iloc[2,0])

    namelist.append(df.iloc[2,1])

    sectionlist.append(df.iloc[2,2])

    postlist.append(df.iloc[2,4])

    leaderlist.append(df.iloc[2,5])

    ratelist.append(df.iloc[2,6])

    leader_ratelist.append(df.iloc[9,7])

# 将获取到的数据创建成字典 

data_dict = {

    '日期':datelist,

    '姓名':namelist,

    '部门':sectionlist,

    '岗位':postlist,

    '直属Leader':leaderlist,

    '评分':ratelist,

    '领导评分':leader_ratelist,

}

# 将字典数据转换成 DataFrame

data = pd.DataFrame(data_dict)

#存入文件

df = data.to_excel('绩效.xlsx')

你可能感兴趣的:(pandas 从一个目录的多个文件中读取指定单元格组成列重新建立新表格)