NBA湖人队之勒布朗詹姆斯:python实现读取文件夹并合并所有Excel表

**【关键点】:

- python下的os模块中的 walk() 方法
- pandas下的DataFrame数据结构
- pandas下的concat函数,用于连接多个dataframe,注意默认是纵向连接**

1、合并所有估值表,并新增基金名称和基金代码列

file_dir = r'C:\Users\liujunke\Desktop\python_test\4. risk_test\20191129'

当前文件夹为20191129,该文件夹中放置所有基金估值表数据

data=pd.DataFrame()
df = pd.DataFrame()

设置两个空的dataframe,

for root,dirs,files in os.walk(file_dir):
    for name in files:
        df = pd.read_excel(str('20191129/'+name), header=5)
        df['基金代码'] = name[:6]+'.OF'
        df['基金名称'] = name[6:-21]
        data = pd.concat([data,df])
        df = pd.DataFrame()

2、回顾一下python的os模块中的walk方法
os.walk

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

其中:
(1)top是要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。

  • root 所指的是当前正在遍历的这个文件夹的本身的地址
  • dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
  • files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

(2)topdown,可选。是代表要从上而下遍历还是从下往上遍历。
(3)onerror,可选。可以用来设置当便利出现错误的处理函数(该函数接受一个OSError的实例作为参数),设置为空则不作处理。
(4)followlinks,可选。是否要跟随目录下的链接去继续遍历,要注意的是,os.walk不会记录已经遍历的目录,所以跟随链接遍历的话有可能一直循环调用下去。
NBA湖人队之勒布朗詹姆斯:python实现读取文件夹并合并所有Excel表_第1张图片

你可能感兴趣的:(python,NBA与python之路,python,excel)