需求:把一个文件夹下的多个csv文件合并成一个文件,文件的格式是相同的,只是按照不同的月份分成了多个文件,现将文件夹下的文件进行合并
import pandas as pd
import os
Folder_Path = 'C:\\Users\\dell\\雾霾预测\\data\\河北省'
SaveFile_Path = 'C:\\Users\\dell\\雾霾预测\\data'
SaveFile_Name = '河北省201701-201712.csv'
os.chdir(Folder_Path)
file_list = os.listdir()
df = pd.read_csv(Folder_Path +'\\'+ file_list[0])
df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False)
FileStart = 1
FileEnd = len(file_list)
for i in range(FileStart,FileEnd):
df = pd.read_csv(Folder_Path + '\\'+ file_list[i])
df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False, header=False, mode='a+')
在读取的时候可能会出现中文乱码的问题,有可能是gbk编码这时候再读取文件的时候需要加上编码格式
df = pd.read_csv(Folder_Path +'\\'+ file_list[0],encoding = 'gbk')