python pandas 管理csv文件,合并csv文件

我现在要把十几个csv文件合并,并统计出来里面的数据

如图:

python pandas 管理csv文件,合并csv文件_第1张图片

 

import pandas as pd
import os
import re
import numpy as np

Folder_Path = r'C:/Users/Cable-Ching\Desktop/New folder/New folder'  # 要拼接的文件夹及其完整路径,注意不要包含中文
SaveFile_Path = r'C:/Users/Cable-Ching\Desktop/New folder/New folder'  # 拼接后要保存的文件路径
SaveFile_Name = r'all.csv'  # 合并后要保存的文件名

# 修改当前工作目录
os.chdir(Folder_Path)
# 将该文件夹下的所有文件名存入一个列表
file_list = os.listdir()

# 读取第一个CSV文件并包含表头
df = pd.read_csv(Folder_Path + '\\' + file_list[0], encoding='gb2312')  # 编码格式为gb2312,若乱码自行更改

# 将读取的第一个CSV文件写入合并后的文件保存
df.to_csv(SaveFile_Path + '\\' + SaveFile_Name, encoding='gb2312', index=False)

# 循环遍历列表中各个CSV文件名,并追加到合并后的文件
for i in range(1, len(file_list)):
    df = pd.read_csv(Folder_Path + '\\' + file_list[i], encoding='gb2312')
    df.to_csv(SaveFile_Path + '\\' + SaveFile_Name, encoding='gb2312', index=False, header=False, mode='a+')
data = pd.read_csv('C:/Users/Cable-Ching/Desktop/New folder/New folder/all.csv', encoding='gb2312')
gf=data.groupby(["标题"])["展示人数","展示次数","点击人数"].sum()
print(gf)
gf.to_csv('C:/Users/Cable-Ching\Desktop/New folder/New folder/test.csv',encoding = 'gb2312')

合并后的文件

 

python pandas 管理csv文件,合并csv文件_第2张图片

统计后为

python pandas 管理csv文件,合并csv文件_第3张图片

你可能感兴趣的:(Python学习)