用pandas里的groupby函数实现把一个大文件按某一列的类型分成多个文件

上图说话,浅显易懂

大文件:

用pandas里的groupby函数实现把一个大文件按某一列的类型分成多个文件_第1张图片

可以发现上图“单元这一行”有三个不同的值,我想以这一列为主键,分成三个文件,文件名以主键内容命名,输出如下图:

对于GO7-33-286.csv、GO7-35-226.csv、GO7-37-166.csv这三个文件内容,分别如下:

实现代码如下:

# -*- coding: utf-8 -*-
"""
Created on Thu Nov 30 10:41:19 2017

@author: wq
"""

import pandas as pd

df1 = pd.read_csv('input.csv', encoding='gbk')

groups = df1.groupby(df1[u'单元'])

for group in groups:
    group[1].to_csv(str(group[0]) + '.csv', index=False, encoding='gbk')


高交会馆就

你可能感兴趣的:(数据分析)