Pandas库介绍--统计相关

数据应用上节读取的CSV;
1.值分类汇总

counts = df['hGrade'].value_counts()
print counts
Pandas库介绍--统计相关_第1张图片

2.绘制柱形图,并保存

plt = counts.plot(kind='bar').get_figure()
plt
plt.savefig('/Users/baidu/Downloads/plot.png')
Pandas库介绍--统计相关_第2张图片

3.数据分组

#数据准备
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                  'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                  'C':np.random.randn(8),
                  'D':np.random.randn(8)})
print df
Pandas库介绍--统计相关_第3张图片
#根据列A进行分组,取每组第一行数据
grouped = df.groupby('A')
print grouped.first()
Pandas库介绍--统计相关_第4张图片
#根据多列进行分组A,B列
grouped = df.groupby(['A', 'B'])
print grouped.last()
Pandas库介绍--统计相关_第5张图片

根据列进行分组

def get_type(letter):
    if letter.lower() in 'abem':
        return 'vowel'
    else:
        return 'consonant'
    
grouped = df.groupby(get_type, axis=1)
print grouped.first()
Pandas库介绍--统计相关_第6张图片

你可能感兴趣的:(Pandas库介绍--统计相关)