大家好,我是 【Python当打之年(点击跳转)】
本期为大家带来 《 Pandas常用操作命令》 的 第六篇 ,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。
df2.groupby('省份').groups
{‘上海’: [‘009’], ‘广东’: [‘003’, ‘010’], ‘江苏’: [‘001’, ‘013’], ‘浙江’: [‘011’], ‘海南’: [‘005’], ‘重庆’: [‘007’]}
df2.groupby(['省份','城市']).groups
{(‘上海’, ‘上海’): [‘009’], (‘广东’, ‘广州’): [‘003’], (‘广东’, ‘深圳’): [‘010’], (‘江苏’, ‘南京’): [‘001’, ‘013’], (‘浙江’, ‘杭州’): [‘011’], (‘海南’, ‘海口’): [‘005’], (‘重庆’, ‘重庆’): [‘007’]}
df2.groupby('省份').describe()
df2.groupby('省份').describe().unstack()
df2.groupby('省份').describe()['语文']
df2.groupby('省份').count()
df2.groupby('省份').agg(np.size)
df2.groupby('省份').max()
df2.groupby('省份').agg(np.max)
df2.groupby('省份').min()
df2.groupby('省份').agg(np.min)
df2.groupby('省份').sum()
df2.groupby('省份').agg(np.sum)
df2.groupby('省份').mean()
df2.groupby('省份').agg(np.mean)
df2.groupby('省份')['英语'].agg([np.sum, np.mean])
df2.groupby(['省份','城市']).agg(np.mean)
df2.groupby('省份').agg({'语文': sum, '数学':'count', '英语':'mean'})
df2 = df2.dropna()
df2['性别'] = df2['性别'].map({'男':1, '女':0})
df2['语文平均分'] = df2.groupby('省份')['语文'].transform('mean')
def get_max(g):
df = g.sort_values('语文',ascending=True)
print(df)
return df.iloc[-1,:]
df2.groupby('性别').apply(get_max)
df.pivot_table(index=['省份','城市'], values=['语文','数学','英语'], aggfunc=max)
未完待续。。。
文章首发:微信公众号 “Python当打之年” ,Python编程技巧推送,希望大家可以喜欢。
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。