df.groupby

for 循环遍历分组

# 分组
import pandas as pd
import numpy as np
df=pd.DataFrame({
'name':['BOSS','Lilei','Lilei','Han','BOSS','BOSS','Han','BOSS'],
'Year':[2016,2016,2016,2016,2017,2017,2017,2017],
'Salary':[999999,20000,25000,3000,9999999,999999,3500,999999],
'Bonus':[100000,20000,20000,5000,200000,300000,3000,400000]
})
print(df)

df.groupby_第1张图片
查看分组情况

# 产看分组的情况
for name,group in group_by_name:
    print(name)# 组的名字
    print(group)# 组具体内容

df.groupby_第2张图片

交叉表的使用

df = pd.DataFrame({'Age': np.random.randint(20, 70, 100),
'Sex': np.random.choice(['M', 'F'], 100),
})
print(df)
age_groups = pd.cut(df['Age'], bins=[19,40,65,100])
# print(age_groups)
age_groups

df.groupby_第3张图片

# 按‘Age’分组范围和性别(sex)进⾏行行制作交叉表
pd.crosstab(age_groups, df['Sex'])

df.groupby_第4张图片

你可能感兴趣的:(python,小知识点,python)