python pandas 中取dataframe子分组的数据进行分析

       有时候,我们需要对一个dataframe的每一个分组里面的数据做详细的分析,这个时候就需要对数据进行分组,然后把这个分组的数据取出来做其他分析,具体做法如下:

# 根据“hour”这一列对data进行分组
data_group = data.groupby("hour")

#取出分组数据的index,并生成list
hour_index = data_group.size().index.tolist()

# 循环index,取出相应的index对应的子数据集,然后进行其他的分析
for hour in hour_index:
    hour_data = data_group.get_group(hour)

      当用于分组的index由两列或者多列数据组成时,用法如下:

data_group = data.groupby(["hour", "age"])
indexes = data_group.size().index.tolist()

for index in indexes:
    hour = index[0]
    age = index[1]
        

 

你可能感兴趣的:(pandas)