pandas:groupby

对于大数据,很多情况是只需要对部分列进行聚合

python/pandas数据挖掘(十四)-groupby,聚合,分组级运算

df.groupby(['key1','key2'],as_index=False)[['data2']].mean()

#按行求和
df['row_sum'] = df.apply(lambda x: x.sum(), axis=1)
 
#按列求和
df.loc['col_sum'] = df.apply(lambda x: x.sum())

2、删除空值

df.dropna(axis=0, how='any', inplace=True)

axis:0-行操作(默认),1-列操作 
how:any-只要有空值就删除(默认),all-全部为空值才删除 
inplace:False-返回新的数据集(默认),True-在愿数据集上操作

3、 多条件筛选

#或者 条件要加括号
d_drug=df1[(df1['费用类别']=='西药') | (df1['费用类别']=='中成药' )]
#且
d_drug=df1[(df1['费用类别']=='西药') &(df1['费用类别']=='中成药' )]

 

你可能感兴趣的:(数据分析)