Pands中DataFrame学习

1. DataFrame中groupby方法返回MultiIndex转成DataFrame

原始数据

原始数据为dfa,对月份和类别做分组统计后

dfb = dfa.groupby(['year_month','类别'])['金额'].sum()
GroupBy之后实际上是Multi index的Series对象
dfc = dfb.reset_index()
reset index之后成为DataFrame对象

2. Datafram多列数据运用apply函数操作

原始数据 rec

目标:需要对成交类型位“卖出”的成交量变为负值

rec['成交量']=rec.apply(lambda x : -x['成交量'] if x['成交类型']=='卖出' else x['成交量'] ,axis=1 )

一定要有axis = 1作为参数,否则会报错

修改后的rec

3. 合并列名不同的Dataframe

stock_daily_data = pd.merge(stock_daily_data, stock_hold, left_on = 'date', right_on = '日期', how = 'left')

4. NaN相等判断

NaN不用使用 “==” 来判断,需要使用 math.isnan() 函数判断。

你可能感兴趣的:(Pands中DataFrame学习)