python数据科学包

1.pandas

1.1 pandas.crosstab

  1. 求解交叉占比,crosstab比pivot_table更简洁。
  2. pivot_table,代码和结果如下:
tmp = pd.pivot_table(data=datas,values='loan_no',index='live_build_type',columns='y_m3Worse',aggfunc=len,margins=True)
tmp['0_ratio'] = tmp2[0]/tmp2['All']
tmp['1_ratio'] = tmp2[1]/tmp2['All']

python数据科学包_第1张图片
3. crosstab,代码和结果如下:

tmp = pd.crosstab(datas['live_build_type'], datas['y_m3Worse'], normalize='index')

python数据科学包_第2张图片

你可能感兴趣的:(Python)