PANDAS 在 sum 时通过level计算时index重复提示错误的设置

user=pd.read_csv(‘dx_user_1024.txt’,sep=‘|’,header=0)
print(user.head())
usergroup=user[[‘规整后的主叫号码’,‘规整后的被叫号码’,‘地市’]].groupby([‘规整后的主叫号码’,‘地市’]).count().reset_index()

print(usergroup)
usergroup.set_index([‘地市’,‘规整后的主叫号码’],drop=True,inplace=True)
usergroup.sort_values(‘地市’,inplace=True)
print(usergroup)
usergroup[‘分组占比’] = usergroup[‘规整后的被叫号码’].sum(level=‘地市’)/usergroup[‘规整后的被叫号码’]
print(usergroup)

你可能感兴趣的:(文本转换,python)