大家好,我是 【Python当打之年(点击跳转)】
本期为大家带来 《 Pandas常用操作命令》 的 第五篇 ,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。
示例数据:
# 重命名列
df.columns = ['姓名','性别','语文','数学','英语','城市','省份']
df1 = df['姓名'].str.split('-',expand=True)
df1.columns = ['学号','姓名']
df1['性别'] = df['性别']
df1['语文'] = df['语文']
df1['数学'] = df['数学']
df1['英语'] = df['英语']
df1['城市'] = df['城市']
df1['省份'] = df['省份']
df1.dropna(inplace = True)
df_last = df1.reset_index(drop=True)
df_last.sort_values('语文')
df_last.sort_values('数学', ascending=False)
df_last.sort_values(['语文','数学'], ascending=[True,False])
df_last[df_last['语文']>=80]
df_last.query('语文 > 80')
df_last[(df_last['语文']>=80) & (df_last['数学']>=90)]
df_last[(df_last['语文']>=80) | (df_last['数学']>=90)]
row, col = np.where(df_last.values == 100)
print('%s\t%s'%(row,col))
[0 7] [4 5]
df_last['省份-城市'] = df_last['省份'] + '-' + df_last['城市']
df_last['总分'] = df_last[['语文','数学','英语']].sum(axis = 1)
df_last.sort_values(by =['总分','语文','数学','英语'],ascending=False)
def get_letter_grade(score):
if score>=90:
return '优秀'
elif score>=80:
return '良好'
elif score>=60:
return '中等'
else:
return '不及格'
df_last['语文等级'] = df_last['语文'].apply(lambda score: get_letter_grade(score))
未完待续。。。
文章首发:微信公众号 “Python当打之年” ,Python编程技巧推送,希望大家可以喜欢。
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。