◆ ◆ ◆ ◆ ◆
我是需求
有人问了我一个这样的问题,题目是:……。直接上图吧~
我来安排
1.造点假数据
import pandas as pd
data = {'考试':['一模','二模','一模','二模','一模','二模'],
'姓名':['张三','张三','李四','李四','王五','王五'],
'语文':[78,75,68,72,80,82],
'数学':[90,95,78,76,100,92],
'英语':[85,82,78,76,86,93]}
df = pd.DataFrame(data)
df
#方法一#
2.1先分组求首尾数据之差
# 一定要深刻体会groupby后加的字段的不同
delta = df.groupby('姓名')['考试','语文','数学','英语'].last() - df.groupby('姓名')['语文','数学','英语'].first()
# 重设索引,使姓名列恢复列字段
delta.reset_index(inplace = True)
# 填充为对比,满足需求的每一个小细节
delta.fillna('对比',inplace=True)
# 输出瞧一瞧
delta
3.1使用append添加结果进去
# 这种方式是可以设置ignore_index = True
df.append(delta,ignore_index = True,sort = False).sort_values('姓名').reset_index(drop=True)
#方法二#
2.2先分组使用diff( )方法求差值
delta = df.groupby('姓名').diff().dropna()
delta
3.2使用append添加结果进去
# 这种方式必须设置ignore_index = False,否则在索引排序时就会匹配不到结果
df.append(delta,ignore_index = False,sort = False).sort_index().fillna({'考试':'对比'}).fillna(method = 'ffill')
上图结果可以看到,我们利用了索引的一个排序,完成了差值的匹配。当然,可以使用重设索引来更新一下。好了,完成--!!!
觉得精彩,记得点在看,否则没有动力原创啊!跪谢~
我是总结
本文讲解了这几大需要掌握的知识点:
1.深入理解分组聚合的众多妙处。
2.不同参数对结果的影响。
3.append方法,fillna方法,diff方法的使用。
-- END --
更
多
精
彩
Python 进阶编程之字典的高级用法
Python实现行转列?!超简单,赶快get起来
Python一行命令生成数据分析报告
“在看”的永远18岁~