Python笔记:数据排名

本文简要展示一下,怎么在pandas中用rank()函数进行数据排名。原理不作赘述,具体用法请看示例:

01. 构造数据集

import pandas as pd

df = pd.DataFrame({
    "序号":range(1,11),
    "商品":["苹果","雪梨","荔枝","龙眼","西瓜","菠萝","黄皮","草莓","橙子","山竹"],
    "销量":[10,20,20,30,30,30,40,50,60,100]
})

df

Python笔记:数据排名_第1张图片

02. 算术均值排名

# 相同的值排名相同,但排名采用算术均值.占位
df["排名"] = df["销量"].rank(method = "average")
df

Python笔记:数据排名_第2张图片

03. 先出现的值排名优先

# 先出现的值排名次序优先
df["排名"] = df["销量"].rank(method = "first")
df

Python笔记:数据排名_第3张图片

04. 对同一个组使用最大的排名

# 对同一个组使用最大的排名
df["排名"] = df["销量"].rank(method = "max")
df

Python笔记:数据排名_第4张图片

05. 对同一个组使用最小的排名

# 对同一个组使用最小的排名
df["排名"] = df["销量"].rank(method = "min")
df

Python笔记:数据排名_第5张图片

06. 同组同排名,组间递增1

# 相同的组相同的排名,但是组间递增1
df["排名"] = df["销量"].rank(method = "dense")
df

Python笔记:数据排名_第6张图片

07. 按降序排名

# 按降序排名
df["排名"] = df["销量"].rank(ascending = False)
df

Python笔记:数据排名_第7张图片

08. 按升序排名

# 按升序排名
df["排名"] = df["销量"].rank(ascending = True)
df

Python笔记:数据排名_第8张图片

创作不易,分享难得。如果觉得本文对您有帮助,请不吝动动宝贵的手指帮忙点个赞以示支持一下。后期,我会用心分享更多更精彩、实用的干货给大家,以期共同进步。感谢阅读!

你可能感兴趣的:(Python,Python数据分析,python)