数据分析之获取前N最大、最小值或索引

首先,为了获取前N的最大最小值或者索引,下面介绍了两种方法,大家可以视情况选择:

1、利用heapq模块,heapq模块中有两个函数:

  • nlargest()
  • nsmallest()

他们可以找到列表,元组,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回。
此方法只适用于数组无序且没有重复元素;否则,会出现键值匹配混乱。

2、利用pandas模块排序

  • sort_values(), 默认从小到大
  • sort_values(ascending = False),从大到小排序

1. 获取数组前 N 最大(小)值

a = [1, 4, 6, 8, 9, 3, 2, 5, 7, 8, 4]

# 1、利用heapq模块
rel2 = heapq.nlargest(4, a)
print(rel2)

# 2、利用pandas模块
b = pd.Series(a).sort_values(ascending = False)[:4]
print(b)
输出:
[9, 8, 8, 7]
4    9
3    8
9    8
8    7
dtype: int64

2. 获取数组前 N 最大(小)值索引

a = [1, 4, 6, 8, 9, 3, 2, 5, 7, 8, 4]

# 1、利用heapq模块
rel = map(a.index, heapq.nlargest(4, a))
index = list(rel)
print(index)

# 2、利用pandas模块
c = pd.Series(a).sort_values(ascending=False).index[:4]
print(c)
for i in range(len(c)):
    print(c[i])
输出:
[4, 3, 3, 8]
Int64Index([4, 3, 9, 8], dtype='int64')
4
3
9
8

注意: 虽然,利用heapq模块也得到了前 n 最大值的索引,但是因为数据重复,所以出现了索引值为【4,3,3,8】情况。

你可能感兴趣的:(数据分析,heapq获取前N最大值,heapq获取前N最大值索引,pandas获取前N最大值索引,获取前N最大,最小值,获取前N最大,最小值索引)