方法1-np.argmax(np.bincount())
看一个例子
array = [0,1,2,2,3,4,4,4,5,6] print(np.bincount(array)) print(np.argmax(np.bincount(array))) #[1 1 2 1 3 1 1] #4
这里用到了两个函数,np.argmax和np.bincount,第一个很常见,就是返回数组中最大值对应的下标,np.bincount可以通过上面的例子理解:首先找到数组最大值max,然后返回0~max的各个数字出现的次数,在上例中,0出现了1次,1出现了1次,2出现了2次...以此类推。
为什么这两个函数合起来可以找到出现次数最多的元素呢?因为np.bincount返回的数组中的下标对应的就是原数组的元素值,如上例中np.argmax找到np.bincount返回的数组中的最大值3(原数组中4出现了3次),其对应的下标4正是原数组中的元素4,如此就可以找到数组中出现次数最多的元素。
但是这种方法有一个缺陷,即bincount只能统计0~max出现的次数,所以这种方法仅适用于非负数组
方法2-Counter().most_common(1)[0][0]
看一个例子
from collections import Counter array = [0,1,2,2,3,4,4,4,5,6] print(Counter(array)) print(Counter(array).most_common(1)[0][0]) #Counter({4: 3, 2: 2, 0: 1, 1: 1, 3: 1, 5: 1, 6: 1}) #4
Counter用来对数组中元素出现次数进行统计,然后通过most_common函数找到出现次数最多的元素。这种方法对于数组就没有过多限制,甚至是各种类型元素混合的数组也可以
from collections import Counter array = [0,1,2,2,3,4,4,4,5,6,'aswd'] print(Counter(array)) print(Counter(array).most_common(1)[0][0]) #Counter({4: 3, 2: 2, 0: 1, 1: 1, 3: 1, 5: 1, 6: 1, 'aswd': 1}) #4
关于most_common函数可以通过下面的例子加深理解:
方法三
自己数各个元素出现的次数然后找到出现次数最多的元素
appear_times = {} for label in [1,1,2,3,4,5,5,5]: if label in appear_times: appear_times[label] += 1 else: appear_times[label] = 1 most_common = max(appear_times, key=lambda x: appear_times[x]) print(appear_times) print(most_common) #{1: 2, 2: 1, 3: 1, 4: 1, 5: 3} #5
这里需要注意的是appear_times是一个列表,用max求最大值默认情况返回value值(出现次数)最大的key值(元素),而不是value值,这里max函数中的参数key(和前面说的key不是一个东西)是指定寻找最大值的方式,在我们这个问题这里其实不需要这个参数,不过为了便于理解我还是写上了,对max函数key参数更深入的理解可以参考下面的例子:
print(max('ahecsc', 'bfsacg', 'aaaaaz', key=lambda x: x[0])) print(max('ahecsc', 'bfsacg', 'aaaaaz', key=lambda x: x[3])) print(max('ahecsc', 'bfsacg', 'aaaaaz', key=lambda x: x[5])) #bfsacg #ahecsc #aaaaaz
同样的数据,key参数不同,结果不同,第一种情况是以数据的第一个位置元素的大小关系排序,并返回排序结果最大的数据('b'>'a'>'a',返回'b'所在的'bfsacg');第二种情况类似('c'>'a'>'a',返回'c'所在的'ahecsc');第三种情况('z'>'g'>'c',返回'z'所在的'aaaaaz')
目前我只知道这三种方法,如果有大佬知道更多好用的办法,欢迎留言?:)