有一个列表数据,现在要按照出现次数最多的来降频排序,并且当次数相同时保持数据出场的顺序不变。
如果使用C++需要采用优先队列和字典计数,但想着python应该不需要这么复杂吧。
#待数据 :
data = [7, 3, 3, 3, 5, 5, 5, 5, 6, 6, 6, 1]
#目标数据:
ans = [5, 5, 5, 5, 3, 3, 3, 6, 6, 6, 7, 1]
使用字典来计数,然后对字典的value进行排序,最后拼接成目标数组
"""
计数后的字典结构,在这需要用到defaultdict来构建:
dic = {1: [1, 11], 3: [3, 1], 5: [4, 4], 6: [3, 8], 7: [1, 0]}
之后将dic送进sorted()进行高级排序比较,采用key参数指定先按照次数比较,如果次数相同
则按照出场顺序进行比较
"""
data = [7,3,3,3,5,5,5,5,6,6,6,1]
def times_sort(data:list):
from collections import defaultdict
times = defaultdict(list)
for i in data:
if i not in times:
times[i].append(data.count(i))
times[i].append(data.index(i))
dic = sorted(times.items(), key=lambda item: (-item[1][0], item[1][1]))
res = []
for (k, v) in dic:
#print(k,v)
res += [k]*v[0]
return res
print(times_sort(data))
不需要使用到字典,直接使用python中的set来去重,并且把(key, times, index)当成元组直接送进sorted函数进行高级比较就可以。
"""
原理很简单,就是对元组(key, times, index)进行一个多变量的排序而已
input:[(1, 1, 11), (3, 3, 1), (5, 4, 4), (6, 3, 8), (7, 1, 0)]
ouput: [(5, 4, 4), (3, 3, 1), (6, 3, 8), (7, 1, 0), (1, 1, 11)]
"""
def times_sort(data:list):
value = set(data)
times = []
index = []
for i in value:
times.append(data.count(i))
index.append(data.index(i))
res = []
for i in zip(value, times, index):
res.append(i)
res = sorted(res, key=lambda x:(-x[1],x[2])) #负号表示从大到小,因为默认是从小到大
ans = []
for item in res:
ans += [item[0]]*item[1]
return ans
print(times_sort(data))
Python统计列表(List)中的重复项出现的次数并进行排序
python 排序 sorted 如果第一个条件 相同 则按第二个条件排序
提升逼格的两个函数:setdefault 与 defaultdict