python实现次数排序并且保持出现顺序不变

问题背景:

  有一个列表数据,现在要按照出现次数最多的来降频排序,并且当次数相同时保持数据出场的顺序不变。

  如果使用C++需要采用优先队列和字典计数,但想着python应该不需要这么复杂吧。

#待数据 :
data = [7, 3, 3, 3, 5, 5, 5, 5, 6, 6, 6, 1]

#目标数据:
ans = [5, 5, 5, 5, 3, 3, 3, 6, 6, 6, 7, 1]

解决方案1:

     使用字典来计数,然后对字典的value进行排序,最后拼接成目标数组

"""
计数后的字典结构,在这需要用到defaultdict来构建:
dic = {1: [1, 11], 3: [3, 1], 5: [4, 4], 6: [3, 8], 7: [1, 0]}
之后将dic送进sorted()进行高级排序比较,采用key参数指定先按照次数比较,如果次数相同
则按照出场顺序进行比较
"""
data = [7,3,3,3,5,5,5,5,6,6,6,1]

def times_sort(data:list):
    from collections import defaultdict
    times = defaultdict(list)

    for i in data:
        if i not in times:
            times[i].append(data.count(i))
            times[i].append(data.index(i))

    dic = sorted(times.items(), key=lambda item: (-item[1][0], item[1][1]))

    res = []
    for (k, v) in dic:
        #print(k,v)
        res += [k]*v[0]

    return res

print(times_sort(data))

解决方案2:

      不需要使用到字典,直接使用python中的set来去重,并且把(key, times, index)当成元组直接送进sorted函数进行高级比较就可以。

"""
原理很简单,就是对元组(key, times, index)进行一个多变量的排序而已
input:[(1, 1, 11), (3, 3, 1), (5, 4, 4), (6, 3, 8), (7, 1, 0)]
ouput: [(5, 4, 4), (3, 3, 1), (6, 3, 8), (7, 1, 0), (1, 1, 11)]
"""
def times_sort(data:list):
    value = set(data)
    times = []
    index = []

    for i in value:
        times.append(data.count(i))
        index.append(data.index(i))

    res = []
    for i in zip(value, times, index):
        res.append(i)
    res = sorted(res, key=lambda x:(-x[1],x[2]))  #负号表示从大到小,因为默认是从小到大

    ans = []
    for item in res:
        ans += [item[0]]*item[1]

    return ans

print(times_sort(data))

 

reference:

Python统计列表(List)中的重复项出现的次数并进行排序

python 排序 sorted 如果第一个条件 相同 则按第二个条件排序

提升逼格的两个函数:setdefault 与 defaultdict

你可能感兴趣的:(数据结构与算法)