python 排序

排序

作者:Andrew Dalke and Raymond Hettinger

在python中,一个内置函数list.sort()可以对list进行原址排序.同时还有另外一个sorted()函数,可以从可迭代对象构造一个有序的list.(可迭代对象不只是list,也包括dict等).
在本文档中,我们会探讨python中对数据进行排序的各种方式.

排序基础

一个简单的升序排列是很简单的,只需要调用sorted函数即可,它会返回一个新的已排序list.

>>> sorted([5, 2, 3, 1, 4])
[1, 2, 3, 4, 5]

也可以用list.sort()对list进行原址排序,返回None.这个函数通常没有sorted方便,但是如果你不需要保持原来的list,调用这个函数要比调用sorted()函数效率略高.

>>> a = [5, 2, 3, 1, 4]
>>> a.sort()
>>> a
[1, 2, 3, 4, 5]

另一个区别是list.sort只是为list定义的,而sorted函数可以作用于任何可迭代对象.

>>> sorted({1: 'D', 2: 'B', 3: 'B', 4: 'E', 5: 'A'})
[1, 2, 3, 4, 5]

key函数

list.sort和sorted函数都有一个key参数,用于指定一个函数,这个函数会在元素做比较之前被调用.举个例子,这是不区分大小写的字符串比较:

>>> sorted("This is a test string from Andrew".split(), key=str.lower)
['a', 'Andrew', 'from', 'is', 'string', 'test', 'This']

key函数必须接受一个参数,并且返回一个值作为比较的依据.这种方式是很快的,因为对于每一个输入,key函数仅被调用一次.
一种常见的使用方式是使用某些对象的索引作为键来对复杂的对象进行排序. 例如:

>>> student_tuples = [
    ('john', 'A', 15),
    ('jane', 'B', 12),
    ('dave', 'B', 10),
]
>>> sorted(student_tuples, key=lambda student: student[2])   # sort by age
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

具有命名属性的对象也可以使用相同的技术. 例如:

>>> class Student:
        def __init__(self, name, grade, age):
            self.name = name
            self.grade = grade
            self.age = age
        def __repr__(self):
            return repr((self.name, self.grade, self.age))
>>> student_objects = [
    Student('john', 'A', 15),
    Student('jane', 'B', 12),
    Student('dave', 'B', 10),
]
>>> sorted(student_objects, key=lambda student: student.age)   # sort by age
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

Operator Module Functions

上面所演示的排序方式十分普遍,因此python提供了更为方便的函数,让key函数访问元素更快更容易.operator模块有itemgetter(),attrgetter()methodcaller()函数.使用这些函数,上面的例子可以写的更快更简单.

>>> from operator import itemgetter, attrgetter
>>> sorted(student_tuples, key=itemgetter(2))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
>>> sorted(student_objects, key=attrgetter('age'))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

operator模块允许多字段排序, 比如按照年级和年龄排序:

>>> sorted(student_tuples, key=itemgetter(1,2))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
sorted(student_objects, key=attrgetter('grade', 'age'))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]

升序和降序

list.sort和sorted函数都可以接受bool参数reverse,用来决定是是否要递减序排序.比如将学生按年龄递减排序

>>> sorted(student_tuples, key=itemgetter(2), reverse=True)
[('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]
>>> sorted(student_objects, key=attrgetter('age'), reverse=True)
[('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]

排序稳定性和复杂排序

python中排序都是稳定的,也就是说如果多个元素key值一样,那么在排序后的序列中,这些元素的相对顺序与原序列一致.

>>> data = [('red', 1), ('blue', 1), ('red', 2), ('blue', 2)]
>>> sorted(data, key=itemgetter(0))
[('blue', 1), ('blue', 2), ('red', 1), ('red', 2)]

注意两个blue保持原来的顺序,因此(‘blue’, 1)在(‘blue’, 2)前面.
这个奇妙的特性可以让我们通过一系列排序来实现复杂排序.例如,要将学生按年级降序,按年龄升序排列,可以先对年龄排序,然后对年纪排序.

s = sorted(student_objects, key=attrgetter('age'))     # sort on secondary key
sorted(s, key=attrgetter('grade'), reverse=True)       # now sort on primary key, descending
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

原文地址

Sorting HOW TO

你可能感兴趣的:(Python)