Python 数据结构与算法——选取算法(TopK)

该算法要解决的问题是:在线性时间内找到一个无序序列中第 k 大的数。(或许,该程序最重要的用途是找出中间值——也就是该序列完成排序后位于中间 (1+n)/2 的元素值)。有趣的是,稍加改造,它也能找出所有比目标元素小的元素。

def partition(seq):
    pi, seq = seq[0], seq[1:]                 # 选取并移除主元
    lo = [x for x in seq if x <= pi]
    hi = [x for x in seq if x > pi]
    return lo, pi, hi

def select(seq, k):
    lo, pi, hi = partition(seq)
    m = len(lo)
    if m == k: return pi
    if m < k: return select(hi, k-m-1)
    return select(lo, k)

对 select 稍加改造,使其返回前 k 小的所有元素:

def select(seq, k):
    lo, pi, hi = partition(seq)
    m = len(lo)
    if m == k: return lo
    if m < k:
        lo.append(pi)
        return lo+select(hi, k-m-1)
    return select(lo, k)

分析与说明

  • (1)选取法(也称快速选取法,quickselect)由算法设计界的名家 C.A.R. Hoare 所提出,同时他也是快排的提出者(时年 26 岁)。


Python 数据结构与算法——选取算法(TopK)_第1张图片

  • (2)快速选取法其实代表的是某种剪枝式的遍历操作——在递归树中找出一条通往第 k 小元素的路径。

你可能感兴趣的:(算法)