❖插入排序时间复杂度仍然是O(n2),但算法思路与冒泡排序、选择排序不同
❖插入排序维持一个已排好序的子列表,其位置始终在列表的前部,然后逐步扩大这个子列表直到全表
❖第1趟,子列表仅包含第1个数据项,将第2个数据项作为“新项”插入到子列表的合适位置中,这样已排序的子列表就包含了2个数据项
❖第2趟,再继续将第3个数据项跟前2个数据项比对,并移动比自身大的数据项,空出位置来,以便加入到子列表中
❖经过n-1趟比对和插入,子列表扩展到全表,排序完成
❖插入排序的比对主要用来寻找“新项”的
插入位置
❖最差情况是每趟都与子列表中所有项进行比对,总比对次数与冒泡排序相同,数量级仍是O(n2)
❖最好情况,列表已经排好序的时候,每趟仅需1次比对,总次数是O(n)
插入排序:思路
源码:
def insertSort(alist):
for index in range(len(alist)):
#插入项
currentvalue = alist[index]
position = index
while position > 0 and alist[position-1] > currentvalue:
alist[position] = alist[position-1] #移动对比
position = position - 1
alist[position] = currentvalue
return alist
testlist = [1,2,6,4,8,5,7,3]
print(insertSort(testlist))
❖ 我们注意到插入排序的比对次数,在最好的情况下是O(n),这种情况发生在列表已是有序的情况下,实际上,列表越接近有序,插入排序的比对次数就越少
❖ 从这个情况入手,谢尔排序以插入排序作为基础,对无序表进行“间隔”划分子列表,每个子列表都执行插入排序
def shellSort(alist):
sublistcount = len(alist)//2 #间隔设定
while sublistcount > 0 :
for startposition in range(sublistcount):
#调用插入排序为子系列排序
alist = gapInsertSort(alist,startposition,sublistcount)
sublistcount = sublistcount//2 #缩小间隔
return alist
def gapInsertSort(alist,start,gap):
for index in range(start+gap,len(alist),gap):
currentvalue = alist[index]
position = index
while position >=gap and alist[position-gap] > currentvalue:
alist[position] = alist[position - gap]
position = position - gap
alist[position] = currentvalue
return alist
testlist = [1,2,6,4,8,5,7,3]
print(shellSort(testlist))
❖粗看上去,谢尔排序以插入排序为基础,可能并不会比插入排序好
❖但由于每趟都使得列表更加接近有序,这过程会减少很多原先需要的“无效”比对
对谢尔排序的详尽分析比较复杂,大致说是介于O(n)和O(n2)之间
❖如果将间隔保持在2k-1(1、3、5、7、15、31等等),谢尔排序的时间复杂度约为O(n3/2)