排序笔记

一、排序简介

我们通常所说的排序算法往往指的是内部排序算法,即数据记录在内存中进行排序。

排序算法大体可分为两种:
一种是比较排序,时间复杂度O(nlogn) ~ O(n^2),主要有:冒泡排序,选择排序,插入排序,归并排序,堆排序,快速排序等。
另一种是非比较排序,时间复杂度可以达到O(n),主要有:计数排序,基数排序,桶排序等。

稳定性:冒泡直接归并。

二、冒泡排序

参考冒泡排序

冒泡排序算法的运作如下:

  • 比较相邻的元素,如果前一个比后一个大,就把它们两个调换位置。
  • 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
  • 针对所有的元素重复以上的步骤,除了最后一个。
  • 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

对于图片上的直观理解,建议看冒泡排序中代码后面的图片。

需要注意的地方:

  • 1、因为是需要比较两个元素,所以在索引时用到了alist[i+1]的情况,因此在为了不让index超出范围,应该让for循环中的passnum-1。
  • 2、每一次循环,最大的元素都已经排到列表最后了,下一次循环就可以减短列表长度了,因此在循环结束以后需要加上passnum -= 1。

代码实现:

def bubbleSort(alist):
    #构造一个倒序列表,从而限制了每次遍历一次以后的循环长度
    passnum = len(alist)
    while passnum > 0:
        for i in range(passnum-1):
            if alist[i]>alist[i+1]:
                temp = alist[i]
                alist[i] = alist[i+1]
                alist[i+1] = temp
        passnum -= 1

alist = [54,26,93,17,77,31,44,55,20]
bubbleSort(alist)
print(alist)

冒泡的改进:鸡尾酒排序和短路冒泡排序。

三、选择排序

选择排序也是一种简单直观的排序算法。(以从小到大的排序为例。)
1、初始时在序列中找到最小元素,放到序列的起始位置作为已排序序列;
2、然后,再从剩余未排序元素中继续寻找最小元素,放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

具体操作图片见 选择排序

选择排序与冒泡排序的区别:

  • 冒泡排序通过依次交换相邻两个顺序不合法的元素位置,从而将当前最小元素放到合适的位置
  • 选择排序每遍历一次都记住了当前最小(大)元素的位置,最后仅需一次交换操作即可将其放到合适的位置。

由于选择排序需要记住的是当前最大元素的位置,因此需要设置一个index_max的变量并令初始值为0 ,接下来就要比较每个元素,循环一次,就能得到最大值的index了。
接下来就是交换元素的操作。
另外,这里的for循环中passnum应该保持不变。

代码实现:

def selectionSort(alist):
    #构造一个倒序列表,从而限制了每次遍历一次以后的循环长度
    passnum = len(alist)
    while passnum > 0:
        index_max = 0
        for i in range(passnum):
            if alist[i]>alist[index_max]:
                index_max = i
        temp = alist[passnum-1]  
        alist[passnum-1] = alist[index_max]
        alist[index_max] = temp
        passnum -= 1

alist = [54,26,93,17,77,31,44,55,20]
selectSort(alist)
print(alist)

四、插入排序

插入排序是一种简单直观的排序算法。它的工作原理非常类似于我们抓扑克牌。
如下图:

对于一个列表[5,4,2,10,7],在用插入排序到达[2,4,5,10,7]的结果时,对于最后一个元素7,从后向前进行比较,比10小,就与10交换位置,直到前面一位的元素比7小为止。

注意,在从后向前扫描的过程中,需要不断地交换两个元素的位置。

从图像上直观理解插入排序

伪代码:

  • 从第一个元素开始,该元素可以认为已经被排序
  • 取出下一个元素,在已经排序的元素序列中从后向前扫描
  • 如果该元素(已排序)大于新元素,将该元素移到下一位置
  • 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
  • 将新元素插入到该位置后
  • 重复步骤2~5

代码:
按照伪代码,此处需要加两个循环:

  • 1、一个是for循环,按照插入排序的思想,需要对列表中每个元素执行一次插入操作,从左到右。
  • 2、一个是while循环,执行比较与换位操作。
    若是前一个元素nums[cur-1]大于当前元素nums[cur],则二者互换位置
    1、while循环结束条件:
    当cur指向的元素为0即列表开头时,停止循环
    当cur元素小于等于第cur-1的元素时,目的已经达到,执行break语句。
    2、while循环改变语句:
    每循环一次,cur指针就要减1,与前面的前面的元素进行比较

代码实现:

def Insertionsort(nums):
    for i in range(len(nums)):
        cur = i
        while cur >= 1:
            if nums[cur-1] > nums[cur]:
                temp = nums[cur - 1]
                nums[cur - 1] = nums[cur]
                nums[cur] = temp
                cur -= 1
            else:
                break
    return nums

print(Insertionsort([6, 5, 4, 1, 8, 7, 2, 4 ]))

五、希尔排序

希尔排序,也叫递减增量排序,是插入排序的一种更高效的改进版本。

希尔排序是基于插入排序的以下两点性质而提出改进方法的:

  • 插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率
  • 但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位

于是,我们提出一个想法,(针对第二点)对于每个元素,每次不再只移动一位,而是“大踏步”的移动。(针对第一点)经过“大踏步”的移动以后,顺序相对好很多,此时再进行插入排序,效果会好很多。

针对上面你的想法,我们再具体的提出一些改进。
比如,对于一个有9个元素的list,我们取gap为3,先对index为0,3,6的元素进行插入排序,再对1,4,7的子列表插入排序,再对2,5,8的子列表进行插入排序。

经过对这三个子列表进行排序以后,我们发现此时的列表相对好了很多:

此时再进行插入排序,只需要再经过三次的替换就行了:

另外我们注意到,gap == 子列表数。比如,我们设定gap为3,那么子列表的数目也就是3。怎么理解呢,也很好理解:从第0位元素出发,3为gap向右走到头是sublist1,同理从第1位出发, 第2位出发,可以得到sublist2,sublist3。这三个子列表就已经把整个list给遍历完了。

也就是说,对于一个gap,我们会得到gap个子列表,而这gap个子列表的起始元素列表是

start_list = [x for i in range(gap)]

我们可以通过上面的理解,得到要进行插入排序的每个子列表的起始元素。

我们再定义一个插入排序函数,就是上一节的插入排序代码,只不过gap不再是1了。传入列表nums,子列表的起始元素start,gap,我们便可以对这个子列表进行插入排序。

而这里的希尔排序,我们不是固定了gap,我们先采用最大的gap(即len(nums)//2),然后依次将gap除以2,直到gap为1进行最后的插入排序。比如上面例子中,我们采用的是长度为9 的list,那么我们先用gap为4,此时就有四个子列表,我们对这四个子列表调用插入排序的函数。下次gap为2,就有2个子列表,再调用插入排序的函数。。。

代码思路

  • 所以需要一个while循环,循环对不同的gap进行分列表以及排序操作,循环结束条件为gap等于0.
  • while里再需要一个for循环,按照上面所说对gap子列表调用插入排序函数。
  • 定义一个传入start,gap,nums,能进行插入排序的函数。

代码实现:

def shellSort(nums):
    #gap初始化为最大的gap,然后在while循环中不断整除2,减小gap
    gap = len(nums)//2
    while gap > 0:
        #对gap个子列表调用插入排序函数
        for startposition in range(gap):
            gapInsertionSort(nums,startposition,gap)
        print("After increments of size",gap,
                                   "The list is",nums)
        gap = gap // 2

#输入nums,起始位置,gap,就可以选出子列表,并且进行插入排序
def gapInsertionSort(nums,start,gap):
    for i in range(start,len(nums),gap):
        cur = i
        while cur >= gap:
            if nums[cur - gap] > nums[cur]:
                temp = nums[cur - gap]
                nums[cur - gap] = nums[cur]
                nums[cur] = temp
                cur -= gap
            else:
                break

nums = [54,26,93,17,77,31,44,55,20]
shellSort(nums)
print(nums)

六、归并排序

参考归并排序

最易于理解的白话:首先考虑下如何将将二个有序数列合并

  • 1、这个非常简单,只要从比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。
  • 2、然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。

比如,13跟24678合并。
1跟2比较,1小于2,那么list.append(1)。
3跟2比较,2小于3,那么list.append(2)
3跟4比较,3小于4,那么list.append(3)
left数列已经为空,那么就把right的数列都append到list中。

那么归并排序呢,一样的道理。但是不一样的地方就是,一开始不是两个有序list,而是是一整个无序list,为了满足“两个有序”的要求,我们分两步:

  • 1、先把list分成left和right两个无序的部分
  • 2、把这两个无序的部分,调用函数排成两个有序的部分
    这里的两个无序的部分怎么排序成有序的部分呢。就是递归调用归并排序函数了。
  • 3、对两个有序的部分,进行上面的merge操作即可。

其中递归的地方就是,上面的第二步中,上面的

代码思路

  • 写一个对两个有序list进行归并的函数merge。传入两个有序list,返回一个合并好的list。
  • 写一个递归调用自身的归并排序函数mergesort,传入一个无序list,调用merge,返回一个有序list。内容如下
    1、把无序列表分成两个无序列表
    2、对上面两个无序列表递归调用归并排序函数mergesort,能够返回两个有序的子列表。
    3、对上一步返回的两个有序子列表,调用merge函数。

把一个list一路递归到每个list长度为1的时候,返回两个长度为2的有序list,合并后再返回两个长度为4的有序list,再合并。。一直到返回len(nums)的list。

代码来自知乎A2N
运行过程

具体细节图片参考归并排序

代码实现:

def MergeSort(lists):
    #递归结束条件,list小于等于1
    if len(lists) <= 1:
        return lists
    #把无序list分成两个部分
    num = int( len(lists)/2 )
    #对这两个无序list,递归调用归并排序函数
    left = MergeSort(lists[:num])
    right = MergeSort(lists[num:])
    #对于返回的两个有序list,调用merge函数
    return Merge(left, right)


#按照合并两个有序list的论述,定义一个合并函数
def Merge(left,right):
    r, l=0, 0
    result=[]
    while l

七、堆排序

对于堆的理解,参考树4,二叉树的特例——堆

三、快速排序

3.1、大致理解快速排序的方针

3.1.1、以中间数为基准,先把一个list分成两个大小两个区域

对于一个无序list,取index为0的元素作为中间数,然后执行分区函数,让比中间数小的点都在中间数左边,比中间数大的点都在中间数右边。此时得到了一个看似有序其实无序的list:

  • 有序体现在此时list分成了两个区域,左边的都比中间数小,右边的都比中间数大。
  • 无序体现在,而这两个区域,又都是无序的list

3.1.2、对上述的两个区域,递归调用快速排序

我们对这两个无序的list再次调用分区函数,此时会得到四个看似有序而又无序的list,接着调用分区函数,直到最终list长度为2时,再调用一次分区函数,那么一定是左边有序并且小于右边,因此此时所有的子列表都是有序的,那么此时一整个list也就是一个有序的list了。

3.2、快速排序的细节问题

3.2.1、分区函数怎么分区

我们取index为0的元素为中间数,left指针代表其指向的元素应该在中间数左边,即小于中间数;right代表其指向的元素应该在中间数右边,大于中间数。而实际情况不会这么完美,于是我们进行下面这样的操作,如下图:

排序笔记_第1张图片
图1

无序列表为nums,对于我们要执行分区函数的列表调用分区函数:

  • 一开始我们选54作为中间节点,定义left指针指向index为1的元素,right指向列表的最后一个元素。左右指针开始汇合;
  • 一开始左指针指向元素为26,小于54,说明这个元素的位置是正确的,则左指针加1向右移动,指向96时,这个元素位置是错误的,暂时停止left的移动
  • 同理,我们移动右指针,直到找到错误的元素,为20
  • 对这两个位置错误的元素,调换位置,然后再接着移动左右指针。
排序笔记_第2张图片
图2

移动过程中发现位置错误的元素,继续调换位置。
直到最后这种情况:

排序笔记_第3张图片
图3

此时左指针指向77停止,右指针指向31停止,但是此时左指针大于右指针了,说明他俩指向了两人已经工作过的区域了,此时不用再调换位置了。直接替换右指针指向元素与中间数,就能得到一个,已经分好区域的list了。左右两个区域。

3.2.2、怎么调用递归函数使得能够继续分区

上面我们其实会得到两个小的无序的区域,以什么划分这两个区域呢(注意中间数不用再掺和进去了),就是中间元素的index啊。于是:

  • 左边的无序区域为nums[first:index-1]
  • 右边的无序区域为nums[index+1,last]
    于是对这两个区域再调用递归函数即可。

3.3、代码思路:

3.3.1、定义快排函数quickSort()

根据上面所说,递归调用的函数,需要传入三个参数,一个是列表nums,还有两个是用来划分需要快排区域的参数first和last。
而一开始我们只能传入一个参数就是列表nums。
因此我们定义一个辅助函数quickSortHelper(),既能用来递归调用快排操作,又能传入三个参数。
初始化中,传入的三个参数分别是nums,first = 0,last = len(nums) - 1

3.3.2、定义递归调用函数partition()

此函数传入三个参数,列表nums,以及用来划分要对列表进行快排操作的区域指针,first和last
执行此函数后,函数会将要分区的列表区域进行分区。

  • 1、递归结束条件是first小于last
  • 2、函数改变条件,每次传入的需要排序的区域指针都会不断改变,直到first大于last截止
    函数里面调用一次分区函数,返回中间数的index,用来改变下次调用递归函数的first与last。
    其中左半部分区域为first,index-1.右半部分为index+1,last
  • 递归调用,上一步,得到递归调用的区域,直接递归调用两次快排函数即可。

3.3.3、定义分区函数

此函数传入三个参数,列表nums,以及用来划分要对列表进行快排操作的区域指针,first和last

  • 1、用一个“大”while循环来执行错误元素换位的情况,循环结束的条件为左指针大于右指针。

  • 2、里面再用“小”while循环来执行移动指针的情况,当指针指向元素相对中间数“正确”时,就继续执行循环移动指针。
    需要用到两个while,一个控制左指针,一个控制右指针。

  • 3、当上述两个“小”while循环结束时,说明左右指针都指向了相对错误的元素,此时分为两种情况:
    1、左指针小于右指针:说明此时分区工作还没结束,对两个元素进行换位(上面的图1跟图2),继续执行元素换位的“大”while。
    2、左指针大于右指针:说明此时的分区工作已经结束了,对右指针指向的元素与中间数进行换位(上面的图3),并且结束最外面的while循环。

  • 4、循环结束,可以返回中间数的index了,留着下一次递归调用函数的时候使用。

图片理解参考 快速排序

代码实现:


def quickSort(alist):
    quickSortHelper(alist, 0, len(alist) - 1)

def quickSortHelper(alist, first, last):
    if first < last:
        splitpoint = partition(alist, first, last)
        # 得到中点正确的位置,限制下面两个递归的边界
        quickSortHelper(alist, first, splitpoint - 1)
        quickSortHelper(alist, splitpoint + 1, last)

def partition(alist,first,last):
    pivotvalue = alist[first]
    leftmark = first+1
    rightmark = last
    done = False
    while not done:
        #如果左指针小于右指针,并且左指针指向的元素小于等于中间数,那么左指针就继续走
        while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
            leftmark = leftmark + 1
        #如果左指针小于等于右指针,并且右指针指向元素大于等于中间数,右指针就继续走
        while rightmark >= leftmark and alist[rightmark] >= pivotvalue:
            rightmark = rightmark -1

        #左指针大于右指针时,done为True,结束循环
        if rightmark < leftmark:
            done = True
        #经过上面的指针操作以后,如果左指针还是小于右指针,则替换二者指向元素
        else:
            temp = alist[leftmark]
            alist[leftmark] = alist[rightmark]
            alist[rightmark] = temp

    #done为True,结束循环,替换中间元素与右指针指向元素的位置
    temp = alist[first]
    alist[first] = alist[rightmark]
    alist[rightmark] = temp
    ##返回此时中点的位置,用于下次递归分类划分左右部分
    return rightmark

alist = [54,26,93,17,77,31,44,55,20]
quickSort(alist)
print(alist)
排序笔记_第4张图片

你可能感兴趣的:(排序笔记)