C++算法之归并排序

C++算法之归并排序


文章目录

  • C++算法之归并排序
  • 一、归并排序思想
  • 二、排序步骤
  • 三、代码实现
  • 四、复杂度分析


一、归并排序思想

回顾快速排序的基本思想:找出一个分界线,并以该分界线为界将数组分为两部分,再对这两部分以同样的方式分别排序。

但是!快速排序作为一种高效率的算法,它的缺点在于算法的复杂度很依赖分界线的选取。因为这决定了左右两边划分的元素个数是否平衡

那么,我们能不能变通一下,规避这种情况带来的效率损失呢?

回忆快速排序中,正是因为分界线的存在,使得划分到两边的数字排好序后,通过分界线的连接,能够天然形成原序列的排序。但如果我们不设置分界线,而是直接把序列从中间分成相等的两份,然后两边分别排序,我们仍然可以很快地将两个有序序列合并成原序列的有序序列吗?

考虑右侧上下两个序列:
C++算法之归并排序_第1张图片
假如我们想找出这个两个序列中的最小值,它有可能出现在哪些位置呢?

因为上面的序列中,第一个元素最小,而下面的序列中,也是第一个元素最小。所以最小值只可能出现在最左边两个元素中的一个!
C++算法之归并排序_第2张图片
所以通过比较最左边元素的大小,我们很容易就知道答案序列中第一个元素是1。
C++算法之归并排序_第3张图片
同样的,剩下元素的最小值也必然出现在剩下两个序列的最左边,所以通过比较2和3的大小,我们能很容易确定答案序列中排第二的数字是2。
C++算法之归并排序_第4张图片
通过不断重复这个过程,最终我们将两个有序序列合并成了一个有序序列。
C++算法之归并排序_第5张图片
所以,我们可以用和快速排序一样的框架,即分治法,来设计一个不依赖于分界线选择的排序算法。

回顾分治法的内容:

分治思想是一种“分而治之”的思想,反应在解决问题当中,就是将一个复杂问题不断分解为规模更小、更容易解决的问题,从而提升解决问题的效率。而分治法就是基于分治思想得到的解决问题的方法,它分为下面三个步骤:

  • 问题的拆分。例如在快速排序中,我们以某个元素为分界线,将待排序的数字分为两部分。
  • 解决子问题。例如在快速排序中,如果子问题的规模为1,我们就直接解决它,否则,我们就使用和划分主问题同样的办法继续划分子问题直到子问题规模达到很容易直接解决为止。
  • 合并子问题的解。例如在快速排序中,我们将左边右边分别排序后,将前后排好序的部分与中间的分界线连接,形成主问题的解。

分治思想在算法领域有非常广泛的应用,在很多分解和合并都非常容易的问题上,分治法都能够提升其算法效率。

分治法快速排序的区别在于,划分的时候不需要设置分界线,而是直接将序列分成大小相等的左右两份。但合并时,因为没有分界线的存在,我们需要上面介绍的合并操作来将两个有序序列互相穿插,从而合并成一个有序序列。

在这里,我们将上面的合并操作称为“归并操作”。而基于分治法和归并操作形成的排序算法,我们将其称为归并排序


二、排序步骤

归并排序的算法过程:

  • 假设我们要对数组a[1..n]排序。初始化左端点l=1,右端点r=n
  • 下面假设我们对l到r子段内的数字进行划分。取l和r的中点mid,将l到mid的元素看成第一个子段的部分,将mid+1r的部分看成第二个子段的部分。两边分别进入下一层,重复调用上面的过程。直到子段长度为1,返回上一层。
  • 当算法阶段返回到当前层时,使用归并操作合并下一层的左右两个有序序列,形成本层的有序序列,继续返回上一层。
  • 当整个过程结束以后,整个序列排序完毕。

三、代码实现

代码如下(示例):

#include 
#define N 100010
using namespace std;
int n;
int a[N], b[N];

// 合并操作
void merge(int l, int r) {
    for (int i = l; i <= r; ++i) b[i] = a[i]; // 将a数组对应位置复制进辅助数组
    
    int mid = l + r >> 1;           // 计算两个子段的分界线
    int i = l, j = mid + 1;         // 初始化i和j两个指针分别指向两个子段的首位
    for (int k = l; k <= r; ++k) {  // 枚举原数组的对应位置
        if (j > r || i <= mid && b[i] < b[j]) a[k] = b[i++]; // 上文中列举的条件
        else a[k] = b[j++];
    }
}

void merge_sort(int l, int r) { // l和r分别代表当前排序子段在原序列中左右端点的位置
    if (l >= r) return;         // 当子段为空或者长度为1,说明它已经有序,所以退出该函数
    int mid = l + r >> 1;       // 取序列的中间位置,并将序列分成两部分(左右长度相差最多为1)
    merge_sort(l, mid);
    merge_sort(mid + 1, r);
    merge(l, r);                // 将l..mid和mid+1..r两个子段合并成完整的l..r的有序序列
}

int main() {
    // 输入
    scanf("%d", &n);
    for (int i = 1; i <= n; ++i) scanf("%d", &a[i]);
	
    // 归并排序 
    merge_sort(1, n);
	
    // 输出
    for (int i = 1; i <= n; ++i) printf("%d ", a[i]); 
    return 0;
}

四、复杂度分析

空间复杂度

首先该算法的空间复杂度是O(n),但尽管如此,在整个排序过程中,元素的移动借助了另一个辅助数组。所以归并排序是一种非原地排序算法

时间复杂度

因为归并排序有着和快速排序一样的框架,所以我们仍然通过分别分析每一层的时间复杂度和总层数来分析总时间复杂度。

在每一层中,问题拆分的复杂度是O(1),这是因为我们只是单纯分解,并没有枚举或者移动元素,唯一的操作仅是计算位置的分界线。对于子段解的合并,其复杂度是O(n),因为对于每个子段,我们需要将其枚举每个位置进行填写。而如果我们同时考虑整层的操作,总枚举的范围就是整个数组的范围。

那么一共有多少层呢?因为归并排序每次都是将序列平分,所以下一层子段的长度一定比上一层减少了一半,直到长度为1算法停止。所以整个算法有logn层。

所以归并排序的复杂度在任何情况下都是O(nlogn)

你可能感兴趣的:(C++算法,c++,数据结构,算法)