归并排序采用分治的方法。
对归并排序来说:
如果对Merge的每个递归调用都声明一个临时数组,那么任一时刻可能会有logN个临时数组处于活动期,这对小内存机器是致命的。另一方面,如果Merge动态分配并释放最小量临时空间,那么由malloc占用的时间会很多。由于Merge位于MSort的最后一行,可以在MergeSort中建立该临时数组。因此在任一时刻只需要一个临时数组活动,而且可以使用该临时数组的任意部分;我们将使用和输入数组array相同的部分。这样的话,该算法的空间占用为N,N是待排序的数组元素个数。
/*
tmp_array[]:辅助数组。
left_pos:数组左半部分的游标
left_end:左边数组的右界限
*/
void Merge(int array[], int tmp_array[], int left_pos, int right_pos, int right_end) {
int i, left_end, num_elements, tmp_pos;
left_end = right_pos - 1;
tmp_pos = left_pos;
num_elements = right_end - left_pos + 1;
while (left_pos <= left_end && right_pos <= right_end)
if (array[left_pos] <= array[right_pos])
tmp_array[tmp_pos++] = array[left_pos++];
else
tmp_array[tmp_pos++] = array[right_pos++];
while (left_pos <= left_end)
tmp_array[tmp_pos++] = array[left_pos++];
while (right_pos <= right_end)
tmp_array[tmp_pos++] = array[right_pos++];
for (i = 0; i < num_elements; i++, right_end--)
array[right_end] = tmp_array[right_end];
}
void MSort(int array[], int tmp_array[], int left, int right) {
int center;
if (left < right) {
center = (left + right) / 2;
MSort(array, tmp_array, left, center);
MSort(array, tmp_array, center + 1, right);
Merge(array, tmp_array, left, center + 1, right);
}
}
void MergeSort(int array[], int n) {
int *tmp_array;
//上面文字部分给出了为什么在MergeSort中建立临时数组tmp_array
tmp_array = (int *)malloc(n * sizeof(int));
if (tmp_array != NULL) {
MSort(array, tmp_array, 0, n - 1);
free(tmp_array);
}
else
cout << "malloc failed" << endl;
}
对于重要的内部排序应用而言,往往选择快速排序。合并的方法是大多数外部排序算法的基石。
------------------------------------------------------分割------------------------------------------------------------------
空间复杂度为o(1)的归并排序代码:github(点击打开链接)
摘录如下:
//空间复杂度为O(1)的归并排序
#include
using namespace std;
void reverse_array(int a[], int n) {
int i = 0;
int j = n - 1;
while (i < j) {
swap(a[i], a[j]);
++i;
--j;
}
}
void exchange(int a[], int length, int length_left) {
reverse_array(a, length_left);
reverse_array(a + length_left, length - length_left);
reverse_array(a, length);
}
void Merge(int a[], int begin, int mid, int end) {
while (begin < mid && mid <= end) {
int step = 0;
while (begin < mid && a[begin] <= a[mid])
++begin;
while (mid <= end && a[mid] <= a[begin]) {
++mid;
++step;
}
exchange(a + begin, mid - begin, mid - begin - step);
}
}
void MergeCore(int a[], int left, int right) {
if (left < right) {
int mid = (left + right) / 2;
MergeCore(a, left, mid);
MergeCore(a, mid + 1, right);
Merge(a, left, mid + 1, right);
}
}
void MergeSort(int a[], int length) {
if (a == NULL || length < 1)
return;
MergeCore(a, 0, length - 1);
}
int main() {
int a[] = {1,0,2,9,3,8,4,7,6,5,11,99,22,88,11};
int length = sizeof(a) / sizeof(int);
MergeSort(a, length);
for (int i = 0; i < length; i++)
cout << a[i] << " ";
cout << endl;
return 0;
}
下面的文章给出了在空间复杂度O(1)的条件下实现归并排序
原文如下:
第一:对一个L1,L2,的子序列,分别长度为,m,n.可以用min(m,n)的空间协助进行归并排
序,且仅对该额外空间的值得顺序有影响。详细参见sara basse的那本算法书.
第二:对于一个已经排序的L1,L2,总长度假定为u,为了方便分析,假定L1的长度=L2的长度=u/2,切分成sqrt(u)的个
块,每个快有sqrt(u)个数,然后对L1,的最后一块和L2的最后一块归并,L2的最后一
块存放全部数据的最大数据,同时也是利用L2的这个最后一块作为下面归并的额外空间。
第三:对剩余的块(除L2最后一块,那块存放最大元素的那块),按照块的最小元素排序,之后依次归并相邻块。
第四:对最后一块进行排序,因为他作为额外空间,参与了两两相邻的块排序,自己的顺序不能保证,所以最后还要排序一次。
这种方法的正确性可以这样来简单解释
由于最后的分块都是从L1或者L2中切下来的。
那么第i块,第i+1块和第i+2块(如果按照最小元素排序的话)
不妨假定第i块来自L1,第i+1块来自L2。(i,i+1,i+2,是切下来后的编号,例如例子中第1块是1 4 6 15是L1的第一块,第2块2 3 4 16是L2的第1块)
那么i+2块可能来自哪里呢?要么是原L1块在第i块后面,要么是原L2块在i+1块后面的块。也就是第i+1块至少比N个数要大(N为块内数目),换言之i和i+1块归并后的最小块i'块均比i+1块小,这一点是本算法的难点,想明白后,就不难理解了。
因此i和i+1这两块归并后的i‘块的最大元素,一定比i+1块的最小元素要小,因此正确性可以保证。
画个图来举例:
图1 通过对L1和L2的最大块进行归并,用一个4个元素的交换空间,得到L1&L2的最大块22 23 24 25
图2 将归并顺序按照块最小元素的顺序进行归并,并利用交换空间
图3 利用交换空间归并的过程,注意归并后交换空间的数依然是22 23 24 25,但顺序已经变了,因此在归并到最后还需要再排序一次
4 5 6 15 和 16 17 20 21的归并不再图示。