[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分

前言

        在[C/C++]排序算法 快速排序 (递归与非递归)一文中,对于快速排序的单趟排序一共讲了三种方法: hoare挖坑法双指针法 ,这三种方法实现的快速排序虽然在一般情况下效率很高,但是如果待排序数据存在大量重复数据,那这几种方法的效率就很低,而为了解决快速排序在这样特殊情况下效率低下的问题, 三路划分就可以完美解决

三路划分

思想:

        对于上述三种方法,其本质都是选定数组开头元素作特定值,让小的数据放左边,大的数据放右边。而三路划分顾名思义就是通过处理将数据分为三个部分 [小于特定值的部分   等于特定值的部分  大于特定值的部分] ,这样划分好后,只需要对小于特定值的部分和大于特定值的部分进行递归排序即可,中间的数据就不需要处理了,相比于上述三种方法效率提升很大,并且重复数据越多排序效率越快,当带排序数据全为重复数据时,时间复杂度甚至可以达到O(N)。

算法实现

首先我们定义一个cur指针指向begin的下一个元素,将begin开始所指元素定为关键值key

比较a[cur]与key的值,会出现三种情况

  1. 若a[cur]
  2. 若a[cur]>key,交换a[end]和a[cur],end--
  3. 若a[cur]==key,cur++

重复比较操作,直到cur>end

[解释]:

为什么a[begin]和a[cur]交换后, cur要++, 而a[end]和a[cur]交换后,cur不和情况1一样++呢?

        因为a[end]和a[end]交换,目的是让大于key的值放到后面,而end所指元素我们不知道其与key的大小关系,所以下一次循环,还得判断其与key的关系才行,cur++会跳过这个元素。而begin初始所指元素就是关键值key, 当第一次找到比key小的数让两者交换,此时cur所指元素就是关键值,再仔细揣摩一下,只有小的数往左放的时候begin才会++,碰到大的数会把他往后放,放完还得比较当前cur所指的元素,碰到与key相同的元素不交换,cur往后走,这样我们会发现begin只会指向和key一样大的元素,所以交换完后,cur可以++。


单趟排序图解如下:

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第1张图片

a[cur]

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第2张图片

a[cur]

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第3张图片

a[cur]==key, cur++

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第4张图片

a[cur]==key, cur++

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第5张图片

a[cur]>key,交换a[end]和a[cur],end--

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第6张图片

a[cur]==key, cur++

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第7张图片

a[cur]==key, cur++,此时cur>end,排序完成,将数据分为了三个部分

[排序算法] 如何解决快速排序特殊情况效率低的问题------三路划分_第8张图片

因为单趟排序排好后划分了三个部分,我们处理两边的部分需要返回两个值,所以就不单独封装三路划分的单趟排序了

代码如下:

void swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}

int GetMid(int* a, int begin, int end)
{
	int mid = (begin + end) / 2;
	if (a[begin] > a[mid])
	{
		if (a[mid] > a[end])
			return mid;
		else if (a[begin] > a[end])
			return end;
		else
			return begin;
	}
	else
	{
		if (a[begin] > a[end])
			return begin;
		else if (a[mid] > a[end])
			return end;
		else
			return mid;
	}
}

void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;

	int mid = GetMid(a, begin, end);
	swap(&a[begin], &a[mid]);

    //由于begin和end要改变,提前保存,便于递归使用
	int left = begin;
	int right = end;

	int cur = begin + 1;
	int key = a[begin];

	while (cur <= end)
	{
		if (a[cur] < key)
		{
			swap(&a[cur], &a[begin]);
			begin++;
			cur++;
		}
		else if (a[cur] > key)
		{
			swap(&a[cur], &a[end]);
			end--;
		}
		else
		{
			cur++;
		}
	}
	QuickSort(a, left, begin - 1);
	QuickSort(a, end + 1, right);
}

你可能感兴趣的:(数据结构,排序算法,算法,数据结构)