数据结构:排序解析

文章目录

  • 前言
  • 一、常见排序算法的实现
    • 1.插入排序
      • 1.直接插入排序
      • 2.希尔排序
    • 2.交换排序
      • 1.冒泡排序
      • 2.快速排序
        • 1.hoare版
        • 2.挖坑版
        • 3.前后指针版
        • 4.改进版
        • 5.非递归版
    • 3.选择排序
      • 1.直接选择排序
      • 2.堆排序
    • 4.归并排序
      • 1.归并排序递归实现
      • 2.归并排序非递归实现
    • 5.计数排序
  • 二、排序算法复杂度及稳定性
  • 排序测试

前言

所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序在我们生活中非常常见,比如买东西看的销量,价格的对比等。排序也分为内部排序和外部排序。内部排序是数据元素全部放在内存中的排序,外部排序则是数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。下面让我们正式认识排序吧。

一、常见排序算法的实现

1.插入排序

把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列。

1.直接插入排序

void  InsertSort(int* nums, int numsSize)
{
	int i = 0;
	//i变量控制的是整个比较元素的数量
	for (i = 0; i < numsSize; i++)
	{
 		int num = nums[i];
		//从后面一次和前面的元素进行比较,前面的元素大于后面的数据,则前面的元素向后移动
 		int j = i - 1;
 		while (j > -1)
 		{
 			if (nums[j] > num)
 			{
				//要交换的元素小于前一个元素
 				nums[j + 1] = nums[j];
 				j--;
 			}
 			else
 			{
 				break;
 			}
 		}
		//把该元素填到正确的位置
 		nums[j + 1] = num;
	}
}

数据结构:排序解析_第1张图片
测试用例:

void sortArray(int* nums, int numsSize)
{
	InsertSort(nums, numsSize);//插入排序
}
void print(int* nums, int numsSize)
{
	int i = 0;
	for (i = 0; i < numsSize; i++)
	{
		printf("%d ", nums[i]);
	}
}
int main()
{
	int nums[] = { 3,9,0,-2,1 };
	int numsSize = sizeof(nums) / sizeof(nums[0]);//计算数组大小
	sortArray(nums, numsSize);//调用排序算法
	print(nums, numsSize);//打印排序结果
	return 0;
}

数据结构:排序解析_第2张图片
直接插入排序的优点:元素集合越接近有序,直接插入排序算法的时间效率越高。
时间复杂度:O(N ^2)
空间复杂度O(1)
直接插入排序是一种稳定的排序算法。

2.希尔排序

将待排序的序列分成若干个子序列,对每个子序列进行插入排序,使得整个序列基本有序,然后再对整个序列进行插入排序。是插入排序的改进

void ShellSort(int* nums, int numsSize)
{
    int group = numsSize;
    while (group > 1)
    {
        //进行分组
        //加1为了保证最后一次分组为1,组后一次必须要进行正常的插入排序
 	    group = group / 3 + 1;
 	    int i = 0;
        //每次对分的组进行排序
        //和插入排序思路相同
 	    for (i = 0; i < numsSize; i++)
 	    {
 		    int num = nums[i];
 		    int j = i - group;
 		    while (j >= 0)
 		    {
 			    if (nums[j] > num)
 			    {
 				    nums[j + group] = nums[j];
 				    j -= group;
 			    }
 			    else
 			    {
 				    break;
 			    }
 		    }
 		    nums[j + group] = num;
 	    }
    }
}

数据结构:排序解析_第3张图片
group为1时为插入排序,必须要保证最后一次group为1,这样排序才能正确。希尔排序法也称缩小增量法
希尔排序是对直接插入排序的优化。
会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
当group > 1时都是预排序,目的是让数组更接近于有序,让大的数能更快到达后面,小的数可以更快到达前面。当group = 1时,数组已经接近有序的了,这时间使用插入可以让插入排序时间复杂度接近O(N)。从而达到优化效果。希尔排序的时间复杂度大约为O(N^1.3)。
测试用例:

void sortArray(int* nums, int numsSize)
{
	//InsertSort(nums, numsSize);//插入排序
    ShellSort(nums, numsSize);//希尔排序
}
int main()
{
	int nums[] = { 3,9,0,-2,1 };
	int numsSize = sizeof(nums) / sizeof(nums[0]);//计算数组大小
	sortArray(nums, numsSize);//调用排序算法
	print(nums, numsSize);//打印排序结果
	return 0;
}

数据结构:排序解析_第4张图片

2.交换排序

1.冒泡排序

void BubbleSort(int* nums, int numsSize)
{
    int i = 0;
    //控制循环次数
    for (i = 0; i < numsSize; i++)
    {
 	    int j = 0;
        //用记录该数组是否有序可以提前退出循环
 	    int flag = 0;
        //用来控制比较次数
 	    for (j = 0; j < numsSize - i - 1; j++)
 	    {
 		    if (nums[j + 1] < nums[j])
 		    {
 			    swap(&nums[j], &nums[j + 1]);
 			    flag = 1;
 		    }
 	    }
        //当该此循环不在进行交换则证明数组已经有序,可以提前退出循环
 	    if (flag == 0)
 	    {
 		    break;
 	    }
    }
}

数据结构:排序解析_第5张图片
冒泡排序非常容易理解,它的时间复杂度为O(N^2) ,空间复杂度:O(1)且很稳定。

2.快速排序

任取待排序元素序列中的某元素作为标准值,按照该排序码将待排序集合分成两段,左边中所有元素均小于该值,右边中所有元素均大于该值,然后左右两边重复该过程,直到所有元素都排列在相应位置上为止。

1.hoare版

void PartSort1(int* nums, int left, int right)
{
    //当区间不存在或者区间只有一个数时结束递归
    if (left >= right)
    {
 	    return ;
    }
    int key = left;
    int begin = left;
    int end = right;
    while (begin < end)
    {
 	    //右边先走,目的是结束是相遇位置一定比key值小
        //开始找比选定值小的元素
 	    while ((begin < end) && (nums[key] <= nums[end]))
 	    {
            end--;
 	    }
        //开始找比选定值大的元素
 	    while ((begin < end) && (nums[begin] <= nums[key]))
 	    {
            begin++;
 	    }
        //把两个数进行交换
 	    swap(&nums[begin], &nums[end]);
    }
    //把关键值和相遇点的值进行交换,由于右边先走,相遇值一定小于关键值
    swap(&nums[key], &nums[begin]);
    key = begin;
    //开始递归左边区间
    PartSort1(nums, left, key - 1);
    //开始递归右边区间
    PartSort1(nums, key + 1, right);
}

数据结构:排序解析_第6张图片

分别递归左右区间,直到递归为不可在分割的区间,是分治算法,每次递归都会有一个数回到正确的位置。

2.挖坑版

 void PartSort2(int* nums, int left, int right)
 {
 	if (left >= right)
 	{
 		return;
 	}   
 	int hole = left;//坑的位置    
 	int key = nums[left];//记录初始坑位置的值
 	int begin = left;
 	int end = right;
 	while (begin < end)
 	{
 		while ((begin < end) && (key <= nums[end]))
 		{
 			end--;
 		}   
 		nums[hole] = nums[end];//把小于初始坑位置的填到坑中
 		hole = end;//更新坑的位置
 		while ((begin < end) && (nums[begin] <= key))
 		{
 			begin++;
 		}
 		nums[hole] = nums[begin];//把大于初始坑位置的填到坑中
 		hole = begin;//更新坑的位置
 	}
    //坑的位置放置初始坑位置的值
 	nums[begin] = key;
    //开始递归左边区间
 	PartSort2(nums, left, hole - 1);
    //开始递归右边区间
 	PartSort2(nums, hole + 1, right);
 }

数据结构:排序解析_第7张图片
注意要先将第一个数据存起来,形成第一个坑位才可以进行覆盖。

3.前后指针版

void PartSort3(int* nums, int left, int right)
 {
 	if (left >= right)
 	{
 		return;
 	}
    //记录关键值
 	int key = nums[left];
    //快指针为关键值的下一个位置
 	int fast = left + 1;
    //慢指针为关键值的位置
 	int slow = left;
 	while (fast <= right)
 	{
        //当快指针的值小于关键值时
 		if (nums[fast] < key)
 		{
            //当慢指针的下一个不为快指针时则不进行交换
 			if (++slow != fast)
 			{
 				swap(&nums[fast], &nums[slow]);				
 			}
 		}
        //对快指针进行移动
 		fast++;
        //简写形式
 		//if (nums[fast] < key && ++slow != fast)
 		//{
 		//	swap(&nums[slow], &nums[fast]);
 		//}
 		//++fast;
 	}
    //关键值的位置和慢指针进行交换
 	swap(&nums[left], &nums[slow]);
    //开始递归左边区间
 	PartSort3(nums, left, slow - 1);
    //开始递归右边区间
 	PartSort3(nums, slow + 1, right);
 }

数据结构:排序解析_第8张图片

4.改进版

当要排序的区间为有序时,我们排序就是最坏的情况,这时间就需要我们进行优化一下。
我们要加三数取中操作。

//三数取中
void middle(int* nums, int left, int right)
{
    //找到中间的数,交换到数组开头,因为我们关键值选则的为数组的左边值
    int middle = (left + right) / 2;
    if (nums[left] < nums[middle])
    {
        if (nums[middle] < nums[right])
        {
            swap(&nums[left], &nums[middle]);
        }
        else
        {
            swap(&nums[left], &nums[right]);
        }
    }
    else
    {
        if (nums[right] < nums[left])
        {
            swap(&nums[left], &nums[right]);
        }
    }
}
void QuickSort(int* nums, int left, int right)
{
    if (left >= right)
    {
        return;
    }
    middle(nums, left, right);//把中间值换到排序的开始位置
    int key = left;
    int begin = left;
    int end = right;
    while (begin < end)
    {
        //右边先走,目的是结束是相遇位置一定比key值小
        while ((begin < end) && (nums[key] <= nums[end]))
        {
            end--;
        }
        while ((begin < end) && (nums[begin] <= nums[key]))
        {
            begin++;
        }
        swap(&nums[begin], &nums[end]);
    }
    swap(&nums[key], &nums[begin]);
    key = begin;
    QuickSort(nums, left, key - 1);
    QuickSort(nums, key + 1, right);
}

我们实现的版本1的改进,版本2和3改进同理,只是增加一个调用函数。

5.非递归版

当我们拍的数据递归调用太深的情况就会造成栈破坏,所以非递归版本的快排也是重中之重。让我们实现一下吧。非递归中我们用到之前学的栈来辅助我们完成。

void QuickSortNonR(int* nums, int left, int right)
{
    Stack st;//创建栈
    StackInit(&st);//初始话栈
    StackPush(&st, right);//把要排序的右边界入栈,这时会先左边界先出栈
    StackPush(&st, left);//把要排序的左边界入栈
    while (!StackEmpty(&st))//如果栈不为空,则一直进行循环
    {
 	    int left = StackTop(&st);//获得要排序的左边界
 	    StackPop(&st);//把左边界出栈
 	    int right = StackTop(&st);//获得要排序的右边界
 	    StackPop(&st);//把右边界出栈
 	    if (left >= right)//如果边界不合法则跳过本次循环
 	    {
 		    continue;
 	    }
        //快速排序版本1
 	    int key = left;
 	    int begin = left;
 	    int end = right;
 	    while (begin < end)
 	    {
 		    //右边先走,目的是结束是相遇位置一定比key值小
 		    while ((begin < end) && (nums[key] <= nums[end]))
 		    {
 			    end--;
 		    }
 		    while ((begin < end) && (nums[begin] <= nums[key]))
 		    {
 			    begin++;
 		    }
 		    swap(&nums[begin], &nums[end]);
 	    }
 	    swap(&nums[key], &nums[begin]);
 	    key = begin;
 	    StackPush(&st, key-1);//把左边界的结束位置入栈
 	    StackPush(&st, left);//把左边界的起始位置入栈
 	    StackPush(&st, right);//把右边界的结束位置入栈
 	    StackPush(&st, key+1);//把右边界的起始位置入栈
    }
    StackDestroy(&st);//销毁栈
}

数据结构:排序解析_第9张图片
快排在一般情况下效率非常高,且可以搭配其他排序进行小区间优化。它的时间复杂度为O(N*logN),空间复杂度为O(logN),但不稳定

3.选择排序

每一次从待排序的数据元素中选出最小(或最大)的一个值,存放在数据的起始位置,直到全部待排序的数据元素排完。

1.直接选择排序

void SelectSort(int* nums, int numsSize)
{
    int i = 0;
    for (i = 0; i < numsSize; i++)
    {
 	    int min = i;//记录最小数的下标
 	    int j = 0;
 	    for (j = i; j < numsSize; j++)//开始寻找最小数
 	    {
 		    if (nums[j] < nums[min])
 		    {
 			    min = j;//记录下标
 		    }
 	    }
 	    if (min != i)
 	    {
 		    swap(&nums[min], &nums[i]);//如果最小数和开始位置不相同则进行交换
 	    }
    }
}

数据结构:排序解析_第10张图片
直接选择排序非常好理解,但是效率太低。实际中很少使用

2.堆排序

堆的思想和树一样。堆排序是指利用堆积树(堆)这种数据结构所设计的一种排序算法,我们升序要建大堆,降序要建小堆

void AdjustDwon(int* nums, int n, int root)
{
    int left = root * 2 + 1;
    while (left < n)
    {
 	    if (((left + 1) < n) && (nums[left] < nums[left + 1]))//当右子树存在并且右子树的值大于左子树
 	    {
 		    left = left + 1;//更新节点的下标
 	    }
 	    if (nums[root] < nums[left])
 	    {
 		    swap(&nums[root], &nums[left]);//如果根节点小于孩子节点,就进行交换
 		    root = left;//更新根节点
 		    left = root * 2 + 1;//更新孩子节点
 	    }
 	    else//已符合大堆结构,跳出循环
 	    {
 		    break;
 	    }
    }
}
//建大堆
void HeapSort(int* nums, int numsSize)
{
    int i = 0;
    //从第一个非叶子节点开始进行建堆,当左右都为大堆时才会排根节点
    for (i = (numsSize - 1 - 1) / 2; i >= 0; --i)
    {
 	    AdjustDwon(nums, numsSize, i);
    }
    while (numsSize--)
    {
 	    swap(&nums[0], &nums[numsSize]);//如果根节点小于孩子节点,就进行交换
 	    //调整堆结构
 	    AdjustDwon(nums, numsSize, 0);
    }
}

数据结构:排序解析_第11张图片

堆排序使用堆来选数,效率比直接排序高很多。它的时间复杂度为O(N*logN),且空间复杂度为O(1),但是不稳定。

4.归并排序

归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法。先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表。归并需要一个临时的空间来存放子序列,用来拷贝到源序列中

1.归并排序递归实现

void MergeSort(int* nums, int left, int right,int *tmp)
{
    if (left >= right)
    {
 	    return;
    }
    //把区间拆分为两段
    int middle = (left + right) >> 1;
    //拆分
    MergeSort(nums, left, middle, tmp);
    MergeSort(nums, middle+1, right, tmp);
    //归并
    int begin1 = left;
    int begin2 = middle + 1;
    int end1 = middle;
    int end2 = right;
    int i = 0;
    //和链表的链接差不多
    //直到有一个区间结束结束循环
    while ((begin1 <= end1) && (begin2 <= end2))
    {
        //那个值小那个值进入开辟的数组
 	    if (nums[begin1] <= nums[begin2])
 	    {
 		    tmp[i++] = nums[begin1++];
 	    }
 	    else
 	    {
 		    tmp[i++] = nums[begin2++];
 	    }
    }
    //找到未完全结束的数组,并且把数组中的元素尾加到开辟的数组中
    while (begin1 <= end1)
    {
 	    tmp[i++] = nums[begin1++];
    }
    while (begin2 <= end2)
    {
 	    tmp[i++] = nums[begin2++];
    }
    //把开辟的数组中的内容拷贝到源数组中
    //拷贝时要注意拷贝时的位置
    memcpy(nums + left, tmp, (right - left + 1) * sizeof(int));
}

数据结构:排序解析_第12张图片

2.归并排序非递归实现

void MergeSortNonR(int* nums, int numsSize, int* tmp)
{
    //归并所用的数
    int gap = 1;
    int i = 0;
    while(gap < numsSize)//当归并使用的数小于数组大小时进行循环
    {
 	    for (i = 0; i < numsSize;)//用i来控制归并的位置
 	    {
 		    int begin1 = i;
 		    int begin2 = i + gap;
 		    int end1 = i + gap - 1;
 		    int end2 = i + 2 * gap - 1;
            //当end1越界时进行修正,此时begin2和end2都会越界时进行修正
 		    if (end1 > numsSize - 1)
 		    {
 			    end1 = numsSize - 1;
 			    begin2 = numsSize + 1;
 			    end2 = numsSize;
 		    }
            //当begin2越界时进行修正,此时end2也会越界
 		    else if (begin2 > numsSize - 1)
 		    {
 			    begin2 = numsSize + 1;
 			    end2 = numsSize;
 		    }
            //当end2越界时进行修正
 		    else if(end2 > numsSize - 1)
 		    {
 			    end2 = numsSize - 1;
 		    }
            //开始进行归并
 		    while ((begin1 <= end1) && (begin2 <= end2))
 		    {
 			    if (nums[begin1] <= nums[begin2])
 			    {
 				    tmp[i++] = nums[begin1++];
 			    }
 			    else
 			    {
 				    tmp[i++] = nums[begin2++];
 			    }
 		    }
            //找到未结束的数组插入到临时数组中
 		    while (begin1 <= end1)
 		    {
 			    tmp[i++] = nums[begin1++];
 		    }
 		    while (begin2 <= end2)
 		    {
 			    tmp[i++] = nums[begin2++];
 		    }
 	    }
        //把临时数组的内容拷贝到源数组中
 	    memcpy(nums, tmp, numsSize * sizeof(int));
        //把归并的范围扩大
 	    gap *= 2;
    }
}

数据结构:排序解析_第13张图片
归并排序的非递归要注意边界的修正,不然会产生越界的情况。
归并的缺点在于需要O(N)的空间,但归并排序的思考更多的是解决在磁盘中的外排问题。可以当内排序,也可以当外排序使用,且时间复杂度为O(N*logN),是一种稳定的排序。

5.计数排序

void CountSort(int* nums, int numsSize)
{
	int i = 0;
	int min = nums[i];
	int max = nums[i];
    //找到原数组中的最大值和最小值
	for (i = 0; i < numsSize; i++)
	{
		if (min > nums[i])
		{
			min = nums[i];
		}
		if (max < nums[i])
		{
			max = nums[i];
		}
	}
    //计算出排序中最大和最小值的差,加上1为要开辟临时数组的大小
	int num = max - min + 1;
    //创建相应的大小的空间
	int* tmp = (int*)malloc(sizeof(int) * num);
    //对创建的空间进行初始话,把里面的元素全部置0
	memset(tmp, 0, sizeof(int) * num);
    //遍历原数组,把该元素值的下标映射到临时数组中
	for (i = 0; i < numsSize; i++)
	{
		tmp[nums[i] - min]++;
	}
	int j = 0;
    //遍历临时数组,把该元素不为0的恢复原值拷贝到原数组中
	for (i = 0; i < num; i++)
	{
		while (tmp[i]--)
		{
			nums[j++] = i + min;
		}
	}
	free(tmp);
}

数据结构:排序解析_第14张图片
计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。

二、排序算法复杂度及稳定性

排序方法 平均情况 最好情况 最坏情况 空间消耗 稳定性
直接插入排序 O(N^2) O(N) O(N^2) O(1) 稳定
希尔排序 O(N*logN)~O(N^2) O(N^1.3) O(N^2) O(1) 不稳定
冒泡排序 O(N^2) O(N) O(N^2) O(1) 稳定
快速排序 O(N*logN) O(N*logN) O(N^2) O(N*logN)~O(N) 不稳定
选择排序 O(N^2) O(N^2) O(N^2) O(1) 不稳定
堆排序 O(N*logN) O(N*logN) O(N*logN) O(1) 不稳定
归并排序 O(N*logN) O(N*logN) O(N*logN) O(N) 稳定

排序测试

int tmp1[20];
int tmp2[20];
int tmp3[20];
int tmp4[20];
int tmp5[20];
int tmp6[20];
int tmp7[20];
int tmp8[20];
int tmp9[20];
int tmp10[20];
int tmp11[20];
int tmp12[20];
int tmp13[20];
void init()
{
    int i = 0;
    int nums = 0;
    for (i = 0; i < 20; i++)
    {
        nums = rand() % 100;
        tmp1[i] = nums;
        tmp2[i] = nums;
        tmp3[i] = nums;
        tmp4[i] = nums;
        tmp5[i] = nums;
        tmp6[i] = nums;
        tmp7[i] = nums;
        tmp8[i] = nums;
        tmp9[i] = nums;
        tmp10[i] = nums;
        tmp11[i] = nums;
        tmp12[i] = nums;
        tmp13[i] = nums;
    }
}
void test()
{
    int numsSize = 20;
    InsertSort(tmp1, numsSize);//插入排序
    ShellSort(tmp2, numsSize);//希尔排序
    BubbleSort(tmp3, numsSize);//冒泡排序
    PartSort1(tmp4, 0, numsSize - 1);//快排1
    PartSort2(tmp5, 0, numsSize - 1);//快排2
    PartSort3(tmp6, 0, numsSize - 1);//快排3
    QuickSort(tmp7, 0, numsSize - 1);//快排改进
    QuickSortNonR(tmp8, 0, numsSize - 1);//快排非递归
    SelectSort(tmp9, numsSize);
    HeapSort(tmp10, numsSize);
    int* tmp = (int*)malloc(sizeof(int) * numsSize);
    MergeSort(tmp11, 0, numsSize - 1, tmp);
    MergeSortNonR(tmp12, numsSize - 1, tmp);
    CountSort(tmp13, numsSize);
    free(tmp);
}
void print(int* nums, int numsSize)
{
	int i = 0;
	for (i = 0; i < numsSize; i++)
	{
		printf("%d ", nums[i]);
	}
    printf("\n");
}
void Print()
{
    print(tmp1, 20);
    print(tmp2, 20);
    print(tmp3, 20);
    print(tmp4, 20);
    print(tmp5, 20);
    print(tmp6, 20);
    print(tmp7, 20);
    print(tmp8, 20);
    print(tmp9, 20);
    print(tmp10, 20);
    print(tmp11, 20);
    print(tmp12, 20);
    print(tmp13, 20);
}
int main()
{
    srand((unsigned)time());
	//int nums[] = { 3,9,0,-2,1 };
	//int numsSize = sizeof(nums) / sizeof(nums[0]);//计算数组大小
	//sortArray(nums, numsSize);//调用排序算法
    init();//对排序的数组赋值
    test();//调用各个排序函数
	//print(nums, numsSize);//打印排序结果
	Print();//打印各个排序结果
	return 0;
}

数据结构:排序解析_第15张图片

你可能感兴趣的:(数据结构,数据结构,排序算法,算法)