排序进行曲-v2.0

文章目录

    • 小程一言
    • 直接插入排序
      • 步骤
      • 举例
      • 复杂度分析
      • 应用场景
      • 实际举例
      • 代码实现
    • 希尔排序
      • 步骤
      • 举例
      • 复杂度分析
      • 应用场景
      • 实际举例
      • 代码实现
    • 堆排序
      • 步骤
      • 举例
      • 复杂度分析
      • 应用场景
      • 实际举例
      • 代码实现

小程一言

这篇文章是在排序进行曲1.0之后的续讲,
由于在上一篇讲的排序的基本概念与分类,所以这篇主要是对几个
简单的排序进行细致的分析,有直接插入排序、希尔排序以及堆排序。

排序进行曲-v2.0_第1张图片

直接插入排序

直接插入排序是一种简单直观的排序算法,它的基本思想是将待排序的元素依次插入到已排序的序列中的合适
位置,从而逐步形成有序序列。

步骤

1、将待排序的元素序列分为已排序区和未排序区。一开始已排序区只有一个元素,就是待排序序列的第一个元
	素。
2、从未排序区取出第一个元素,将其与已排序区的元素逐个比较,找到合适的位置插入。
3、比较的过程是从已排序区的最后一个元素开始,如果该元素大于待插入元素,则将该元素后移一位,直到找
		到一个小于等于待插入元素的元素位置。
4、将待插入元素插入到找到的位置后,已排序区的元素个数加一。
5、重复步骤2~4,直到未排序区的元素全部插入到已排序区。

举例

原始序列:5 3 8 6 4

第一轮插入:3 5 8 6 4

第二轮插入:3 5 6 8 4

第三轮插入:3 4 5 6 8

通过例子可以看出,直接插入排序每次将一个元素插入到已排序序列中的合适位置,通过不断地插入操作,最终
	将序列排序完成。

复杂度分析

直接插入排序的时间复杂度为O(n^2),其中n是待排序序列的长度。直接插入排序的最好情况时间复杂度为
  O(n),即当待排序序列已经有序时,只需要比较n-1次即可完成排序。最坏情况时间复杂度为O(n^2),即当待
  排序序列逆序排列时,需要比较和移动的次数最多。平均情况下,直接插入排序的时间复杂度也是O(n^2)。

直接插入排序的空间复杂度为O(1),即只需要常数级别的额外空间。

直接插入排序是一种稳定的排序算法,即相等元素的相对顺序在排序前后不会改变。

应用场景

小规模数据排序:直接插入排序对于小规模的数据排序效果较好,因为它的时间复杂度为O(n^2),在数据规模
  较小的情况下,其性能优于其他复杂度较高的排序算法。例如,对于一个包含100个元素的数组进行排序,直
  接插入排序的效率较高。

部分有序数据排序:如果待排序的数据已经部分有序,即每个元素距离它的最终位置不远,那么直接插入排序的
  效果会很好。这是因为直接插入排序每次将一个元素插入到已经有序的部分中,插入的操作比较快速。例如,
  对于一个近乎有序的数组进行排序,直接插入排序的效率较高。

数据量较小且基本有序的在线排序:直接插入排序可以在不断接收新数据的情况下,实时对数据进行排序。例
  如,一个在线的股票交易系统,需要对新到达的交易数据进行排序,直接插入排序可以满足实时性的要求。

实际举例

假设有一个学生成绩的数组,需要按照成绩从低到高进行排序。可以使用直接插入排序来实现。首先,将第一个
  元素视为有序的部分,然后从第二个元素开始,逐个将元素插入到已经有序的部分中。具体的操作是,从第二
  个元素开始,将其与已经有序的部分比较,找到合适的位置插入,然后再将下一个元素插入,直到所有元素都
  被插入完成。这样就可以得到按照成绩从低到高排序的数组。

代码实现

public class InsertionSort {
    public static void main(String[] args) {
        int[] arr = {5, 2, 8, 3, 1};
        insertionSort(arr);
        for (int num : arr) {
            System.out.print(num + " ");
        }
    }

    public static void insertionSort(int[] arr) {
        int n = arr.length;
        for (int i = 1; i < n; i++) {
            int key = arr[i];
            int j = i - 1;
            while (j >= 0 && arr[j] > key) {
                arr[j + 1] = arr[j];
                j--;
            }
            arr[j + 1] = key;
        }
    }
}

![在这里插入图片描述](https://img-blog.csdnimg.cn/b9733adc7ec9467cb835499ec469cdac.png
排序进行曲-v2.0_第2张图片

希尔排序

希尔排序(Shell Sort)是插入排序的一种改进算法,也被称为缩小增量排序。希尔排序通过将待排序的元素按照一定的间隔分组,对每组进行插入排序,然后逐渐减小间隔,直到间隔为1时进行最后一次插入排序。

步骤

1、初始化间隔gap的值为数组长度的一半,然后不断将gap缩小为原来的一半,直到gap为1。
2、对于每个gap,将数组分为gap个子序列,分别对每个子序列进行插入排序。
3、在每个子序列中,从第gap个元素开始,依次与前面的元素比较,如果前面的元素较大,则将其后移gap个位置,直到找到合适的位置插入当前元素。
4、继续对每个子序列进行插入排序,直到所有子序列都排好序。
5、缩小gap的值为原来的一半,重复步骤2-4,直到gap为1时完成排序。

举例

假设有一个数组 [9, 5, 7, 1, 3],我们将使用希尔排序对其进行排序。

首先,选择一个增量(gap),可以是数组长度的一半。在这个例子中,数组长度为5,所以我们选择增量为2。

然后,我们将数组分为若干个子数组,每个子数组相隔增量个元素。对于这个例子,我们将数组分为两个子数组:[9, 7, 3] 和 [5, 1]。

接下来,对每个子数组进行插入排序。在插入排序中,我们将每个元素与它前面的元素进行比较,并将它插入到正确的位置。对于这个例子,我们得到以下两个子数组:[3, 7, 9] 和 [1, 5]。

然后,我们将增量减小一半,即变为1。此时,我们将整个数组作为一个子数组进行插入排序。对于这个例子,我们得到最终的排序结果:[1, 3, 5, 7, 9]。

复杂度分析

希尔排序是一种改进的插入排序算法,它通过将数组分成多个子序列进行排序,然后逐步缩小子序列的长度,最终使整个数组有序。

希尔排序的时间复杂度取决于步长序列的选择。常用的步长序列有希尔增量序列和Hibbard增量序列。

希尔增量序列是将数组长度不断除以2得到的序列,直到序列的最后一个元素为1。例如,对于一个长度为N的数组,希尔增量序列可以是N/2, N/4, N/8, ..., 1。

Hibbard增量序列是将2^k - 1作为步长,其中k从1开始递增,直到2^k - 1大于等于数组长度N。例如,对于一个长度为N的数组,Hibbard增量序列可以是1, 3, 7, 15, ..., 2^k - 1。

希尔排序的平均时间复杂度为O(n^1.3),其中n是数组的长度。这个时间复杂度是基于希尔增量序列的选择得出的。

然而,希尔排序的时间复杂度并不是确定的,它可能会受到输入数据的影响。对于某些特定的输入数据,希尔排序的时间复杂度可能会更低,甚至接近O(n)。这是因为希尔排序在每一轮排序中,对于相隔较远的元素进行了交换,从而提前将较小或较大的元素移动到了正确的位置,减少了后续排序的次数。

总结起来,希尔排序的时间复杂度是不确定的,但平均情况下为O(n^1.3)。

应用场景

数组规模较大:希尔排序在大规模数组排序时具有较好的性能表现,比如对百万级别的数据进行排序。

数据分布较均匀:希尔排序对于数据分布较均匀的情况下,排序效率较高。如果数据分布不均匀,可能会导致排序效率下降。

对稳定性没有要求:希尔排序是一种不稳定的排序算法,即相同元素的相对位置可能会发生变化。如果对排序结果的稳定性有要求,不适合使用希尔排序。

对内存空间要求较低:希尔排序是一种原地排序算法,不需要额外的内存空间,适合在内存空间有限的情况下使用。

实际举例

排序算法:希尔排序可以用于对大规模数据进行排序,尤其是在数据量较大且无序程度较高的情况下,相比于其他排序算法,希尔排序具有较高的效率。

数据库索引:在数据库中,索引是对表中的数据进行快速查找的一种数据结构。希尔排序可以用于对索引进行排序,提高数据库查询的效率。

编程语言中的排序函数:许多编程语言中的排序函数底层实现使用了希尔排序算法,例如C++中的std::sort函数就是使用希尔排序作为默认实现。

数据压缩:希尔排序可以用于对数据进行压缩,通过对数据进行排序,可以使得相同的数据连续出现,从而提高数据的压缩率。

图像处理:希尔排序可以用于对图像进行排序,例如对像素点的颜色值进行排序,从而实现图像的特效处理。

代码实现

public class ShellSort {
    public static void shellSort(int[] arr) {
        int n = arr.length;
        for (int gap = n / 2; gap > 0; gap /= 2) {
            for (int i = gap; i < n; i++) {
                int temp = arr[i];
                int j = i;
                while (j >= gap && arr[j - gap] > temp) {
                    arr[j] = arr[j - gap];
                    j -= gap;
                }
                arr[j] = temp;
            }
        }
    }

    public static void main(String[] args) {
        int[] arr = {9, 5, 2, 7, 1, 8, 6, 3, 4};
        shellSort(arr);
        System.out.println("排序结果:");
        for (int num : arr) {
            System.out.print(num + " ");
        }
    }
}

//排序结果:1 2 3 4 5 6 7 8 9

排序进行曲-v2.0_第3张图片

堆排序

堆排序是一种基于堆数据结构的排序算法,它的时间复杂度为O(nlogn)。堆排序的基本思想是将待排序的序列
  构建成一个大顶堆(或小顶堆),然后依次将堆顶元素与最后一个元素交换,再重新调整堆,重复这个过程
  直到整个序列有序。

步骤

堆排序是一种基于二叉堆的排序算法,

1、构建最大堆(或最小堆):将待排序的数组看作是一个完全二叉树,根据堆的性质,可以通过从最后一个非
  叶子节点开始,依次向上调整每个节点,使得每个节点都满足堆的性质。这样就可以得到一个最大堆(或最
  小堆)。

2、将堆顶元素与最后一个元素交换:将最大堆(或最小堆)的堆顶元素与数组的最后一个元素交换位置,这样
  最大(或最小)的元素就被放到了最后的位置。

3、调整堆:将交换后的堆顶元素向下调整,使得堆的性质仍然成立。具体操作是将堆顶元素与其左右子节点中
  较大(或较小)的元素交换位置,然后继续向下调整交换后的节点,直到堆的性质满足。

4、重复步骤2和步骤3直到完成排序:重复执行步骤2和步骤3,每次都将堆顶元素与当前未排序的部分的最后一
  个元素交换,并调整堆,直到所有元素都被交换到了正确的位置。这样就完成了堆排序。

举例

待排序序列:[4, 10, 3, 5, 1]

建堆:从最后一个非叶子节点开始,依次向上调整,使得每个节点的值都大于等于其子节点的值。调整后的堆
  为:[10, 5, 3, 4, 1]

排序:将堆顶元素10与最后一个元素1交换位置,并将堆的大小减1。交换后的堆为:[1, 5, 3, 4]。然后再对
  堆顶元素1进行一次向下调整,使得堆重新满足堆的定义。调整后的堆为:[5, 4, 3, 1]。

再次排序:将堆顶元素5与最后一个元素1交换位置,并将堆的大小减1。交换后的堆为:[1, 4, 3]。然后再对
  堆顶元素1进行一次向下调整,使得堆重新满足堆的定义。调整后的堆为:[4, 1, 3]。

再次排序:将堆顶元素4与最后一个元素3交换位置,并将堆的大小减1。交换后的堆为:[3, 1]。然后再对堆顶
  元素3进行一次向下调整,使得堆重新满足堆的定义。调整后的堆为:[1, 3]。

最后排序:将堆顶元素1与最后一个元素3交换位置,并将堆的大小减1。交换后的堆为:[3]。堆的大小为1,排
  序完成。
最终排序结果:[1, 3, 4, 5, 10]

复杂度分析

建堆:建堆的时间复杂度为O(n),其中n为待排序序列的长度。

调整堆:调整堆的时间复杂度为O(logn)。在堆排序过程中,需要调整堆的次数为n-1次,每次调整堆的时间复
  杂度为O(logn)。

堆排序:堆排序的时间复杂度为O(nlogn)。在堆排序过程中,需要进行n-1次调整堆的操作,每次调整堆的时
  间复杂度为O(logn)。因此,堆排序的总时间复杂度为O(nlogn)。

综上所述,堆排序的时间复杂度为O(nlogn)。

应用场景

需要对大量数据进行排序的场景,堆排序的时间复杂度为O(nlogn),效率较高。

需要稳定性较差的排序算法,堆排序是一种不稳定的排序算法,适用于不要求相同元素的相对位置保持不变
	的场景。

需要对数据进行动态排序的场景,堆排序可以在不断插入新元素的情况下,快速对数据进行排序。

需要找出最大或最小的前k个元素的场景,堆排序可以通过构建最大堆或最小堆,快速找到最大或最小的元素。

实际举例

优先级队列:堆排序可以用于实现优先级队列,其中每个元素都有一个优先级。通过使用最大堆,可以确保优先
  级最高的元素始终位于堆的根节点,从而可以快速找到并删除具有最高优先级的元素。

任务调度:在任务调度中,每个任务都有一个优先级和执行时间。通过使用最小堆,可以按照任务的优先级和
  执行时间对任务进行排序,从而实现高效的任务调度。

多路归并排序:堆排序可以用于多路归并排序,其中有多个有序序列需要合并成一个有序序列。通过使用最小
  堆,可以选择每个有序序列的最小元素进行合并,从而实现高效的多路归并排序。

求Top K问题:在一组数据中,找到最大或最小的K个元素。通过使用最大堆,可以维护一个大小为K的堆,每次
  从数据中取出一个元素与堆顶元素比较,如果比堆顶元素大,则替换堆顶元素并重新调整堆,最终堆中的元素
  就是最大的K个元素。

中位数问题:在一组数据中,找到中间位置的元素。通过使用最大堆和最小堆,可以将数据分为两部分,其中最
  大堆存储较小的一半数据,最小堆存储较大的一半数据。这样可以快速找到中位数,并支持动态添加和删除
  元素。

代码实现

public class HeapSort {
    public void heapSort(int[] arr) {
        int n = arr.length;

        // 建立最大堆
        for (int i = n / 2 - 1; i >= 0; i--)
            heapify(arr, n, i);

        // 逐个将堆顶元素移到数组末尾
        for (int i = n - 1; i >= 0; i--) {
            // 将当前堆顶元素(最大值)与数组末尾元素交换
            int temp = arr[0];
            arr[0] = arr[i];
            arr[i] = temp;

            // 重新调整堆,找出剩下元素的最大值
            heapify(arr, i, 0);
        }
    }

    // 调整堆
    void heapify(int[] arr, int n, int i) {
        int largest = i; // 初始化最大值为根节点
        int left = 2 * i + 1; // 左子节点
        int right = 2 * i + 2; // 右子节点

        // 如果左子节点大于根节点,将最大值设为左子节点
        if (left < n && arr[left] > arr[largest])
            largest = left;

        // 如果右子节点大于当前最大值,将最大值设为右子节点
        if (right < n && arr[right] > arr[largest])
            largest = right;

        // 如果最大值不是根节点,交换根节点与最大值,并继续调整堆
        if (largest != i) {
            int swap = arr[i];
            arr[i] = arr[largest];
            arr[largest] = swap;

            heapify(arr, n, largest);
        }
    }

    // 测试代码
    public static void main(String[] args) {
        int[] arr = {9, 5, 2, 7, 1, 8, 3};
        HeapSort heapSort = new HeapSort();
        heapSort.heapSort(arr);

        System.out.println("排序结果:");
        for (int num : arr) {
            System.out.print(num + " ");
        }
    }
}
//输出结果为:1 2 3 5 7 8 9。

你可能感兴趣的:(数据结构与算法分析,排序算法,算法,数据结构)