数据结构与算法系列 (2) 排序算法-->java篇

算法是程序的灵魂

简述

#排序
所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。

#排序算法
排序算法,就是如何使得记录按照要求排列的方法。

#算法优劣的评价指标
(1)稳定性:稳定性是不管考虑时间和空间必须要考虑的问题,往往也是非常重要的影响选择的因素。
(2)时间复杂度:即从序列的初始状态到经过排序算法的变换移位等操作变到最终排序好的结果状态的过程所花费的时间度量。
(3)空间复杂度:就是从序列的初始状态经过排序移位变换的过程一直到最终的状态所花费的空间开销。
(4)使用场景:排序算法有很多,不同种类的排序算法适合不同种类的情景,有些讲究效率, 有些空间有限。
排序算法.png
各排序算法复杂度.png
#各排序算法复杂度相关参数说明:
>> 稳定:如果a原本在b前面,且a=b,排序之后a仍然在b的前面;
>> 不稳定:如果a原本在b的前面,且a=b,排序之后a可能会出现在b的后面;
>> 内排序:所有排序操作都在内存中完成;
>> 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
>> 时间复杂度: 一个算法执行所耗费的时间。
>> 空间复杂度:运行完一个程序所需内存的大小。
>> n: 数据规模
>> k: “桶”的个数
>> In-place: 不占用额外内存
>> Out-place: 占用额外内存

1.冒泡排序

冒泡排序(Bubble Sort)

冒泡排序是一种简单的排序算法。
它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。
走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。
这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。 

1.1 算法描述

(1)比较相邻的元素。如果第一个比第二个大,就交换它们两个;
(2)对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
(3)针对所有的元素重复以上的步骤,除了最后一个;
(4)重复步骤1~3,直到排序完成。

1.2 动图演示

冒泡排序.gif

1.3代码实现

@Test
public void fn01() {
    // int[] arr = {1, 3, 6, 22, 28, 31, 48};
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    bubbleSort(arr);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序方式一: 冒泡排序 --> 属于交换排序
 * 第一轮交换后, 最大值到最右侧
 * 第二轮交换后, 次大值到次右侧
 * ...
 * 最后一轮交换后, 倒数第二大值到正数第二侧
 *
 * @param arr
 */
private void bubbleSort(int[] arr) {
    int tmp;
    for (int i = 0; i < arr.length; i++) {
        int count = 0;
        for (int j = 0; j < arr.length - 1 - i; j++) {
            if (arr[j] > arr[j + 1]) {
                tmp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = tmp;
                count++;
            }
        }
        if (count == 0) {
            break;
        }
    }
}

2、选择排序(Selection Sort)

选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:
第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,
第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,
第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,
第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 
第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,
总共通过n-1次,得到一个按排序码从小到大排列的有序序列。

2.1 算法描述

n个记录的直接选择排序可经过n-1趟直接选择排序得到有序结果。具体算法描述如下:
(1)初始状态:无序区为R[1..n],有序区为空;
(2)第i趟排序(i=1,2,3…n-1)开始时,当前有序区和无序区分别为R[1..i-1]和R(i..n)。
该趟排序从当前无序区中-选出关键字最小的记录 R[k],将它与无序区的第1个记录R交换,
使R[1..i]和R[i+1..n)分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区;
(3)n-1趟结束,数组有序化了。

2.2 动图演示

选择排序.gif

2.3 代码实现

@Test
public void fn02() {
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    selectSort(arr);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序方式二: 选择排序
 * 第一轮排序后, 最小值和首位的值进行交换
 * 第二轮排序后, 次小值和第二位的值进行交换
 * ...
 * 最后一轮排序后, 次大值和倒数第二位的值进行交换
 *
 * @param arr
 */
private void selectSort(int[] arr) {
    int tmp;
    for (int i = 0; i < arr.length - 1; i++) {
        int index = i;
        for (int j = i + 1; j < arr.length; j++) {
            if (arr[index] > arr[j]) {
                index = j;
            }
        }
        if (index != i) {
            tmp = arr[i];
            arr[i] = arr[index];
            arr[index] = tmp;
        }
    }
}

3、插入排序(Insertion Sort)

#插入排序的工作原理
是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),
因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。

3.1 算法描述

一般来说,插入排序都采用in-place在数组上实现。具体算法描述如下:
(1)从第一个元素开始,该元素可以认为已经被排序;
(2)取出下一个元素,在已经排序的元素序列中从后向前扫描;
(3)如果该元素(已排序)大于新元素,将该元素移到下一位置;
(4)重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
(5)将新元素插入到该位置后;
(6)重复步骤2~5。

3.2 动图演示

插入排序.gif

3.3 代码实现

@Test
public void fn03() {
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    insertSort(arr);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序方式三: 插入排序
 * 第一轮排序后, 第二位和首位的数据比较, 看是否需要交换位置
 * 第二轮排序后, 第三位和前两位的数据比较, 看是否需要交换以及在哪里交换位置
 * ...
 * 最后一轮排序后, 最后一位和前面所有的数据比较, 看是否需要交换以及在哪里交换位置
 *
 * @param arr
 */
private void insertSort(int[] arr) {
    // 遍历所有数据
    for (int i = 1; i < arr.length; i++) {
        // 如果当前数字, 比前一个数字小
        if (arr[i] < arr[i - 1]) {
            // 把当前遍历的数字存起来
            int temp = arr[i];
            int j;
            // 遍历当前数字前的所有数字
            for (j = i - 1; j >= 0 && temp < arr[j]; j--) {
                // 把前一个数字赋值给后一个数字
                arr[j + 1] = arr[j];
            }
            // 把临时变量(外层for循环的当前元素)赋值给不满足条件的后一个值
            arr[j + 1] = temp;
        }
    }
}

4、希尔排序(Shell Sort)

1959年Shell发明,第一个突破O(n^2)的排序算法,是简单插入排序的改进版。
它与插入排序的不同之处在于,它会优先比较距离较远的元素。
希尔排序又叫缩小增量排序。

希尔排序的核心在于间隔序列的设定。
既可以提前设定好间隔序列,也可以动态的定义间隔序列。
动态定义间隔序列的算法是《算法(第4版》的合著者Robert Sedgewick提出的。 

4.1 算法描述

先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:
(1)选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;
(2)按增量序列个数k,对序列进行k 趟排序;
(3)每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。
仅增量因子为1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

4.2 动图展示

希尔排序.gif

4.3 代码实现

@Test
public void fn04() {
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    // shellInsertSortByExchange(arr);
    shellInsertSortByMove(arr);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序方式四(一): 希尔排序(由交换法实现)
 *
 * @param arr
 */
private void shellInsertSortByExchange(int[] arr) {
    int tmp;
    // 遍历所有的步长
    for (int step = arr.length / 2; step > 0; step /= 2) {
        // 遍历所有元素
        for (int i = step; i < arr.length; i++) {
            // 遍历本组中所有的元素: 本组中的元素互相比较, 如果前者 > 后者, 则进行位置交换
            for (int j = i - step; j >= 0; j -= step) {
                if (arr[j] > arr[j + step]) {
                    tmp = arr[j];
                    arr[j] = arr[j + step];
                    arr[j + step] = tmp;
                }
            }
        }
    }
}

/**
 * 排序方式四(二): 希尔排序(由移动法实现)
 *
 * @param arr
 */
private void shellInsertSortByMove(int[] arr) {
    // 遍历所有的步长
    for (int step = arr.length / 2; step > 0; step /= 2) {
        // 遍历所有元素
        for (int i = step; i < arr.length; i++) {
            int j = i;
            int tmp = arr[j];
            if (arr[j] < arr[j - step]) {
                while (j - step >= 0 && tmp < arr[j - step]) {
                    arr[j] = arr[j - step];
                    j -= step;
                }
                arr[j] = tmp;
            }
        }
    }
}

5.归并排序(Merge Sort)

和选择排序一样,归并排序的性能不受输入数据的影响,
但表现比选择排序好的多,因为始终都是O(n log n)的时间复杂度。
代价是需要额外的内存空间。

归并排序是建立在归并操作上的一种有效的排序算法。
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,
该算法采用经典的分治(divide-and-conquer)策略
(分治法将问题分(divide)成一些小的问题然后递归求解,
而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。

5.1 算法描述

(1)把长度为n的输入序列分成两个长度为n/2的子序列;
(2)对这两个子序列分别采用归并排序;
(3)将两个排序好的子序列合并成一个最终的排序序列。

5.2 动图展示

归并排序.gif

5.3 代码实现

@Test
public void fn06() {
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    mergeSort(arr, 0, arr.length - 1);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序算法6: 归并排序 (分治策略, 利用了递归)
 * https://www.jianshu.com/p/33cffa1ce613
 *
 * @param arr
 * @param left
 * @param right
 */
private void mergeSort(int[] arr, int left, int right) {
    if (left == right) {
        return;
    }
    int mid = left + ((right - left) >> 1);
    mergeSort(arr, left, mid);
    mergeSort(arr, mid + 1, right);
    merge(arr, left, mid, right);
}

private void merge(int[] arr, int left, int mid, int right) {
    int[] tmp = new int[right - left + 1];
    int i = 0;
    int p1 = left;
    int p2 = mid + 1;
    // 比较左右两部分的元素, 将小的放入 tmp 中
    while (p1 <= mid && p2 <= right) {
        tmp[i++] = arr[p1] < arr[p2] ? arr[p1++] : arr[p2++];
    }
    // 退出循环后, 依次将剩余元素加入 tmp 中
    while (p1 <= mid) {
        tmp[i++] = arr[p1++];
    }
    while (p2 <= right) {
        tmp[i++] = arr[p2++];
    }
    // 把最终的排序结果复制给原数组
    if (tmp.length >= 0) {
        System.arraycopy(tmp, 0, arr, left, tmp.length);
    }
}

6.快速排序(Quick Sort)

快速排序的基本思想:
通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,
则可分别对这两部分记录继续进行排序,以达到整个序列有序。

6.1 算法描述

快速排序使用分治法来把一个串(list)分为两个子串(sub-lists):
(1)从数列中挑出一个元素,称为 “基准”(pivot);
(2)重新排序数列,所有元素比基准值小的摆放在基准前面,
所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。
在这个分区退出之后,该基准就处于数列的中间位置。
这个称为分区(partition)操作;
(3)递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

6.2 动图展示

快速排序.gif

6.3 代码实现

@Test
public void fn05() {
    int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    fastSort(arr, 0, arr.length - 1);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序算法5: 快速排序 (利用了递归)
 *
 * @param arr
 * @param start
 * @param end
 */
private void fastSort(int[] arr, int start, int end) {
    if (start < end) {
        // 把数组中的第start数字定位标准数
        int standard = arr[start];
        // 记录需要排序的下标
        int low = start;
        int high = end;
        // 循环找比标准数大的数, 比标准数小的数
        while (low < high) {
            // 右边的数比标准数大
            while (low < high && standard <= arr[high]) {
                high--;
            }
            // 用右边的数,替换左边的数
            arr[low] = arr[high];

            // 左边的数比标准数小
            while (low < high && arr[low] <= standard) {
                low++;
            }
            // 用左边的数,替换右边的数
            arr[high] = arr[low];
        }
        // 把标准数赋给左边或右边的数都行, 此时二者已重合
        arr[low] = standard;
        // 处理所有比标准数小的数字
        fastSort(arr, start, low);
        // 处理所有比标准数大的数字
        fastSort(arr, low + 1, end);
    }
}

7.堆排序(Heap Sort)

堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。
堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:
即子结点的键值或索引总是小于(或者大于)它的父节点。

7.1 算法描述

(1)将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区;
(2)将堆顶元素R[1]与最后一个元素R[n]交换,
此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n];
(3)由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆,
然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。
不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。

7.2 动图展示

堆排序.gif

7.3 代码实现

https://www.cnblogs.com/chengxiao/p/6129630.html

8.计数排序(Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 
作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

计数排序(Counting sort)是一种稳定的排序算法。
计数排序使用一个额外的数组C,其中第i个元素是待排序数组A中值等于i的元素的个数。
然后根据数组C来将A中的元素排到正确的位置。
它"只能对整数进行排序"。

8.1 算法描述

(1)找出待排序的数组中最大和最小的元素;
(2)统计数组中每个值为i的元素出现的次数,存入数组C的第i项;
(3)对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加);
(4)反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1。

8.2 动图展示

计数排序.gif

8.3 代码实现

9.桶排序(Bucket Sort)

桶排序是计数排序的升级版。
它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。

桶排序 (Bucket sort)的工作的原理:
假设输入数据服从均匀分布,将数据分到有限数量的桶里,
每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排)。

9.1 算法描述

(1)设置一个定量的数组当作空桶;
(2)遍历输入数据,并且把数据一个一个放到对应的桶里去;
(3)对每个不是空的桶进行排序;
(4)从不是空的桶里把排好序的数据拼接起来。 

9.2 动图展示

9.3 代码实现

10.基数排序(Radix Sort)

基数排序也是非比较的排序算法,对每一位进行排序,
从最低位开始排序,复杂度为O(kn),为数组长度,k为数组中的数的最大的位数;

基数排序是按照低位先排序,然后收集;
再按照高位排序,然后再收集;
依次类推,直到最高位。

有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。
最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。
基数排序基于分别排序,分别收集,所以是稳定的。

原始的基数排序不适于'负数'的排序, 若需支持, 参考下文代码即可.

10.1 算法描述

(1)取得数组中的最大数,并取得位数;
(2)arr为原始数组,从最低位开始取每个位组成radix数组;
(3)对radix进行基数排序;

10.2 动图展示

基数排序.gif

10.3 代码实现

@Test
public void fn07() {
    // int[] arr = {-11, -3, 6, 22, 8, 1, 8};
    // radixSortWithinNegative(arr);
    int[] arr = {53, 3, 542, 748, 14, 214};
    radixSort(arr);
    System.out.println(Arrays.toString(arr));
}

/**
 * 排序算法7-1: 基数排序(这种排序不支持负数的排序)
 *  是用空间换时间的经典算法
 * @param arr
 */
private void radixSort(int[] arr) {
    // 定义一个二维数组, 表示 10 个桶, 每一个桶就是一个一维数组
    int[][] bucket = new int[10][arr.length];
    // 为了记录每个桶中, 实际存放了多少数据, 我们定义一个一维数组来记录各个桶的每次放入的数据个数
    int[] bucketElementCount = new int[10];
    int max = getMax(arr);
    int length = (max + "").length();
    for (int i = 0; i < length; i++) {
        for (int anArr : arr) {
            // 取出每个元素中个位数的值
            int digit = ((int) (anArr / (Math.pow(10, i)))) % 10;
            // 将该值放到对应的桶中, 并将桶中的元素 自增
            bucket[digit][bucketElementCount[digit]++] = anArr;
        }
        // 遍历每一个桶, 依次取出桶中的元素, 放入原来的数组中
        int index = 0;
        for (int j = 0; j < bucketElementCount.length; j++) {
            if (bucketElementCount[j] != 0) {
                for (int k = 0; k < bucketElementCount[j]; k ++) {
                    arr[index++] = bucket[j][k];
                }
            }
            // 要清0
            bucketElementCount[j] = 0;
        }
    }
}

private int getMax(int[] arr) {
    if (arr == null || arr.length == 0) {
        throw new RuntimeException("arr cannot be empty.");
    }
    int max = arr[0];
    for (int anArr : arr) {
        if (anArr > max) {
            max = anArr;
        }
    }
    return max;
}
/**
 * 这是基数排序的演变过程
 * /
private void radixSortTrain(int[] arr) {
    // 定义一个二维数组, 表示 10 个桶, 每一个桶就是一个一维数组
    int[][] bucket = new int[10][arr.length];
    // 为了记录每个桶中, 实际存放了多少数据, 我们定义一个一维数组来记录各个桶的每次放入的数据个数
    int[] bucketElementCount = new int[10];

    /////////////////////// 第一轮 结束后: [542, 53, 3, 14, 214, 748]
    for (int anArr : arr) {
        // 取出每个元素中个位数的值
        int digit = anArr % 10;
        // 将该值放到对应的桶中, 并将桶中的元素 自增
        bucket[digit][bucketElementCount[digit]++] = anArr;
    }
    // 遍历每一个桶, 依次取出桶中的元素, 放入原来的数组中
    int index = 0;
    for (int i = 0; i < bucketElementCount.length; i++) {
        if (bucketElementCount[i] != 0) {
            for (int j = 0; j < bucketElementCount[i]; j ++) {
                arr[index++] = bucket[i][j];
            }
        }
        // 要清0
        bucketElementCount[i] = 0;
    }

    /////////////////////// 第二轮 结束后: [3, 14, 214, 542, 748, 53]
    for (int anArr : arr) {
        // 取出每个元素中个位数的值
        int digit = anArr / 10 % 10;
        // 将该值放到对应的桶中, 并将桶中的元素 自增
        bucket[digit][bucketElementCount[digit]++] = anArr;
    }
    // 遍历每一个桶, 依次取出桶中的元素, 放入原来的数组中
    index = 0;
    for (int i = 0; i < bucketElementCount.length; i++) {
        if (bucketElementCount[i] != 0) {
            for (int j = 0; j < bucketElementCount[i]; j ++) {
                arr[index++] = bucket[i][j];
            }
        }
        // 要清0
        bucketElementCount[i] = 0;
    }

    /////////////////////// 第三轮 结束后: [3, 14, 53, 214, 542, 748]
    for (int anArr : arr) {
        // 取出每个元素中个位数的值
        int digit = anArr / 100 % 10;
        // 将该值放到对应的桶中, 并将桶中的元素 自增
        bucket[digit][bucketElementCount[digit]++] = anArr;
    }
    // 遍历每一个桶, 依次取出桶中的元素, 放入原来的数组中
    index = 0;
    for (int i = 0; i < bucketElementCount.length; i++) {
        if (bucketElementCount[i] != 0) {
            for (int j = 0; j < bucketElementCount[i]; j ++) {
                arr[index++] = bucket[i][j];
            }
        }
        // 要清0
        bucketElementCount[i] = 0;
    }

}

/**
 * 排序算法7-2: 基数排序 (这种方式支持负数的排序)
 *  是用空间换时间的经典算法
 * @param arr
 */
private void radixSortWithinNegative(int[] arr) {
    // 基数,在循环过程中根据数的大小自动增长
    int digitNumber = 1;
    // 桶,正数和负数共20个桶
    int[][] bucket = new int[20][arr.length > 19 ? arr.length : 20];
    // i 代表当前循环的基数,如 1,10,100....
    for (int i = 1, arrOrder = 0; i <= digitNumber;arrOrder = 0) {
        // 表示本次循环中基数是否已经扩大
        boolean digitExpand = false;
        // 本次循环中 20 个桶每个桶中存的数的个数
        int[] numberAmount = new int[20];
        // 放入桶中
        for (int num : arr) {
            // digit表示 num 要放在 20 格桶中的哪一个
            int digit = (num / i) % 10;
            // 这里是加 10 ,即正数用后 10 个桶,负数用前 10 个桶
            digit += 10;
            // numberAmount[digit] 初始值为 0 ,可以直接使用
            bucket[digit][numberAmount[digit]++] = num;
            // 本次循环中遇到有以下条件时最外层循环条件需要扩大一次,即基数需要乘以10
            // 比如第一次循环时digitNumber = 1,当前 num = 2,则不需扩大
            // 若 num = 10 则需要扩大一次最外层循环
            if (num >= (digitNumber * 10) && !digitExpand) {
                digitNumber *= 10;
                digitExpand = true;
            }
        }
        // 从 20 个桶中取出数据,完成一次排序
        for (int j = 0; j < 20; j++) {
            for (int k = 0; k < numberAmount[j]; k++) {
                arr[arrOrder++] = bucket[j][k];
            }
        }
        // 每循环一次 i 需要乘以 10
        i *= 10;
    }
}

参考资源

  1. https://www.cnblogs.com/onepixel/articles/7674659.html
  2. https://blog.csdn.net/wfq784967698/article/details/79551476
  3. https://blog.csdn.net/qq_31860135/article/details/83993357
  4. https://cloud.tencent.com/developer/article/1177610

你可能感兴趣的:(数据结构与算法系列 (2) 排序算法-->java篇)