排序算法的实现与比较

SortAlgorithm

七种基本排序算法的实现和总结。GitHub地址

一、冒泡排序

每次比较两个相邻的元素,如果它们的顺序错误就把它们交换过来。

步骤:

  1. 比较相邻的元素。如果倒数第一个比倒数第二个小,就交换他们两个。
  2. 对第0个到第n-1个数据做同样的工作。这时,最小的数就“浮”到了数组最开始的位置上。
  3. 针对所有的元素重复以上的步骤,除了第一个。
  4. 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

代码实现:

for (int i = 0; i < arr.length; i++) {
    for (int j = arr.length  - 1; j > i; j--) {
        if (arr[j] < arr[j - 1]) {
            SortUtil.swap(arr, j, j - 1);
        }
    }
}

二、选择排序

不断地选择剩余元素中的最小者。

最大特点是交换移动数据次数相当少。

步骤:

  1. 找到数组中最小元素的下标,将第一个元素与最小元素下标的数进行交换。
  2. 在剩下的元素中找到最小元素下标并将其与数组第二个元素交换,直至整个数组排序。

代码实现:

for (int i = 0; i < arr.length; i++) {
    int minIndex = i;
    for (int j = i + 1; j < arr.length; j++) {
        if (arr[j] < arr[minIndex]) {
            minIndex = j;
        }
    }
    SortUtil.swap(arr, minIndex, i);
}

三、插入排序

插入排序的工作原理是,对于每个未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

步骤:

  1. 从第一个元素开始,该元素可以认为已经被排序
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描
  3. 如果被扫描的元素(已排序)大于新元素,将该元素后移一位
  4. 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
  5. 将新元素插入到该位置后
  6. 重复步骤2~5

代码实现:

for (int i = 1; i < arr.length; i++) {
    int temp = arr[i];
    int j;
    for (j = i; j > 0 && (arr[j - 1] > temp); j--) {
        arr[j] = arr[j -1];
    }
    arr[j] = temp;
}

四、归并排序

将长度为n的记录不断划分,划分到长度为1时,再两两合并,依次递归。主要是利用分治法来处理。

代码实现:

@Override
public int[] sort(int[] arr) {
    mergeSort(arr, 0, arr.length - 1);
    return arr;
}
private void mergeSort(int[] array, int start, int end) {
    if (start >= end) return;
    int middle = (start + end) / 2;
    mergeSort(array, start, middle);
    mergeSort(array, middle + 1, end);
    merge(array, start, middle, end);
}
private void merge(int[] array, int start, int middle, int end) {
    int[] aux = new int[end - start + 1];
    System.arraycopy(array, start, aux, 0, end - start + 1);
    int left = start;
    int right = middle + 1;
    for (int k = start; k <= end; k++) {
        if (left > middle) {
            array[k] = aux[right - start];
            right++;
        } else if (right > end) {
            array[k] = aux[left - start];
            left++;
        } else if (aux[left - start] > aux[right - start]) {
            array[k] = aux[right - start];
            right++;
        } else {
            array[k] = aux[left - start];
            left++;
        }
    }
}

五、堆排序

堆排序就是利用堆进行排序的方法.基本思想是:将待排序的序列构造成一个大顶堆.此时,整个序列的最大值就是堆顶的根结点.将它移
走(其实就是将其与堆数组的末尾元素交换, 此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素的次大值.如此反复执行,便能得到一个有序序列了。

步骤:

  1. 构造最大堆(Build_Max_Heap):若数组下标范围为0~n,考虑到单独一个元素是大根堆,则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始,向前依次构造大根堆,这样就能保证,构造到某个节点时,它的左右子树都已经是大根堆。

  2. 堆排序(HeapSort):由于堆是用数组模拟的。得到一个大根堆后,数组内部并不是有序的。因此需要将堆化数组有序化。思想是移除根节点,并做最大堆调整的递归运算。第一次将heap[0]与heap[n-1]交换,再对heap[0...n-2]做最大堆调整。第二次将heap[0]与heap[n-2]交换,再对heap[0...n-3]做最大堆调整。重复该操作直至heap[0]和heap[1]交换。由于每次都是将最大的数并入到后面的有序区间,故操作完后整个数组就是有序的了。

  3. 最大堆调整(Max_Heapify):该方法是提供给上述两个过程调用的。目的是将堆的末端子节点作调整,使得子节点永远小于父节点 。

代码实现:

public int[] sort(int[] arr) {
    int len = arr.length - 1;
    for (int i = len / 2 - 1; i >= 0; i--) {
        headAdjust(arr, i, len);
    }
    while (len >= 0) {
        SortUtil.swap(arr, 0, len--);
        headAdjust(arr, 0, len);
    }
    return arr;
}
private void headAdjust(int[] arr, int parent, int len) {
    int leftChild, rightChild, maxChild;
    while ((leftChild = 2 * parent + 1) <= len) {
        rightChild = leftChild + 1;
        maxChild = leftChild;
        // 将maxChild指向左右子节点中的较大者
        if (maxChild < len && (arr[leftChild] < arr[rightChild])) {
            maxChild++;
        }
        if (arr[parent] < arr[maxChild]) {
            SortUtil.swap(arr, parent, maxChild);
            parent = maxChild;
        } else {
            break;
        }
    }
}

六、希尔排序

先将整个待排元素序列分割成若干子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序(增量为1)。其时间复杂度为O( n^3/2 ),要好于直接插入排序的O(n^2)

代码实现:

int gap = arr.length / 2;
while (gap >= 1) {
    for (int i = gap; i < arr.length; i++) {
        int temp = arr[i];
        int j = i - gap;
        while (j >= 0 && arr[j] > temp) {
            arr[j + gap] = arr[j];
            j -= gap;
        }
        arr[j + gap] = temp;
    }
    gap /= 2;
}

注:希尔排序的gap取值不仅仅是arr.length/2这么简单,可以根据数据特性选取合适的值达到最高的运行效率。

七、快速排序

通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

步骤:

  1. 从数列中挑出一个元素作为基准数。
  2. 分区过程,将比基准数大的放到右边,小于或等于它的数都放到左边。
  3. 再对左右区间递归执行第二步,直至各区间只有一个数。

代码实现:

private void quickSort(int[] arr, int left, int right) {
    if (left >= right) return;
    int i = left, j = right, temp = arr[left];
    while (i < j) {
        while (i < j && arr[j] >= temp) {
            j--;
        }
        while (i < j && arr[i] <= temp) {
            i++;
        }
        if (i < j) {
            SortUtil.swap(arr, i, j);
        }
    }
    arr[left] = arr[i];
    arr[i] = temp;
    quickSort(arr, left, i - 1);
    quickSort(arr, i + 1, right);
}

八、数据测试与比较

对以上7种排序算法进行测试。测试数据由以下函数随机生成:

public static int[] randomArray(int length, int bound) {
    int[] a = new int[length];

    Random random = new Random();
    for (int i = 0; i < length; i++) {
        a[i] = random.nextInt(bound);
    }
    return a;
}

该函数有两个参数,length表示生成的数据量;bound表示数据的范围值。改变length和bound进行测试。

length=5000, bound=10000:

排序名称:冒泡排序
消耗时间:45ms
排序名称:选择排序
消耗时间:13ms
排序名称:插入排序
消耗时间:12ms
排序名称:希尔排序
消耗时间:3ms
排序名称:归并排序
消耗时间:2ms
排序名称:堆排序
消耗时间:2ms
排序名称:快速排序
消耗时间:1ms

length=10000, bound=10000:

排序名称:冒泡排序
消耗时间:197ms
排序名称:选择排序
消耗时间:64ms
排序名称:插入排序
消耗时间:27ms
排序名称:希尔排序
消耗时间:3ms
排序名称:归并排序
消耗时间:4ms
排序名称:堆排序
消耗时间:5ms
排序名称:快速排序
消耗时间:4ms

length=20000, bound=100000:

排序名称:冒泡排序
消耗时间:768ms
排序名称:选择排序
消耗时间:163ms
排序名称:插入排序
消耗时间:74ms
排序名称:希尔排序
消耗时间:5ms
排序名称:归并排序
消耗时间:4ms
排序名称:堆排序
消耗时间:4ms
排序名称:快速排序
消耗时间:5ms

以上的数据没有很大的代表性,而且测试面不全,因此只能得出大概的结论。(由于生成的是随机数据,因此每次运行时间都有细微差异)

  1. 首先看到,冒泡排序的时间消耗是最多的。因为它的比较,交换最多。
  2. 插入排序的性能优于选择排序。(可以看看知乎的评论)
  3. 总体来说,希尔、归并、堆和快速排序是比较好的选择。

九、排序算法总结

排序算法的实现与比较_第1张图片
排序算法总结

参考资料

经典排序算法总结与实现

图解堆排序

常见排序算法 - 堆排序 (Heap Sort)

你可能感兴趣的:(排序算法的实现与比较)