排序算法之堆排序

堆排序是一种树形选择排序,是对直接选择排序的有效改进。
堆是一种数据结构,其定义:任何一个非叶结点的值,都不大于(或不小于)其左右孩子结点的值。若父亲大孩子小,则这样的堆叫做大顶堆;若父亲小孩子大,则这样的堆叫做小顶堆。顾名思义,大顶堆的根结点的值是最大的,小顶堆的根结点的值是最小的。

基本思想

首先,将一个无序序列调整为大顶堆(小顶堆),我们就找到了这个无序序列的最大(或最小)值,然后将这个值交换到序列的最后(或最前)位置,这样有序序列元素就增加1个,无序序列元素减少1个,接着对这样的无序序列重复进行上述的操作,直到交换最后两个元素完成为止,我们就能得到最终的n个结点的有序序列。

代码

private void HeapSort(int[] a){
    int len = a.length;
    for (int j = 0; j < len; j++) {
        buildMaxHeap(a, len - j - 1);
        swap(a, 0, len - j - 1);
    }
}

private void buildMaxHeap(int[] a, int lastIndex) {
    /*
     * 从索引为lastIndex的结点(最后一个结点)的父结点开始
     */
    for (int i = (lastIndex + 1) / 2; i >= 0; i--) {
        int j = 2 * i;//j指向索引为i的结点的左孩子结点
        int temp = a[i];//暂时存储需要进行调整的结点
        /*
         * 当前索引为i的结点有孩子结点
         */
        while (j <= lastIndex) {
            /*
             * 如果索引为i的结点有孩子,则j指向孩子结点中值最大的结点
             */
            if (j < lastIndex && a[j] < a[j + 1])
                j++;
            /*
             *i指向的结点的值小于j指向的孩子结点的值,则交换两者
             *同时让i指向较大孩子结点,继续向下调整
             *否则此趟遍历结束,i所指向的位置就是需要调整结点的位置
             */
            if (temp < a[j]) {
                a[i] = a[j];
                i = j;
                j = 2 * i;
            } else
                break;
        }
        /*
         * 不需要进行调整后,让进行调整的结点回归到正确的位置(即i所指向的索引位置)
         */
        a[i] = temp;
    }
}

private void swap(int[] a, int i, int j) {
    int temp = a[i];
    a[i] = a[j];
    a[j] = temp;
}

性能分析

  • 时间复杂度
    堆排序的最坏时间复杂度为 O(nlog2n) 。堆排序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多,所以堆排序不适宜记录数较少的文件。
  • 空间复杂度
    堆排序的空间复杂度为 O(1)
  • 稳定性
    堆排序是一种不稳定的排序算法。
  • 堆排序优于简单选择排序的原因
    直接选择排序要执行 n1 趟(i=0,1,…,n-2),第i趟要从 ni 个元素中选出一个具有最小排序码的元素,需要进行 ni1 次排序码比较。当n比较大时,排序码比较次数相当多。这是因为在后一趟比较选择时,往往把前一趟已做过的比较又重复做了一遍,没有把前一趟比较的结果保留下来。而堆排序可以通过树形结构保存部分比较结果,可减少比较次数。

你可能感兴趣的:(数据结构与算法)