(一)堆排序法

一、简介

二叉堆是完全二叉树或者是近似完全二叉树。

二叉堆满足二个特性:
1.父结点的键值总是大于或等于(小于或等于)任何一个子节点的键值
2.每个结点的左子树和右子树都是一个二叉堆(都是最大堆或最小堆)
当父结点的键值总是大于或等于任何一个子节点的键值时为最大堆。当父结点的键值总是小于或等于任何一个子节点的键值时为最小堆

堆排序是一种树形选择排序,是对直接选择排序的有效改进。

堆的定义下:具有n个元素的序列 (h1,h2,...,hn),当且仅当满足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最大项(大顶堆)。完全二叉树可以很直观地表示堆的结构。堆顶为根,其它为左子树、右子树。

思想:初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储序,使之成为一个堆,这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推,直到只有两个节点的堆,并对它们作交换,最后得到有n个节点的有序序列。从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。

二、步骤

  1. 产生初始堆
  2. 把堆顶的最大数取出,将剩余的堆继续调整为最大堆,以递归实现
  3. 剩余部分调整为最大堆后,再次将堆顶的最大数取出,再将剩余部分调整为最大堆,这个过程持续到剩余数只有一个时结束

三、示例

(一)堆排序法_第1张图片

初始堆的构建

(一)堆排序法_第2张图片

堆排序

(一)堆排序法_第3张图片


四、代码实现

1. ShiftUp

// 将元素向上移动(将k位置的元素与父节点交换位置)
void shiftUp(int k) {
    while (k > 1 && data[k / 2] < data[k]) {    // data[k/2]是父节点,data[k]是该元素
        swap(data[k / 2], data[k]);
        k /= 2;     //更新一下k,以看与新的父节点之间是否违背了最大堆的定义。保证k最多到2,父节点k/2就是1
    }
}

2. ShiftDown

// 左(j)右(j+1)两个孩子比较,谁大就和父节点k交换,向下进行转换
void shiftDown(int k) {
    while (2 * k <= count) {    // 怎么表示k位置元素有孩子?在完全二叉树中只要有左孩子就表示有孩子了
        int j = 2 * k;  // 如果没有右孩子.在此轮循环中,data[k]和data[j]交换位置
        if (j + 1 <= count && data[j + 1] > data[j]) j++; // j + 1 <= count说明有右孩子   并且   右孩子比左孩子大   则j+=1
        if (data[k] >= data[j]) break;  // 如果父节点>=两个孩子就跳出循环,否则data[k]和data[j]进行交换
        swap(data[k], data[j]);
        k = j;  // 以后继续移动k位置的元素
    }
}

3. insert

// 向堆中添加一个元素。将新加入的元素放置到合适的位置(与它的父节点比大小,看是否违背了最大堆的定义)
void insert(Item item) {
    assert(count + 1 <= capacity);
    data[count + 1] = item;
    shiftUp(count + 1);
    count++;
}

4. extractMax

// 从堆中取出最大值,然后count-=1。取出后要把最后一个元素填补到该位置。最后调整位置保证最大堆定义
Item extractMax() {
    assert(count > 0);
    Item ret = data[1]; // 取出最大值
    swap(data[1], data[count]); // 将最大值元素与最后一个元素交换
    count--;    // 不考虑count位置的元素了
    shiftDown(1);   // 将第一个位置的元素向下移到合适的位置以满足最大堆的定义
    return ret;
}

5. 排序函数1

template
void heapSort1(T arr[], int n) {
    MaxHeap maxheap = MaxHeap(n);
    for (int i = 0; i < n; i++)
        maxheap.insert(arr[i]);

    for (int i = n - 1; i >= 0; i--)    // 反向遍历,这样排序出来是递增顺序
        arr[i] = maxheap.extractMax();

}

6. 排序函数2

template
void heapSort2(T arr[], int n){

    MaxHeap maxheap = MaxHeap(arr,n); // 已经构造成了一个堆,更快
    for( int i = n-1 ; i >= 0 ; i-- )
        arr[i] = maxheap.extractMax();

}

完整代码

#include 
#include 
#include 
using namespace std;

template
class MaxHeap {
private:
    Item *data;
    int count;
    int capacity;

    // 将元素向上移动(将k位置的元素与父节点交换位置)
    void shiftUp(int k) {
        while (k > 1 && data[k / 2] < data[k]) {    // data[k/2]是父节点,data[k]是该元素
            swap(data[k / 2], data[k]);
            k /= 2;     //更新一下k,以看与新的父节点之间是否违背了最大堆的定义。保证k最多到2,父节点k/2就是1
        }
    }

    // 左(j)右(j+1)两个孩子比较,谁大就和父节点k交换,向下进行转换
    void shiftDown(int k) {
        while (2 * k <= count) {    // 怎么表示k位置元素有孩子?在完全二叉树中只要有左孩子就表示有孩子了
            int j = 2 * k;  // 如果没有右孩子.在此轮循环中,data[k]和data[j]交换位置
            if (j + 1 <= count && data[j + 1] > data[j]) j++; // j + 1 <= count说明有右孩子   并且   右孩子比左孩子大   则j+=1
            if (data[k] >= data[j]) break;  // 如果父节点>=两个孩子就跳出循环,否则data[k]和data[j]进行交换
            swap(data[k], data[j]);
            k = j;  // 以后继续移动k位置的元素
        }
    }

public:
    // 构造函数
    MaxHeap(int capacity) {
        data = new Item[capacity + 1];
        count = 0;
        this->capacity = capacity;
    }
    MaxHeap(Item arr[], int n) {
        data = new Item[n + 1];
        capacity = n;

        for (int i = 0; i < n; i++)
            data[i + 1] = arr[i];
        count = n;

        for (int i = count / 2; i >= 1; i--)
            shiftDown(i);
    }
    ~MaxHeap() {
        delete[] data;
    }
    int size() {
        return count;
    }
    bool isEmpty() {
        return count == 0;
    }

    // 向堆中添加一个元素。将新加入的元素放置到合适的位置(与它的父节点比大小,看是否违背了最大堆的定义)
    void insert(Item item) {
        assert(count + 1 <= capacity);
        data[count + 1] = item;
        shiftUp(count + 1);
        count++;
    }

    // 从堆中取出最大值,然后count-=1。取出后要把最后一个元素填补到该位置。最后调整位置保证最大堆定义
    Item extractMax() {
        assert(count > 0);
        Item ret = data[1]; // 取出最大值
        swap(data[1], data[count]); // 将最大值元素与最后一个元素交换
        count--;    // 不考虑count位置的元素了
        shiftDown(1);   // 将第一个位置的元素向下移到合适的位置以满足最大堆的定义
        return ret;
    }

    Item getMax() {
        assert(count > 0);
        return data[1];
    }
};

template
void heapSort2(T arr[], int n) {

    MaxHeap maxheap = MaxHeap(arr, n);
    for (int i = n - 1; i >= 0; i--)
        arr[i] = maxheap.extractMax();

}

template
void heapSort1(T arr[], int n) {

    MaxHeap maxheap = MaxHeap(n);
    for (int i = 0; i < n; i++)
        maxheap.insert(arr[i]);

    for (int i = n - 1; i >= 0; i--)
        arr[i] = maxheap.extractMax();

}

template
void heapSort(T arr[], int n) {

    // 从(最后一个元素的索引-1)/2开始
    // 最后一个元素的索引 = n-1
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
        __shiftDown2(arr, n, i);

    for (int i = n - 1; i > 0; i--) {
        swap(arr[0], arr[i]);
        __shiftDown2(arr, i, 0);
    }
}

int main()
{
    int a[10] = { 3,2,5,21,9,10,7,16,8,20 };
    heapSort(a,10);
    for (int i = 0; i < 10; i++) {
        cout << a[i] << " ";
    }
}

五、评价

由于每次重新恢复堆的时间复杂度为O(logN),共N 1次重新恢复堆操作,再加上前面建立堆时N/2次向下调整,每次调整时间复杂度也为O(logN)。二次操作时间相加还是O(N logN)。故堆排序的时间复杂度为O(N logN)。

经典排序算法 - 堆排序Heap sort
经典排序算法系列7----堆与堆排序
选择排序:堆排序(Heap Sort)
白话经典算法系列之七 堆与堆排序

你可能感兴趣的:((一)堆排序法)