数据结构与算法之堆排序

数据结构与算法之堆排序

    • 前提条件
    • 基本概念
    • 算法步骤
      • 建立大根堆
      • 堆排序
    • 算法分析
      • 时间复杂度
      • 空间复杂度
    • 算法特点
    • 完整代码
      • 输出结果
    • 参考文献

前提条件

  • 熟悉C语言与指针
  • 熟悉数据结构与算法

基本概念

堆排序 (Heap Sort) 是 一 种树形选择排序,在排序过程中,将待排序的记录 r [ l . . n ] r[l..n] r[l..n]看成是一棵完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系,在当前无序的序列中选择关键字最大(或最小)的记录。

算法步骤

建立大根堆

建立大根堆

//筛选法调整堆
void HeapAdjust(SqList &L,int s,int m)
{
      
   //假设r[s+1..m]已经是堆,将r[s..m]调整为以r[s]为根的大根堆
	ElemType rc;
	int j;
	rc=L.r[s];
    for(j=2*s;j<=m;j*=2)
	{
     												//沿key较大的孩子结点向下筛选
		if(j<m&&L.r[j].key<L.r[j+1].key) ++j;		//j为key较大的记录的下标,比较左右节点大小
        if(rc.key>=L.r[j].key) break;      			//rc应插入在位置s上
		L.r[s]=L.r[j]; s=j; 
    }
	L.r[s]=rc;                          			//插入
}
//建初堆
void CreatHeap(SqList &L)
{
     
	//把无序序列L.r[1..n]建成大根堆
	int i,n;
	n=L.length;
	//printf("%d",n);
	for(i=n/2;i>0;--i)       					//反复调用HeapAdjust 
		HeapAdjust(L,i,n);
}												//CreatHeap

堆排序

堆排序利用了大根堆(或 小根堆) 堆顶记录的关键字最大(或最小)这一特征,使得当前无序的序列中选择关键字最大(或最小) 的记录变得简单。下面讨论用大根堆进行排序,堆排序的步骤如下。

  • ①按堆的定义将待排序序列r[1…n]调整为大根堆(这个过程称为建初堆),交换r[1]和r[n],则r[n]为关键字最大的记录。
  • ②将r[1…n-1]重新调整为堆,交换r[1]和r[n-1],则r[n-1]为关键字次大的记录。
  • ③循环n-1次,直到交换了r[1]和r[2]为止,得到了一个非递减的有序序列r[1 …n]。

堆排序

void HeapSort(SqList &L) 
{
      
	//对顺序表L进行堆排序 
	int i;
	ElemType x;
	CreatHeap(L);              					//把无序序列L.r[1..L.length]建成大根堆 
	for(i=L.length;i>1;--i)
	{
      
		x=L.r[1];               				//将堆顶记录和当前未经排序子序列L.r[1..i]中最后一个记录互换 
		L.r[1]=L.r[i];            
		L.r[i]=x; 
		HeapAdjust(L,1,i-1);					//将L.r[1..i-1]重新调整为大根堆 
   }//for 
}//HeapSort

算法分析

时间复杂度

  • 堆排序的运行时间主要耗费在建初堆和调整堆时进行的反复“筛选”上。
  • 设有n个记录的初始序列所对应的完全二叉树的深度为h,建初堆时,每个非终端结点都要自上而下进行“筛选"。由于第i层上的结点数小于等于 2 i − 1 2^{i-1} 2i1,且第i层结点最大下移的深度为h-i,每下移一层要做两次比较,所以建初堆时关键字总的比较次数为 ∑ i = h − 1 i 2 i − 1 ⋅ 2 ( h − i ) = ∑ i = h − 1 i 2 i ⋅ 2 ( h − i ) = ∑ j = 1 h − 1 2 h − j ⋅ j < = 2 n ∑ j = 1 h − 1 j / 2 j < = 4 n \sum\limits_{i=h-1}^i 2^{i-1}\cdot2(h-i)=\sum\limits_{i=h-1}^i 2^{i}\cdot2(h-i)=\sum\limits_{j=1}^{h-1} 2^{h-j}\cdot j<=2n\sum\limits_{j=1}^{h-1}j/2^j<=4n\quad i=h1i2i12(hi)=i=h1i2i2(hi)=j=1h12hjj<=2nj=1h1j/2j<=4n
    调整建新堆时要做 n-1次“筛选” ,每次“筛选”都要将根结点下移到合适的位置。 n个结点的完全二叉树的深度为 └ l o g 2 n ┘ + 1 \llcorner log_2n\lrcorner+1 log2n+1,则重建堆时关键字总的比较次数不超过
    2 ( └ l o g 2 ( n − 1 ) ┘ + └ l o g 2 ( n − 2 ) ┘ + . . . + └ l o g 2 2 ┘ ) < 2 n ( └ l o g 2 n ┘ ) 2(\llcorner log_2(n-1)\lrcorner+\llcorner log_2(n-2)\lrcorner+...+\llcorner log_22\lrcorner)<2n(\llcorner log_2n\lrcorner) 2(log2(n1)+log2(n2)+...+log22)<2n(log2n)
  • 由此,堆排序在最坏的情况下,其时间复杂度也为 O ( n l o g 2 n ) O(nlog_{2}n) O(nlog2n)
  • 实验研究表明,平均性能接近于最坏性能

空间复杂度

仅需一个记录大小供交换用的辅助存储空间,所以空间复杂度为O(1)。

算法特点

  • (1)是不稳定排序。
  • (2)只能用于顺序结构,不能用于链式结构
  • (3)初始建堆所需的比较次数较多,因此记录数较少时不宜采用。堆排序在最坏情况下时间复杂度为 O ( n l o g 2 n ) O(nlog_{2}n) O(nlog2n),相对于快速排序最坏情况下的 O ( n 2 ) O(n^2) O(n2)而言是一个优点,当记录较多时较为高效。

完整代码

//堆排序
#include
#include
#define  MAXSIZE  20          						//顺序表的最大长度
typedef struct
{
     
	int key;
	char *otherinfo;
}ElemType;
//顺序表的存储结构                         
typedef struct
{
     
    ElemType *r;	         						//存储空间的基地址
    int  length;            						//顺序表长度
}SqList;											//顺序表类型

//筛选法调整堆
void HeapAdjust(SqList &L,int s,int m)
{
      
   //假设r[s+1..m]已经是堆,将r[s..m]调整为以r[s]为根的大根堆
	ElemType rc;
	int j;
	rc=L.r[s];
    for(j=2*s;j<=m;j*=2)
	{
     												//沿key较大的孩子结点向下筛选
		if(j<m&&L.r[j].key<L.r[j+1].key) ++j;		//j为key较大的记录的下标,比较左右节点大小
        if(rc.key>=L.r[j].key) break;      			//rc应插入在位置s上
		L.r[s]=L.r[j]; s=j; 
    }
	L.r[s]=rc;                          			//插入
}
													//HeapAdjust								
void Create_Sq(SqList &L)
{
     
	int i,n;
	printf("请输入数据个数,不超过%d个\n",MAXSIZE);
	scanf("%d",&n);											//输入个数
	while(n>MAXSIZE)
	{
     
		printf("个数超过上限,不能超过%d,请重新输入",MAXSIZE);
		scanf("%d",&n);
	}
	printf("请输入待排序的数据:\n");
	for(i=1;i<=n;i++)
	{
     
		scanf("%d",&L.r[i].key);
		L.length++;
	}
}

//建初堆
void CreatHeap(SqList &L)
{
     
	//把无序序列L.r[1..n]建成大根堆
	int i,n;
	n=L.length;
	//printf("%d",n);
	for(i=n/2;i>0;--i)       					//反复调用HeapAdjust 
		HeapAdjust(L,i,n);
}												//CreatHeap

void HeapSort(SqList &L) 
{
      
	//对顺序表L进行堆排序 
	int i;
	ElemType x;
	CreatHeap(L);              					//把无序序列L.r[1..L.length]建成大根堆 
	for(i=L.length;i>1;--i)
	{
      
		x=L.r[1];               				//将堆顶记录和当前未经排序子序列L.r[1..i]中最后一个记录互换 
		L.r[1]=L.r[i];            
		L.r[i]=x; 
		HeapAdjust(L,1,i-1);					//将L.r[1..i-1]重新调整为大根堆 
   }//for 
}//HeapSort
void show(SqList L)
{
     
	int i;
	for(i=1;i<=L.length;i++)
		printf("%d ",L.r[i].key);
}
int main()
{
     
	SqList L;
	L.r=(ElemType*)malloc((MAXSIZE+1)*sizeof(ElemType));
	L.length=0;
	Create_Sq(L);//创建一个顺序表,里面存储着要排序的初始序列
	HeapSort(L);//对初始序列进行堆排序
	printf("排序后的结果为:\n");
	show(L);//输出排序后的结果为
	return 0;
}

输出结果

数据结构与算法之堆排序_第1张图片

参考文献

[1] 严蔚敏,吴伟民. 数据结构(C语言版). 北京: 清华大学出版社,2020
[2] 严蔚敏,李冬梅,吴伟民. 数据结构(C语言版)(第二版). 北京: 人民邮电出版社,2021
[3] 吴伟民,李小妹,刘添添,黄剑锋,苏庆,林志毅,李杨.数据结构. 北京:高等教育出版社,2017
[4] 王道论坛. 2022数据结构考研复习指导. 北京:电子工业出版社,2021

你可能感兴趣的:(数据结构与算法,数据结构,算法)