二叉树之堆的应用

目录

堆排序

思路详解

Ⅰ 建堆

Ⅱ 利用堆的删除思想来进行排序 

功能接口

向上调整算法

向下调整算法

主函数

运行结果展示

TOP - K问题

思路详解

Ⅰ 用数据集合中前K个元素来建堆

Ⅱ 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

功能接口

建小堆所需的向上调整算法

向下调整算法

创建数据集合的文件创建接口

堆排序接口

 TOP-K

运行结果展示

结语


堆排序

所谓堆排序,即是使用堆的思想来进行排序。

在堆中,我们逻辑上想象他是一棵树,但实际在物理上它是一个数组。

思路详解

Ⅰ 建堆

如果我们要将数据升序排列,那我们需要建大堆,如果降序排列,则建小堆。

升序:建大堆;

降序:建小堆。

Ⅱ 利用堆的删除思想来进行排序 

以升序为例,假设此时我们已经完成了大堆的创建。

还记得堆是如何删除的吗?

我们将堆顶与堆尾互换,然后删除堆尾,再向下调整。

但在堆排序中,我们互换之后并不删除堆尾,只是不再对堆尾进行操作。

试想,一个大堆,堆顶元素自然是最大的数据,当我们交换堆顶堆尾,最大的元素就到了堆尾,我们不再对其进行操作,逻辑上将其暂时剥离数组,随后再进行向下调整。循环往复。

我们来画图看看:

二叉树之堆的应用_第1张图片

功能接口

有关堆的一些基础特性可查看我的另一篇文章。数据结构之树 --- 二叉树-CSDN博客

向上调整算法

该接口建堆时使用。

//小堆
void SmaADjustUP(int* a, int child)
{
	int parent = (child - 1) / 2;
	while (child >= 0)
	{
		if (a[child] < a[parent])
		{
			swap(&a[child], &a[parent]);
			child = parent;
			parent = (parent - 1) / 2;
		}
		else
			break;
	}
}

向下调整算法

void SmaADjustDown(int *a,int size,int parent)
{
	int child = parent * 2 + 1;
	while (child < size)
	{
		if (child+1 < size && a[child] > a[child + 1])
		{
			child = child + 1;
		}
		if (a[child] < a[parent])
		{
			swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
			break;
	}
}

 当然,只使用向下调整算法也是可以的。

主函数

步骤操作在代码中有注释。

int main()
{
	int a[10] = { 2,5,3,9,6,8,7,1,10 };
	int len = 10;
	for (int i = 0; i < len; i++)//建堆
	{
		BigADjustUP(a,i);
	}
	while(len>0)
	{
		swap(&a[0], &a[len - 1]);//交换堆顶与堆尾
		BigADjustDown(a, len - 1, 0);//向下调整,注意此时传入的数组大小为len-1,并未将堆尾传入
		                            //即向下调整时不包括堆尾
		len--;//剥离堆尾
	}
	for (int i = 0; i < 10; i++)//打印操作
	{
		printf("%d ", a[i]);
	}
	return 0;
}

运行结果展示

二叉树之堆的应用_第2张图片

TOP - K问题

TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。

比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,

思路详解

Ⅰ 用数据集合中前K个元素来建堆

前k个最大的元素,则建小堆
前k个最小的元素,则建大堆

Ⅱ 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

以建小堆为例,我们要求前5个最大的元素。

假设此时我们已经建好5个元素的小堆,将剩余的元素依次与堆顶进行比较,如果大于堆顶,则与堆顶交换,然后进行向下调整算法,使堆时刻保持特性。直至集合中的数据全部比较完成,此时堆中的五个数就是数据集合中最大的五个数。

我们来看看例子 

二叉树之堆的应用_第3张图片

二叉树之堆的应用_第4张图片

按照上图方法比对,直至数据集合结束。

功能接口

建小堆所需的向上调整算法

向下调整算法

以上两个函数接口在堆排序中已经给出来了。

创建数据集合的文件创建接口

由于TOP-K问题一般用来处理大数据,因此我们需要创建一个乱序的含有大量数据的数据集合。

我们创建一个文件,向文件内写入一定数量的随机值,然后对文件中的数据进行操作。

void CreateFile(int n)
{
	srand(time(0));
	//const char* file = "data.txt";
	FILE* fin = fopen("data.txt", "w");
	
	if (fin == NULL)
	{
		perror("fopen error");
		return;
	}
	for (int i = 0; i < n; i++)
	{
		int num = (rand() + i) % 10000;
		fprintf(fin, "%d\n", num);
	}
	fclose(fin);
}

该过程我们需要用到 rand() 函数。

堆排序接口

将最后小堆中的数据进行升序排列

void heapSort(int* a, int len)
{
	int size = len;
	for (int i = 0; i < size; i++)
	{
		swap(&a[0], &a[len - 1]);
		SmaADjustDown(a, len - 1, 0);
		len--;
	}
	for (int i = 0; i < size; i++)
	{
		if (i % 5 == 0)
			printf("\n");
		printf("%d ", a[i]);
	}
}

 TOP-K

在该函数中,我们调用创建文件接口,完成数据集合文件的创建,然后取k个数建堆。

接下来将剩下的数据依次与堆顶比对,向下调整。

void PrintTopk(int n,int k)
{
	CreateFile(n);//创建数据集合的文件
	FILE* fout=fopen("data.txt", "r");
	if (fout == NULL)
	{
		perror("fopen errorPrint");
		return;
	}
	int* a = (int*)malloc(sizeof(int) * k);//开辟堆空间

	for (int i = 0; i < k; i++)//建k个数的堆
	{
		fscanf(fout,"%d",&a[i]);
		SmaADjustUP(a, i);
	}
	int tmp = 0;
	while (fscanf(fout, "%d", &tmp)!=EOF)//直至文件内的数据取完
	{
		if (tmp > a[0])
		{
			a[0] = tmp;
			SmaADjustDown(a, k, 0);
		}
	}
	heapSort(a, k);
	free(a);
	fclose(fout);
}

运行结果展示

这里创建了含有10000个整型数据的数据集合。

二叉树之堆的应用_第5张图片

数据集合的文件: 

二叉树之堆的应用_第6张图片

结语

关于堆的学习,我们就告一段落了,欢迎各位翻阅指正。 

你可能感兴趣的:(c语言学习篇,数据结构篇,数据结构,c语言,算法)