前K项最小值

1. 问题描述

从一些数据中找到前K个最小值。

Data = {a1, a2, a3, a4........, an}

Min  = {ai1, ai2, ..... aik}


2. 问题分析

求前K项最小值有几种方法如下:

(1)对数据排序,然后找到前K个最小值——效率太低

(2)采用快排的Partition方法,Partition就是选择一个数据,然后用这个值把数组分为2块,一块都小于它,一块都大于它。只要较小的那一块恰好是K个,就解决问题。

Data = {a1, a2, a3, a4........, an}

{a1, a2, ....} < ai < {ai......}


(3)将数组转换为最小堆的情况,根据最小堆的特性,第一个元素肯定就是数组中的最小值,这时候我们可以将元素保存起来,然后将最后一个元素提升到第一个元素,重新构建最小堆,这样进行K次的最小堆创建,就找到了前K个最小值,这是运用了最小堆的特性,实质上是最小堆的删除实现方法。这种算法的好处是实现了数组的原地排序,并不需要额外的内存空间。


(4)接下来的这种思想有点类似桶排序,首先给定一个K个大小的数组b,然后复制数组a中的前K个数到数组b中,将这K个数当成数组a的前K个最小值,对数组b创建最大堆,这时候再次比较数组a中的其他元素,如果其他元素小于数组b的最大值(堆顶),则将堆顶的值进行替换,并重新创建最大堆。

    这样遍历一次数组就找到了前K个最小元素。这种方法运用了额外的内存空间,特别当选择的K值比较大时,这种方法有待于权衡一下。
    这种方法对于海量数据来说是有较好的作用,对于海量数据不能全部存放在内存中,这时候创建一个较小的数组空间,然后创建最大堆,从硬盘中读取其他的数据,进而实现前K个数据的查找。


3. 算法实现

本文实现快排的方法

int Partition( int data[] , int left, int right)
{
	int tmp = data[right];

	while ( left < right )
	{
		while( data[left] <= tmp && left < right )
			left++;
		if( left < right )
		data[right] = data[left];

		while( tmp <= data[right] && left < right )
			right--;
		if( left < right )
		data[left] = data[right];
	}//while

	data[left] = tmp;

	return left;
}

void Find_Kth( int data[], int n, int k )
{
	int i_part_index = Partition(data, 0, n-1);

	if( i_part_index == k-1 )
		return ;
	else if( i_part_index < k-1 )
		Find_Kth( data+i_part_index+1, n-i_part_index-1, k-i_part_index-1 );
	else
		Find_Kth( data, i_part_index, k );

}


4. 算法分析

(1)最好情况

O(n)——通过一次Partition就找到前K个最小值

(2)最坏情况

k(2n-k+1)/2——每次只能找到一个值




你可能感兴趣的:(C++,算法,前K项最小值)