比较简单吧
方法 1 快排取前k个
方法2 不快排,递归求partion,时间 复杂度O(n)吧
#include "stdio.h" int Partion(int *data,int s,int e) { int key =data[e]; int i=s-1; int j; int temp; for(j=s;j<e;j++) { if(data[j]<key) { temp = data[i+1]; data[i+1]=data[j]; data[j]=temp; i+=1; } } temp =data[i+1]; data[i+1]=key; data[e]=temp; return i+1; } void quickSort(int *data,int s,int e,int k) { int p; int len; if(s<e) { p =Partion(data,s,e); len = p-s+1; if(len == k) return; else if(len<k) { quickSort(data,p+1,e,k-len); } else { quickSort(data,s,p-1,k); } } } int main() { int data[]={4,5,1,6,2,7,3,8}; int len =sizeof(data)/sizeof(data[0]); int k; int i=0; scanf("%d",&k); quickSort(data,0,len-1,k); for(i=0;i<k;i++) printf("%d ",data[i]); }
看海涛书上面 有一个o(nlogK)的方法,这个方法适合与海量数据搜索
很经典了。
利用一个容器,存储k个元素,同时记录其最大元素,如果插入元素大于它,则删除容器一个元素,插入它,否则继续。
这样就可以保住容器里面始终都是最小的k个元素,当然有n个元素 ,当然时间复杂度为o(nlogk)
搞了好一阵子,采用multiset搞了一个版本出来,不过话说 c++的stl库真心好用啊,编程遇到这种问题估计使用stl实现,速度会快很多的
代码如下
#include <set> #include <iostream> using namespace std; struct cmp{ bool operator()(const int &a,const int &b)const { return a>b; } }; void getListK(int *data,int start,int len,int k,multiset<int,cmp> &mySet) { int i=start; mySet.clear(); for(i=start;i<len;i++) { if (mySet.size()<k) { mySet.insert(data[i]); } else { multiset<int,cmp>::iterator iter=mySet.begin(); if(data[i]<*(mySet.begin())) { mySet.erase(iter); mySet.insert(data[i]); } } } } int main() { int data[]={4,5,1,6,2,7,3,8}; int k; int len = sizeof(data)/sizeof(data[0]); scanf("%d",&k); multiset<int,cmp> mySet; getListK(data,0,len,k,mySet); multiset<int,cmp>::iterator iter; for(iter=mySet.begin();iter != mySet.end();iter++) cout<<*iter<<' '; return 0; }据说multiset是使用红黑树实现的插入和删除都是logk的复杂度,同时我定义最大元素在最前面,这样直接取第一个元素就行咯。
好方法,多总结。
multiset可以运行容器包含相同元素
而set则不可以