215. 数组中的第K个最大元素

和414的题是一样,我就是想用一下bfprt。可以代码一直有问题,下面第二个死机。

class Solution {
public:
void partition(vector& a, int left, int right, int &less, int &more)
{
	if(left>=right)
		return;
	int cur = left, index = right;
	less = left-1, more = right;
	while(cur& nums, int k) {
	int less=0, more=0, left=0,right=nums.size()-1;
	k = nums.size() - k;
	while(left=more)
			left=more;
		else
			return nums[k];
	}
	return nums[left];
}

};
#include
#include
#include
using namespace std;
#if 0
int medIndex(vectora, vectorindex, int left, int right)///<返回数组中位数的下标
{
	for(int i=1; i0 && a[index[j-1]]a, vectorindex, int left, int right)
{
	if(left>=right)
		return right;
	vectorvecbfprt;
	for(size_t i=0; imapa, int left, int right)
{
	vectorindex;
	for(int i=left; i<=right; ++i)
		index.push_back(i);
	for(int i=left+1; i<=right; ++i)
		for(int j=i; j>left && mapa[index[j-1]]<=mapa[index[j]]; --j)
			swap(index[j-1], index[j]);
	return index[index.size()/2];
}

int bfprt(const vectormapa, const vectorindex)
{
	if(1==index.size())
		return mapa[index[0]];
	vectornewIndex;	
	for(int i=0; i<(int)index.size()/5; ++i)
		newIndex.push_back(getMidIndex(mapa, i*5, i*5+4));
	if(0!=index.size()%5)
		newIndex.push_back(getMidIndex(mapa, index.size()/5*5, index.size()-1));
	auto bb = bfprt(mapa, newIndex);
	return bb;
}
void partition(vector& a, int left, int right, int &less, int &more)
{
	if(left>=right)
		return;
	vectorvecbfprt;
	for(int i=left;i<=right;++i)
		vecbfprt.push_back(i);
	auto x = bfprt(a, vecbfprt);
	swap(a[x], a[right]);
	int cur = left, index = right;
	less = left-1, more = right;
	while(cur& nums, int k) {
	int less=0, more=0, left=0,right=nums.size()-1;
	k = nums.size() - k;
	while(left=more)
			left=more;
		else
			return nums[k];
	}
	return nums[left];
}

int main(void)
{
	vectora={3,2,3,1,2,4,5,5,6};
	cout<

第K小的数是从1开始的,没有第0小的数。所有数没有重复的,如果有重复的可以用hash_set去重。

1.方法

法一:

这个方法不仅简单而且效率高。用类似于解决荷兰国旗问题partition问题的方法。随机选一个数作为划分值,小于这个数的放左边,等于这个数的放中间,大于这个数的放右边。假如等于区是200~500,我要找第300小的数就直接找到了。如果我要找第700小的数,就把大于区递归重新分配一下。

时间复杂度是个数学期望,结果是O(N)。最好情况是小于区和大于区大小一样。

法二:

BFPRT算法就求这个问题时间复杂度是稳定的O(N),连期望都不是,它就是在选择partition问题的那个数的时候做了文章。法一中选择那个数不是随机的嘛,所以产生了期望,如果我要是能用O(N)的时间找到一个不会偏缀的数,结果就稳定了。BFPRT就是在找这样一个数。

因为不管怎么找结果肯定不会错,顶天就是偏缀嘛,所以只要证明我找这个数的时间复杂度是O(N)就行。先说方法,再求时间复杂度。

2.操作

1)先把一组数每5个一组分组,分成N/5组,最后一组如果不满5个也成一组。其实这步其实没啥实际操作,就是变换下标而已。

2)每组的组内进行排序,组间不排序。

3)把这N/5个数组的中位数拿出来单独形成一个数组。最后一组不满5个的拿上中位数或下中位数都行,不满5个的组只有一个,完全不影响复杂度。

4)找着N/5个数的中位数。这里找中位数是递归调用BFPRT实现的。BFPRT函数的格式就是两个形参,一个是数组arr,一个是第k小数的k,返回值是数。int BFPRT(vectora,int k)。假设N/5的数组叫做arr,递归的时候可以写成BFPRT(arr,arr.size()/2),中位数嘛,所以一定是数组长度的一半。这个中位数记为

5)用这个进行partition。

6)如果命中K了就返回这个数,没命中就选择一侧走。

3.复杂度分析

1)O(1)

2)O(N),因为每组内只有5个数是O(1),一共有O(N/5)个数

3)O(N)

4)T(N/5),因为是N/5个数进行递归,找到中位数p

5)O(N),单纯的partition过程

6)判断是走左边还是走右边,用了BFPRT以后,左侧和右侧的规模就能够估计出来了。

估计的时候肯定是要估计最差的情况,最差的情况指的就是小于p的最多能有多少个数,这个不好求,可以变成求最少能有多少个数比p大,N再减去这个数就行了。怎么求,看下图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sfNmHbJa-1633870437089)()]

上图为一个排好序的数组,每组从上到小依次变大。每组的中位数提出来,这个中位数数组的大小是N/5,因为每组5个数嘛。对于中位数数组的中位数p而言,一共有1/2个数比它大,而这个数组大小为N/5,所以一共有N/10组数比P要大。每组一共有5个数,比该组中位数大的有两个,加上这个中位数一共是三个数,就是数所有中位数比p大的组中至少有3个数会比p要大。总共有N/10组,所以比p大的数至少有3N/10个。

再举个例子

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HwH9BLjf-1633870437127)()]

这里比7大的数就不止3N/10个,以为10和11都比7大。但10和11位置上的数可能比7小吗?可能,所以说至少有多少个,至少就只包括8、9、12、13和14。

有上述求解可知,小于区最大为7N/10,大于区至少也为7N/10,因此,该部分的时间复杂度为T(7N/10)。

所以总共的时间复杂度为

T(N)=O(N)+T(N/5)+T(7N/10)

不用数学推了,反正用5个数一组分T(N)是可以收敛到O(N)的,3个数也行,7个数也行,别的行不行我就不知道了,要看具体的数学证明,5个肯定是可以的。如果是3个一组呢?中位数数组的大小为N/3,所以1一共有N/6组数比p大,每组数中至少有两个数比p大,所以至少有有N/3个数比p要大,至多有2N/3个数比p要小。结果就是

T(N)=O(N)+T(N/3)+T(2N/3)

4.应用

取前k小的数,如果用堆做时间复杂度就是NlogN,我这样找到第k小的数,比它小的都要就行了。时间复杂度是O(N)。至于哈希那里有一道题是说读取流中前10大的数,那就不行了,因为流的数据太大,只能用堆。

5.我的代码

法一:

https://leetcode-cn.com/problems/kth-largest-element-in-an-array/

class Solution {
public:
void partition(vector& a, int left, int right, int &less, int &more)
{
	if(left>=right)
		return;
	int cur = left, index = right;
	less = left-1, more = right;
	while(cur& nums, int k) {
	int less=0, more=0, left=0,right=nums.size()-1;
	k = nums.size() - k;
	while(left=more)
			left=more;
		else
			return nums[k];
	}
	return nums[left];
}

};

法二:

我把对数器也写出来了,求的是第n大的,第n小的只要把求test1时的输入改改就行,其它代码都不变。LeetCode中需要单独去重。

#include
#include
#include
#include
using namespace std;
int BFPRT(vectora, int begin, int end, int k);
 
 
int getMedian(vectora, int begin, int end)//获取中位数
{
    sort(a.begin() + begin, a.begin() + end+1);//加一是因为sort不包括最后一个
    return a[(begin+end)/2];
}
int MedianOfMedians(vectora, int begin, int end)//找到中位数数组的中位数
{
    int n = end - begin + 1;
    int offset =(0 == n % 5) ? 0 : 1;
    int groupcount = n/5 + offset;
    vectorarr;
    for (int i = 0; i < groupcount; ++i)
    {
        int beginI = begin + i * 5;
        int endI = beginI + 4;
        arr.push_back(getMedian(a,beginI,min(end,endI)));//将beginI和endI之间的中位数返回,并推入中位数数组中
    }
    return BFPRT(arr,0,arr.size()-1,arr.size()/2);//在0和arr.size()-1的范围上求中位数
}
int *partition(vector&a, int left, int right,int key)//用可以对从begin到end的a进行分割
{
    int ll = left - 1;//ll是小于区和等于区的分界,属于小于区
    int rr = right + 1;//rr是等于区和大于区的分界,属于大于区
    int mid = left;
    while (mid < rr)
    {
        if (a[mid] > key)
            swap(a[mid], a[--rr]);
        else if (a[mid] < key)
            swap(a[mid++], a[++ll]);
        else
            ++mid;
    }
    int *p = (int*)malloc(8);
    *p = ll;
    *(p + 1) = mid;
    return p;
}
int BFPRT(vectora, int begin, int end, int k)//在begin和end的范围上求第k小的数
{
    if (end == begin)
        return a[begin];
    int p = MedianOfMedians(a,begin,end);//求中文数
    int *pp = partition(a,begin,end,p);//partition的同时进行排序
    int less = *pp, more = *(pp+1);//小于区和大于区的位置,中间就是等于区。less属于小于区,more属于大于区,所以下面k<=less有等于号,ka, int k)
{
    return BFPRT(a,0,a.size()-1,k-1);//因为没有第0小的数,所以要k-1
}
void print(vectora)
{
    for (int i = 0; i < a.size(); ++i)
        cout << a[i] << ",";
}
int main(void)//带有对数器
{
    srand((unsigned)time(NULL));
    for (int times = 0; times < 10000; ++times)
    {
        vectora;
        int n = rand() % 100 + 2;//数组长度为1~100的随机数
        n = 10;
        for (int i = 0; i < n; ++i)//数组长度为n
            a.push_back(rand() % 100+1);//数组中的元素时从1到100的随机数
 
        vectorprimitive(a.begin(), a.end());//因为正确的方法和待检测的方法都会对数组进行修改,但是为了能够打印出原始的,所以我留一个
        /*正确的方法*/
        vectorb(a.begin(),a.end());
        int k = rand() % n + 1;//1~n的随机数,第K大的数,这个数必须小于n啊
        sort(b.begin(),b.end(),less());
        /*正确的方法结束*/
 
        //test2是待检测的方法
        k = 1;
 
        int test1 = GetMinKByBFPRT(a, n + 1 - k);
        int test2 = b[n - k];
        if (test1 != test2)
        {
            print(primitive);
            cout << endl;
            cout << "k==" << k << endl;
            while(1);
        }
    }
    cout << "true" << endl;
    while(1);
    return 0;
}

https://leetcode-cn.com/problems/third-maximum-number/submissions/

你可能感兴趣的:(手撕leetcode,c++,算法,数据结构)