[Daimayuan] 全部相等(C++,数学)

* 注:题名的灵感来自 代码源 #914: 一半相等


给定长度为 n n n 的数组 A {A} A

派派非常喜欢 所有元素出现频率相同 的数组,但这样的数组却不常有。派派很伤心 (;´༎ຶД༎ຶ`)。不过聪明的你,发现总能从 A {A} A 中挑选一个子序列满足上述条件。问此子序列最长为多长?

数据规模

  • 1 ≤ n ≤ 2 × 1 0 5 1≤n≤2×10^5 1n2×105
  • A i ∈ [ 1 , 1 0 9 ] A_i∈[1,10^9] Ai[1,109]

输入格式

输入包含两行,第一行有一个整数 n n n,表示 A {A} A 的大小。

接下来一行包含 n n n 个用空格分隔的整数,依次表示 A 1 , A 2 , ⋯ , A n A_1,A_2,⋯,A_n A1,A2,,An

输出格式

输出答案。

样例 1 输入

6
1 3 2 1 4 2

样例 1 输出

4

解释:

[1,3,2,1,4,2] 满足条件且最长。

样例 2 输入

4
100 100 4 100

样例 2 输出

3

样例 3 输入

8
1 2 3 3 3 2 6 6

样例 3 输出

6

解题思路

根据题意,我们有这样一种直觉:

所选择的公共词频过低的时候,会有很多元素,但是每个元素出现的次数很少;

所选择的公共词频过高的时候,会有很少的元素,但是每个元素出现的次数很多。

类似于下面这个简单的函数:
y = − x 2 y=-x^2 y=x2
所以我们知道答案在区间的中间位置,但是应该如何搜索?

因为答案不具有单调性,所以不能二分搜索。

所以我们直接放弃思考开始爆搜。

在统计词频过程中,由于取值范围过大,使用map容器进行离散化。

然后将数据转移到vector容器中进行排序,方便后续操作。

最后是本题的关键,搜索代码部分:

while (temp_freq) {
	while (iter != arr.end() && temp_freq <= iter->first) {
		cnt++;
		iter++;
	}
	ans = max(ans, temp_freq * cnt);//每次统计结束后更新答案(ans=所选词频*元素数量)
	temp_freq--;
}

对于每一个键值对,我们以词频作为键值,然后根据键值降序排序。

从高频开始尝试,这样可以不断拓展元素的数量,而不是每次都要重新计算。

AC代码如下:

#include 
#include 
#include 
#include 
using namespace std;
const int max_n = 2e5;
const int max_a = 1e9;

int n;
map<int, int>freq;
vector<pair<int, int>>arr;

int main() {
	cin >> n;
	int temp;
	for (int i = 0; i < n; i++) {
		cin >> temp;
		freq[temp]++;
	}
    
	for (auto iter : freq) arr.push_back({iter.second,iter.first});
	sort(arr.begin(), arr.end(), [](pair<int, int>p1, pair<int, int>p2) {
		return p1.first > p2.first;
		});
	
    int temp_freq = arr.begin()->first, cnt = 0;
	int ans = 0;
	vector<pair<int, int>>::iterator iter = arr.begin();
	while (temp_freq) {
		while (iter != arr.end() && temp_freq <= iter->first) {
			cnt++;
			iter++;
		}
		ans = max(ans, temp_freq * cnt);
		temp_freq--;
	}
	cout << ans << endl;
	return 0;
}

你可能感兴趣的:(数学,c++,算法,开发语言,数学,离散化)