【算法·离散化】离散化的简单实现与运用

有关离散化

有一些数值的绝对数值过大,但是数据个数相对较小,为了方便统计,且需要去重,我们引入了离散化这一概念。在离散化中,每一个绝对数值都对应的映射一个离散数值。

例如有n=3时有三个数 { 1 0 7 , 1 0 8 , 1 0 9 } \{10^7,10^8,10^9\} {107,108,109},这三个数的绝对数值较大,但是n较小,如果题目对绝对数值对答案没有意义只是起到了相对大小的比较或者统计的作用,我们可以吧这三个数变成 { 1 , 2 , 3 } \{1,2,3\} {1,2,3}.这样,我们可以直接用数组标记。

离散化的程序实现

把所有数从小到大排序,把每一个不同的数值的第一个点存入另一个数组,例如 { 1 0 7 , 1 0 7 , 1 0 8 , 1 0 9 } \{10^7,10^7,10^8,10^9\} {107,107,108,109}映射在另一个数组中就是 { 1 0 7 , 1 0 8 , 1 0 9 } \{10^7,10^8,10^9\} {107,108,109}.如果对于每一个绝对数值需要查找映射数组的下标,因为序列是单调递增的,所以二分查找即可。

时间复杂度: O ( n l o g n ) O(nlogn) O(nlogn)

void discrete(void)
{
	sort(a+1,a+n+1);
	for (int i=1;i<=n;++i)
	     if (i == 1 || a[i]!=a[i-1]) b[++m]=a[i];
	for (int i=1;i<=n;++i)
	    rank[i]=lower_bound(b+1,b+n+1,a[i])-b;
}

离散化习题:电影

莫斯科正在举办一个大型国际会议,有n个来自不同国家的科学家参会。

每个科学家都只懂得一种语言。

为了方便起见,我们把世界上的所有语言用1到109之间的整数编号。

在会议结束后,所有的科学家决定一起去看场电影放松一下。

他们去的电影院里一共有m部电影正在上映,每部电影的语音和字幕都采用不同的语言。

对于观影的科学家来说,如果能听懂电影的语音,他就会很开心;如果能看懂字幕,他就会比较开心;如果全都不懂,他就会不开心。

现在科学家们决定大家看同一场电影。

请你帮忙选择一部电影,可以让观影很开心的人最多。

如果有多部电影满足条件,则在这些电影中挑选观影比较开心的人最多的那一部。

输入格式
第一行输入一个整数n,代表科学家的数量。

第二行输入n个整数a1,a2…an,其中ai表示第i个科学家懂得的语言的编号。

第三行输入一个整数m,代表电影的数量。

第四行输入m个整数b1,b2…bm,其中bi表示第i部电影的语音采用的语言的编号。

第五行输入m个整数c1,c2…cm,其中ci表示第i部电影的字幕采用的语言的编号。

请注意对于同一部电影来说,bi≠ci。

同一行内数字用空格隔开。

输出格式
输出一个整数,代表最终选择的电影的编号。

如果答案不唯一,输出任意一个均可。

Solution:

这道题目十分吻合离散化的特点, n , m ≤ 200000 n,m≤200000 n,m200000,符合 n l o g n nlogn nlogn的时间复杂度;且答案与语言无关。

我们要讲语言离散化,对着 2 ∗ m + n 2*m+n 2m+n个语言进行离散化,时间复杂度: O ( ( 2 ∗ m + n ) l o g ( 2 ∗ m + n ) ) O((2*m+n)log(2*m+n)) O((2m+n)log(2m+n)).

然后再将科学家的每一个语言都扔进桶内,枚举每一个电影判断即可。

代码如下:

#include
using namespace std;
int n,m,cnt=0;
int a[200001];
int b[200001];
int c[200001];
int p[600001];
int t[600001];
int Rank[200001];
int tot[600001];
map <int,int> vis; 
void discrete(void)
{
	int N=n+2*m,cnt=0;
	sort(t+1,t+N+1);
	for (int i=1;i<=N;++i)
	    if (i == 1 || t[i] !=t[i-1]) p[++cnt]=t[i];
	for (int i=1;i<=n;++i) Rank[i]=lower_bound(p+1,p+cnt+1,a[i])-p;
	for (int i=1;i<=m;++i) Rank[n+i]=lower_bound(p+1,p+cnt+1,b[i])-p;
	for (int i=1;i<=m;++i) Rank[n+m+i]=lower_bound(p+1,p+cnt+1,c[i])-p;
}
int main(void)
{
	scanf("%d",&n);
	for (int i=1;i<=n;++i) scanf("%d",a+i),t[i]=a[i];
	scanf("%d",&m);
	for (int i=1;i<=m;++i) scanf("%d",b+i),t[n+i]=b[i];
	for (int i=1;i<=m;++i) scanf("%d",c+i),t[n+m+i]=c[i];
	discrete();
	for (int i=1;i<=n;++i) tot[Rank[i]]++;
	//统计科学家的语言
	int Max1=0,Max2=0,ans=1;
	
	for (int i=1;i<=m;++i)
	{
		if (tot[Rank[n+i]] > Max1) 
		{
			Max1=tot[Rank[n+i]];
			Max2=tot[Rank[n+m+i]];
			ans=i;
		}
		if (tot[Rank[n+i]] == Max1 && tot[Rank[n+m+i]]>Max2)
		{
			Max2=tot[Rank[n+m+1]];
			ans=i;
		}
	} 
	//枚举每一个电影并统计答案 
	printf("%d\n",ans);
	return 0;
}

你可能感兴趣的:(排序·贪心·模拟,离散化,二分查找及二分答案,[算法进阶指南]习题题解)