离散化:两种离散化方式详解+unique

作者:weixin_43061009
来源:CSDN
原文:https://blog.csdn.net/weixin_43061009/article/details/82083983
//先排序在二分查找//把数据和原来位置存结构体再排序

引入

离散化,就是把一些很离散的点给重新分配。

举个例子,如果一个坐标轴很长(>1e10),给你1e4个坐标,询问某一个点,坐标比它小的点有多少。

很容易就知道,对于1e4个点,我们不必把他们在坐标轴上的位置都表示出来,因为我们比较有多少比它小的话,只需要知道他们之间的相对大小就可以,而不是绝对大小,这,就需要离散化。

而离散化又分为两种,分为的两种是对于重复元素来划分的。第一种是重复元素离散化后的数字相同,第二种就是不同。

第一种

其实就是用一个辅助的数组把你要离散的所有数据存下来。

然后排序,排序是为了后面的二分。

去重,因为我们要保证相同的元素离散化后数字相同。

再用二分把离散化后的数字放回原数组。

代码如下。


#include // 头文件 
//n 原数组大小 num 原数组中的元素 lsh 离散化的数组 cnt 离散化后的数组大小 
int lsh[MAXN] , cnt , num[MAXN] , n;
for(int i=1; i<=n; i++) {
	scanf("%d",&num[i]);
	lsh[i] = num[i];	
}
sort(lsh+1 , lsh+n+1);
cnt = unique(lsh+1 , lsh+n+1) - lsh - 1;
for(int i=1; i<=n; i++)
	num[i] = lower_bound(lsh+1 , lsh+cnt+1 , num[i]) - lsh;

注意事项:

1.去重并不是把数组中的元素删去,而是重复的部分元素在数组末尾,去重之后数组的大小要减一

2.二分的时候,注意二分的区间范围,一定是离散化后的区间

3.如果需要多个数组同时离散化,那就把这些数组中的数都用数组存下来

第二种

第二种方式其实就是排序之后,枚举着放回原数组

用一个结构体存下原数和位置,按照原数排序

我结构体里面写了个重载,也可以写一个比较函数

最后离散化后数在 r a n k [ ] rank[] rank[]里面


#include
struct Node {
	int data , id;
	bool operator < (const Node &a) const {
		return data < a.data;
	}
};
Node num[MAXN];
int rank[MAXN] , n;
for(int i=1; i<=n; i++) {
	scanf("%d",&num[i].data);
	num[i].id = i;
}
sort(num+1 , num+n+1);
for(int i=1; i<=n; i++)
	rank[num[i].id] = i;

总结

先送一道有离散化的题:Luogu1955

很水的一道题,解析在这:NOI2015程序自动分析

用的最多的是第一种方法,第二种方法感觉比较陌生,不过还是需要学的。

有不对的地方欢迎更正,只要看见一定采纳。

——————————————————————————————————————————————————————————
  • 例题:POJ 2299 Ultra-QuickSort(树状数组求逆序数)
  • 数据离散化的过程中也经常会用到unique:C++STL中的unique函数解析

u n i q u e 主 要 内 容 : \color{red}{unique主要内容:} unique

一.总述
  unique函数属于STL中比较常用函数,它的功能是元素去重。即 “删除”序列中所有相邻的重复元素(只保留一个)。此处的删除,并不是真的删除,而是指重复元素的位置被不重复的元素给占领了(详细情况,下面会讲)。由于它“删除”的是相邻的重复元素,所以在使用unique函数之前,一般都会将目标序列进行排序。
  
二.函数原型
unique函数的函数原型如下:
1.只有两个参数,且参数类型都是迭代器:

iterator unique(iterator it_1,iterator it_2);

这种类型的unique函数是我们最常用的形式。其中这两个参数表示对容器中[it_1,it_2)范围的元素进行去重(注:区间是前闭后开,即不包含it_2所指的元素),返回值是一个迭代器,它指向的是去重后容器中不重复序列的最后一个元素的下一个元素。

注:
1.有很多文章说的是,unique去重的过程是将重复的元素移到容器的后面去,实际上这种说法并不正确,应该是把不重复的元素移到前面来。
2.一定不要忘记的是,unique函数在使用前需要对容器中的元素进行排序(当然不是必须的,但我们绝大数情况下需要这么做)。

例题:POJ2528-Mayor’s posters
(从题目中的样例数据中也可以看出离散化时排序的必要性)

你可能感兴趣的:(小东西)