有这么种情况,当整数范围很大,比如大到1e9,而数据范围很小,只有1e5甚至更小,我们若是想经常查询或者修改这些整数的位置,显而易见哈希就是很好的方法,但是由于整数太大,没有那么多数组将其存下,此时我们就可以用离散化的方法来解决
离散化:离散化的本质是建立了一段数列到自然数之间的映射关系(value -> index),通过建立新索引,来缩小目标区间,使得可以进行一系列连续数组可以进行的操作比如二分,前缀和等…
上面是y总给出的定义,可能有点抽象,简而言之就是
使用一个新的数组,这个新数组的值是原序列的下标,利用这个关系,建立起新数组的下标与原序列的关系,桥梁就是 新数组的值 == 原序列的下标
注意,原序列的下标是离散的,不是相邻的
还是有点抽象,可以举个例子
原序列前5个数的下标和值是 arr[0] = 1 ,arr[10] = 20 arr[200] = 300 arr[3000] = 5000 arr[40000] = 10000
新数组alls [0] = 0,alls[1] = 10,alls[2] = 200,alls[3] = 3000,alls[4] = 40000
注意观察橙色的数字,我们会发现,arr的下标就是alls数组的
这样我们就可以得到一个关系,arr [ alls[0] ] = 1, arr[ alls[ 1] ] = 20,arr[ alls [ 2]] = 300 , arr[ alls [3]] = 5000,arr[ alls[ 4]] = 10000;
这样是不是就变得很简单, 很清晰了
没错,离散化就是这样一种很简单的坐标映射
ps : 实际上我们在处理arr的数据时,是不开arr这个数组,而是直接把arr的下标存入alls中,毕竟arr也没法开那么大
有了以上的概念,那我们就可以开始写代码了
代码分为五大块,我会一一解读
这是例题链接:802. 区间和 - AcWing题库
本题综合了二分与前缀和,是个很好的模板题
在这一步,我们将要把所有的用到的arr下标存入alls数组当中
或许有的人会问,为什么 l 和 r 也要存进去啊
因为l和r可能也是很大的那种数字,比如1e9,并且l和r对应的其实是原序列的下标,而我们访问的其实是alls的数组,所以要将其与alls映射所以我们也需要将其离散化
又有人也行会问了,那离散l和r后,怎么保证求前缀和操作时的正确性,不会出现区间乱了的问题吗。
这个就问的很好了,当初我也是思考了很久
后来我恍然想到
原序列 l 和 r 中间的下标 一定是l
这就很好的解决了疑问
for(int i=1;i<=n;i++){ //离散化增加值区间
std::cin>>x>>c;//将x位置处加上c
add.push_back({x,c});//保存一下下标和值
alls.push_back(x);//将下标读入离散数组,开始映射
}
for(int i=1;i<=m;i++){ //离散化查询区间
std::cin>>l>>r;//输出l到r区间的值
query.push_back({l,r});
alls.push_back(l);//将两个下标存入离散下标数组
alls.push_back(r);
}
为什么一定要排序去重呢
排序是为了方便我们使用二分排序
去重是因为假设,我们 在修改时曾经用到过下标100,后来查询时又用到了下标 100,那么alls里面就会有两个100,那么alls会有两个下标映射这个值,也就是100这个值,这显然是不合理的,因为alls与原序列也是一一映射关系,只有确保唯一性,才能保证正确性
// 2 排序去重
sort(alls.begin(),alls.end());
alls.erase(unique(alls.begin(),alls.end()),alls.end());
使用alls的下标映射新的数组,相信大家到这应该已经能理解了
for(auto item:add){
int x = find(item.first); //将这个下标在alls数组中找到,使用alls的下标作为下标
sum[x]+=item.second;
}
for(int i=1;i<=alls.size();i++)sum[i] +=sum[i-1];
for(auto item:query){
int l = find(item.first);
int r =find(item.second);
std::cout<<sum[r]-sum[l-1]<<std::endl;
}
#include
#include
#include
typedef std::pair<int,int>PLL;
int n,m;//n次询问,m次查询
int x,c;//在x加上 c
int l,r;//输出区间值
std::vector<int>alls;//所有的下标放的位置
std::vector<PLL>add;//插入修改值
std::vector<PLL>query;//查询操作
int sum[3000000];//离散化后的数组,变成前缀和数组
int find(int x){
int l = -1,r = alls.size();
int mid = l+r>>1;
while(l+1<r){
if(alls[mid]>=x)r=mid;
else l = mid;
mid = l+r>>1;
}
return l+1;
}
int main(){
std:: cin>>n>>m;
// 1 第一步 离散化下标
for(int i=1;i<=n;i++){ //离散化插入区间
std::cin>>x>>c;
add.push_back({x,c});
alls.push_back(x);
}
for(int i=1;i<=m;i++){ //离散化查询区间
std::cin>>l>>r;
query.push_back({l,r});
alls.push_back(l);
alls.push_back(r);
}
// 2 排序去重
sort(alls.begin(),alls.end());
alls.erase(unique(alls.begin(),alls.end()),alls.end());
// 3 插入操作
for(auto item:add){
int x = find(item.first); //将这个下标在alls数组中找到,使用alls的下标作为下标
sum[x]+=item.second;
}
// 4 前缀和
for(int i=1;i<=alls.size();i++)sum[i] +=sum[i-1];
// 5 查询
for(auto item:query){
int l = find(item.first);
int r =find(item.second);
std::cout<<sum[r]-sum[l-1]<<std::endl;
}
return 0;
}