【算法模板】离散化

目录

一、模板

二、例题

三、代码

 


一、模板

有许多数分布在数轴上,数的取值范围很广,但是这些数的个数相对来说不是很多,要求对数轴上某个区间上的数进行求和等操作,可使用离散化模版,将数值映射到下标。

基本的步骤可以分为:

1、用一个辅助的数组把你要离散的所有数据存下来。

2、排序,排序是为了后面的二分。

3、去重,因为我们要保证相同的元素离散化后数字相同。

4、索引,再用二分把离散化后的数字放回原数组。

vector alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end());   // 去掉重复元素

// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
    int l = 0, r = alls.size() - 1;
    while (l < r)
    {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1; // 映射到1, 2, ...n
}

 

二、数据分析

比如,这组数据:

1,23424,242,65466,242,0

排序后得到:

0,1,242,242,23424,65466

然后会去重,得到:

0,1,242,23424,65466

然后离散化的到:

1,3,2,4,2,0

三、例题

模板题 AcWing 802. 区间和
假定有一个无限长的数轴,数轴上每个坐标上的数都是 0。
现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c。
接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l,r] 之间的所有数的和。
输入格式
第一行包含两个整数 n 和 m。
接下来 n 行,每行包含两个整数 x 和 c。
再接下来 m 行,每行包含两个整数 l 和 r。
输出格式
共 m 行,每行输出一个询问中所求的区间内数字和。
数据范围
−109≤x≤109,
1≤n,m≤105,
−109≤l≤r≤109,
−10000≤c≤10000
输入样例:
3 3
1 2
3 6
7 5
1 3
4 6
7 8
输出样例:
8
0
5

  • 将数组a排序并去重(离散化之前必须先进行排序和去重)
  • 如何快速求出a[i]离散化后的值(二分查找)
#include 
#include 
#include 

using namespace std;
const int N = 300010; //n次插入和m次查询相关数据量的上界

typedef pair PII;
vector add, query; //存储插入和询问操作的数据
vector alls; //存储所有待离散化的值(所有与插入和查询有关的),将待离散化的值映射到alls的下标

int a[N], s[N]; // a[N]用来表示离散化后的数组,s[N]用来表示前缀和
int n, m;
//二分求出x对应的离散化的值
int find(int x) { //找到第一个大于等于x的位置
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;
}

int main() {
    cin >> n >> m;
    while (n--) {
        int x, c;
        cin >> x >> c;
        add.push_back({x, c});
        alls.push_back(x);
    }
    while (m--) {
        int l, r;
        cin >> l >> r;
        query.push_back({l, r});
        alls.push_back(l);
        alls.push_back(r);
    }
    //排序,去重
    sort(alls.begin(), alls.end()); //将所有待离散化的值进行排序
    alls.erase(unique(alls.begin(), alls.end()), alls.end()); 去掉重复元素
    //处理插入
    for (auto item : add) {
        int x = find(item.first);
        a[x] += item.second;
    }
    //处理前缀和
    for (int i = 1; i <= alls.size(); i++) s[i] = s[i - 1] + a[i];
    //处理询问
    for (auto item : query) {
        int l = find(item.first), r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }
    return 0;
}

四、注意事项

1、去重并不是把数组中的元素删去,而是重复的部分元素在数组末尾,去重之后数组的大小要减一。

2、二分的时候,注意二分的区间范围,一定是离散化后的区间。

3、如果需要多个数组同时离散化,那就把这些数组中的数都用数组存下来。

 

练习题

你可能感兴趣的:(算法模板,c语言,算法,数据结构,c++)