这节讲的是双指针算法,位运算,离散化,区间合并
2个指针指向不同的序列
比如归并排序
2个指针指向同一个序列
比如快速排序
对于形如
for(int i = 0; i < n; i++) {
for(int j = 0; j < n; j++) {
}
}
这一类的双层循环,可能可以使用双指针来进行优化,从而能够把时间复杂度从O(n2)降低到O(n),比如求一个数组中最长的连续不重复的子序列的长度
最容易想到的暴力解法是:枚举 i = 0~n,对于每个i,将其看作右端点,尝试找到其左边最远的左端点。
int maxLen = 0;
for(int i = 0; i < n; i++) {
for(int j = 0; j <= i; j++) {
// 若[j, i]区间内不包含重复元素
if(noRepeat(j, i)) maxLen = max(maxLen, i - j + 1);
}
}
经过简单的推算,可以得知,当某个[j, i]
区间内有重复元素,那么对于所有i + 1
之后的数作为右端点,其左边的最远端点,最多取到j + 1
。也就是说,随着i
从左往右移动,每个i
对应的最远的左端点j
,也只能单向地从左往右移动。所以可以采用双指针算法,两个指针i
,j
最多只需要各自从0走到n(共2n次操作),即可找到答案,时间复杂度为O(n)。
int maxLen = 1;
for(int i = 0, j = 0; i < n; i++) {
while(j <= i && hasRepeat(j, i)) j++; // 若[j, i]区间内包含重复元素, 右移j
maxLen = max(maxLen, i - j + 1); // 找到当前i作为右端点, 最长的子序列
}
// 其中 hasRepeat 函数检查是否有重复元素, 可以用哈希表,或者开一个数组用计数排序的思路
练习题:Acwing - 799: 最长连续不重复子序列
#include
using namespace std;
const int N = 1e5 + 10;
int n;
int q[N], c[N]; // 这里对于判断重复, 采用了计数排序的思想, 若数的范围较大, 或者数不是整数, 可以考虑用哈希表
int main() {
scanf("%d", &n);
for(int i = 0; i < n; i++) scanf("%d", &q[i]);
int res = 0;
for(int i = 0, j = 0; i < n; i++) {
c[q[i]]++; // i往后移动一位, 计数加一, 将q[i]这个数纳入判重的集合
while(c[q[i]] > 1) { // 若在[j, i]区间内有重复元素的话, 只可能重复新加入的这个q[i], 只需判断q[i]的个数大于1
// 有重复, j 往右移动一位
c[q[j]]--; // 将j这个位置的数的计数减1, 即把q[j]从判重的集合中移除
j++;
}
res = max(res, i - j + 1); // 针对该i, 找到最远的左端点j
}
printf("%d", res);
return 0;
}
练习题:Acwing - 800: 数组元素的目标和
#include
using namespace std;
const int N = 1e5 + 10;
int a[N], b[N];
int main() {
int n, m, x;
scanf("%d%d%d", &n, &m, &x);
for(int i = 0; i < n; i++) scanf("%d", &a[i]);
for(int i = 0; i < m; i++) scanf("%d", &b[i]);
int i = 0, j = m - 1;
while(i < n && j >= 0) {
int sum = a[i] + b[j];
if(sum < x) i++;
else if(sum > x) j--;
else break;
}
printf("%d %d\n", i, j);
return 0;
}
练习题:Acwing - 2816: 判断子序列
#include
using namespace std;
const int N = 1e5 + 10;
int a[N], b[N];
int main() {
int n, m;
scanf("%d%d", &n, &m);
for(int i = 0; i < n; i++) scanf("%d", &a[i]);
for(int i = 0; i < m; i++) scanf("%d", &b[i]);
int i = 0, j = 0;
while(i < n && j < m) {
if(a[i] == b[j]) {
i++;
j++;
} else j++;
}
if(i < n) printf("No\n");
else printf("Yes\n");
return 0;
}
双指针算法,通常是适用于有两层循环的情况(循环变量分别为i
,j
)。首先是写一个暴力的解法,然后观察一下i
和j
之间是否存在单调性的关系(即i
和j
是否都往着同一个方向移动,不回头)。若i
和j
之间存在着这种单调性关系,则我们可以用双指针,来将时间复杂度从O(n2)降低到O(n)。
双指针算法模板
for(int i = 0, j = 0; i < n; i++) {
while(j < i && check(i, j)) j++;
// 具体逻辑
}
获取一个数的二进制的第k位:x >> k & 1
即,先将x右移k位,然后和1
做与运算
获取一个数的二进制的最后一位1:lowbit(x) = x & -x
如,10的二进制表示是1010
,则对10做lowbit
运算,得到10
(二进制),转为十进制即为2
lowbit
运算的原理是,x & -x
,由于-x
采用补码表示,它等于对x的原码取反再加1,即-x = ~x + 1
比如 x 的二进制表示是:
100101000
,对x取反得
011010111
,加1得
011011000
所以x & (~X + 1)
,则x的最后一位1,被保留了下来,这个位置后面,两个数全是0,这个位置前面,两个数是取反,做与运算后也全为0。
lowbit
的最简单的应用:统计x的二进制表示中,1的个数。具体的实现方式是:每次对x做lowbit
运算,并将运算结果从x中减去。循环做下去,直到x被减为0,一共减了多少次,x中就有多少个1。
练习题:Acwing - 801: 二进制中1的个数
#include
using namespace std;
const int N = 1e5 + 10;
int n;
int lowbit(int x) {
return x & -x;
}
int main() {
scanf("%d", &n);
while(n--) {
int x;
scanf("%d", &x);
int c = 0;
while(x > 0) {
x -= lowbit(x);
c++;
}
printf("%d ", c);
}
return 0;
}
有的数组,其元素的值域很大,比如数组中的元素取值都是[0, 10^9]
,但元素的个数很少,比如只有1000个元素。
有时(例如计数排序的思想),我们需要将元素的值,作为数组的下标来操作。此时不可能开一个10^9
大小的数组。
此时我们把这些元素,映射为从0(或者从1)开始的自然数。(也可以理解为对稀疏数组进行压缩)
例子如下
有一个数组a,[1, 3, 100, 2000, 500000]
(已经排好序),我们把这个数组中的元素,映射为
[0, 1, 2, 3, 4]
,这个映射的过程,称之为离散化
离散化有2个要点:
a[i]
,算出其离散化后的值:由于原数组已经排好序,故这里用二分查找即可离散化的代码模板
// C++
vector<int> v; // 待离散化的数组
sort(v.begin(), v.end()); // 将数组先排序
v.erase(unique(v.begin(), v.end()), v.end()); // 对数组进行去重
// 进行离散化, 将数组的值依次映射到 0,1,2,3,4,5, ... 等自然数
// 根据数的值, 求出其离散化的值
int find(int x) {
int l = 0, r = v.size() - 1;
while(l < r) { // 找到第一个大于等于x的离散化的值
int mid = l + r >> 1;
if(v[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1; // 是否加1, 跟题目相关, 若是前缀和差分等需要下标从1开始, 则需要加1
}
练习题:Acwing - 802: 区间和
// C++, 自己的解法
// 只针对插入操作涉及到的数组下标, 进行离散化
#include
#include
#include
using namespace std;
const int N = 1e5 + 10;
int index[N], value[N];
void init(vector<pair<int, int>> v) {
for(int i = 0; i < v.size(); i++) {
index[i + 1] = v[i].first; // 记录原坐标, 这样以来, 在index数组中, i是离散化后的坐标, index[i]是离散化前的坐标
value[i + 1] = value[i] + v[i].second; // 记录这个坐标累加的值, 构造前缀和
// 离散化的坐标从1开始
}
}
int main() {
int n, m;
scanf("%d%d", &n, &m);
vector<pair<int, int>> insert;
while(n--) {
int x, c;
scanf("%d%d", &x, &c);
insert.push_back({x, c});
}
sort(insert.begin(), insert.end()); // 默认按照 pair 的 first 进行升序排列, 这里没有去重
// 离散化
init(insert);
while(m--) {
int l, r;
scanf("%d%d", &l, &r);
// 因为上面离散化时没有去重, 若对同一个位置x插入了多次, 则x会对应离散化后的多个连续坐标
// 如 [5,6] [5,7] 表示对x=5的位置, 添加值6和7, 则在离散化后的下标中, 可能x=5会对应 1,2 两个
// 所以下面取离散化的左边界时, 要取到 >= x 的第一个值
int ll = 1, lr = insert.size(); // 左边界
while(ll < lr) {
int mid = ll + lr >> 1;
if(index[mid] >= l) lr = mid;
else ll = mid + 1;
}
// 同样因为没有去重, 这里取右边界时, 要取到 <= x 的最后一个值
int rl = 1, rr = insert.size(); // 右边界
while(rl < rr) {
int mid = rl + rr + 1 >> 1;
if(index[mid] <= r) rl = mid;
else rr = mid - 1;
}
// 先预计算出一个结果
int res = value[rl] - value[ll - 1];
// 当 l 和 r 二分出来的位置是相同时, [l, r]区间内可能没有任何值
// 仅当 l <= index[ll] 并且 r >= index[ll] 时, [l, r] 之间才有值, 否则 [l, r]之间没有任何值, 结果应当为0
if(ll == rl && (l > index[ll] || r < index[ll])) res = 0;
printf("%d\n", res);
}
return 0;
}
// C++, 按照yxc的思路的解法
// 将所有用到的下标先存起来, 对全部下标进行离散化(所有的x, l, r)
#include
#include
#include
using namespace std;
typedef pair<int, int> PII;
const int N = 3e5 + 10; // 用到的下标总数为 n + 2m , 300000 量级
vector<PII> add; // 插入操作
vector<PII> query; // 询问操作
vector<int> index; //所有待离散化的下标
int s[N]; // 记录前缀和
int a[N]; // 记录值
// 进行离散化
int find(int x) {
int l = 0, r = index.size() - 1;
while(l < r) {
int mid = l + r >> 1;
if(index[mid] >= x) r = mid;
else l = mid + 1;
}
return l + 1; // 离散化后的下标从1开始, 因为需要计算前缀和
}
vector<int>::iterator unique(vector<int> &v) {
// 去除有序数组的重复元素
int j = 0;
for(int i = 0; i < v.size(); i++) {
if( i == 0 || v[i] != v[i - 1]) v[j++] = v[i];
}
// j 最后的位置是, 去重后的第一个位置
return v.begin() + j; //
}
int main() {
int n, m;
scanf("%d%d", &n, &m);
// 读入全部数据
while(n--) {
int x, c;
scanf("%d%d", &x, &c);
add.push_back({x, c});
index.push_back(x); // 添加待离散化的下标
}
while(m--) {
int l, r;
scanf("%d%d", &l, &r);
query.push_back({l, r});
index.push_back(l);// 添加待离散化的下标
index.push_back(r);
}
// 对所有的下标点进行离散化
sort(index.begin(), index.end()); // 先对 index 排序
index.erase(unique(index), index.end()); // 对 index 数组进行去重
// 处理插入
for(int i = 0; i < add.size(); i++) {
int p = find(add[i].first); // 找到待插入的位置(离散化后的位置)
a[p] += add[i].second; // 插入
}
// 计算前缀和
for(int i = 1; i <= index.size(); i++) {
s[i] = s[i - 1] + a[i]; // 对所有用到的下标, 计算前缀和
}
// 处理查询
for(int i = 0; i < query.size(); i++) {
int l = find(query[i].first);
int r = find(query[i].second);
printf("%d\n", s[r] - s[l - 1]);
}
return 0;
}
值域跨度很大,但是实际用到的数字的个数不多,这种场景适合用离散化
练习题:美团笔试题: 格子染色
给定很多个区间,若2个区间有交集,将二者合并成一个区间
做法思路:
练习题:Acwing - 8023: 区间合并
#include
#include
#include
using namespace std;
typedef pair<int, int> PII;
int main() {
int n;
vector<PII> segments;
scanf("%d", &n);
while(n--) {
int l, r;
scanf("%d%d", &l, &r);
segments.push_back({l, r});
}
// 数据读入完毕
// 排序
sort(segments.begin(), segments.end());
int cnt = 0; // 开始计数
for(int i = 0; i < segments.size(); i++) {
if(i == segments.size() - 1) {
// 当前的区间是最后一个区间
cnt++;
break;
} else {
// 存在后续区间, 进行合并
int r = segments[i].second; // 当前区间的右边界
// 当存在后续区间时, 进行循环合并
while(i + 1 < segments.size()) {
if(segments[i + 1].first > r) break; // 后一个区间和该区间不存在交集
else {
// 存在交集, 更新右边界
r = max(r, segments[i + 1].second);
i++;
}
}
cnt++; // 当前区间合并完毕, 计数 + 1
}
}
printf("%d", cnt);
return 0;
}
—2023/02/01更新,上面的区间合并代码写的复杂了,看下面更简洁的
#include
#include
#include
using namespace std;
typedef pair<int, int> PII;
int n, l, r;
vector<PII> seg;
int main() {
std::ios::sync_with_stdio(false);
cin >> n;
while (n--) {
cin >> l >> r;
seg.push_back({l, r});
}
sort(seg.begin(), seg.end());
int cnt = 1;
l = seg[0].first, r = seg[0].second;
for (int i = 1; i < seg.size(); i++) {
PII s = seg[i];
if (s.first <= r) r = max(r, s.second); // 可以合并
else {
cnt++;
l = s.first, r = s.second;
}
}
printf("%d\n", cnt);
return 0;
}