有一个包含 N N N个数的序列( N ≤ 1 e 6 N \leq 1e6 N≤1e6),给 Q ( ≤ 1 e 6 ) Q(\le 1e6) Q(≤1e6)个操作,每个操作是下面两种中的一种:
一种很暴力的想法是对每个操作都一遍循环进行修改、求和,显然会超时;看到区间求和很容易就能想到前缀和,这样可以把区间求和降到常数复杂度,然而区间加还是 O ( N ) O(N) O(N);区间加想到差分,然而求和会超时;这时就需要线段树登场了
线段树是一种实用的数据结构,它可以快速地处理区间操作,维护区间信息。线段树是一棵二叉树,它的每一个节点存储的是一个区间的信息(如区间和, 左右端点等),如下图所示
笔者个人比较习惯用结构体来定义每一个节点,如果只开 2 N 2N 2N个节点,有一些情况是不够的,索性开到 4 N 4N 4N,并从上到下,从左向右进行编号,根节点编号为1,其左儿子是2,右儿子是3,一次类推:
#define ls (k << 1) // 左儿子
#define rs (ls | 1) // 右儿子
struct Node {
int l, r, sum, lazy; // l为左端点,r为端点,sum是区间和, lazy是懒标记下文会讲
Node() {}
Node(int _l, int _r, int _sum, int _lazy=0) : l(_l), r(_r), sum(_sum), lazy(_lazy) {}
inline int length() {return r - l + 1; } // 返回区间长度
inline ll mi() { return (l + r) >> 1; } // 返回中间点
} node[N << 2];
每次更新了较低一层的区间信息时,需要维护其父节点的信息,比如区间信息为区间和 s u m sum sum时,维护时父节点的 s u m sum sum值等于其左右儿子的 s u m sum sum值的和
inline update(int k) {
node[k].sum = node[ls].sum + node[rs].sum;
}
建树从最上一层节点开始向下,一旦遇到叶子节点(区间长度为1的点),说明到最底层了,则返回,再递归地更新其父节点的区间信息
void build(int l, int r, int k) { // k是编号
if(l == r) { // 叶子节点,输入它的值并返回
int a;
scanf("%d", &a);
node[k] = Node(l, r, a);
return ;
}
node[k].l = l; node[k].r = r;
int mid = node[k].mi();
build(l, mid, ls);
build(mid + 1, r, rs);
update(k);
}
(注意区分等待加的区间 [ l , r ] [l,r] [l,r]和节点 k k k上的区间 [ n o d e [ k ] . l , n o d e [ k ] . r ] [node[k].l, node[k].r] [node[k].l,node[k].r]!!)在区间 [ l , r ] [l,r] [l,r]上加 a d d n u m addnum addnum:从根节点开始,如果我们所在的节点的区间 [ n o d e [ k ] . l , n o d e [ k ] . r ] ⊆ [ l , r ] [node[k].l, node[k].r] \subseteq [l,r] [node[k].l,node[k].r]⊆[l,r],那么说明这个节点区间的每个值都需要被加 a d d n u m addnum addnum;否则,说明节点上的区间没有被完全包含在 [ l , r ] [l,r] [l,r]中,如果 r > m i d ( m i d 是 节 点 的 区 间 中 值 ) r>mid(mid是节点的区间中值) r>mid(mid是节点的区间中值),说明区间 [ m i d + 1 , r ] [mid + 1, r] [mid+1,r]这个区间还需要加上 a d d n u m addnum addnum,所以进入右儿子节点;如果 l < = m i d l <= mid l<=mid,说明区间 [ l , m i d ] [l, mid] [l,mid]这个区间还需要加上 a d d n u m addnum addnum,所以进入右儿子节点。需要注意的是,后两种情况完全有可能同时满足。我们再仔细考虑区间加,为了维护线段树使其满足左右儿子的 s u m sum sum之和等于父节点的 s u m sum sum,将父节点的 s u m sum sum更新之后应该要把它的所有子节点都更新,再用一下上面的图,比如说我们让 [ 6 , 10 ] [6, 10] [6,10]加10,那为了维护线段树, [ 6 , 10 ] [6, 10] [6,10]的子节点们都需要加10,总共需要9次加操作,这造成了一个很严重的问题:这样的区间加甚至比暴力还要慢!一个原本是 O ( N ) O(N) O(N)的操作被我们改进成了 O ( N l o g N ) O(NlogN) O(NlogN),这时,一个重要的思想出现:懒标记。它的思想是先仅维护最上一层的区间信息,而延迟对其子节点的更新,这样做的好处在于可以把区间加累积起来,等有需要时将懒标记下传一次性更新子节点,从而有效降低复杂度
inline void push(int k) { // 懒标记下传
node[ls].lazy = node[rs].lazy = node[k].lazy;
node[ls].sum += node[ls].length() * node[k].lazy;
node[rs].sum += node[rs].length() * node[k].lazy;
node[k].lazy = 0;
}
inline void add(int k) {
if(node[k].l >= l && node[k].r <= r) { // 完全包含
node[k].sum += node[k].length() * addnum;
node[k].lazy += addnum; // 懒标记
return ;
}
if(node[k].lazy) push(k); // 下传
if(r > node[k].mid) add(rs);
if(l <= node[k].mid) add(ls); // 不能是else if
update(k);
}
区间求和的步骤基本和区间加一样,代码也是十分类似
inline ll query(int k) {
if(node[k].l >= l && node[k].r <= r)
return node[k].sum;
ll ans = 0L;
if(node[k].lazy) push(k);
if(r > node[k].mi()) ans += query(rs);
if(l <= node[k].mi()) ans += query(ls);
return ans;
}
玩整版,开了long long,主要是因为很多题区间一求和就容易爆int
#include
#include
#include
#define mid ((l + r) >> 1)
#define ls (k << 1)
#define rs (k << 1 | 1)
typedef long long ll;
const int N = 1e6+5;
struct Node {
ll l, r, sum, lazy;
Node() {}
Node(ll _l, ll _r, ll _sum, ll _lazy = 0L) : l(_l), r(_r), sum(_sum), lazy(_lazy) {}
inline ll length() { return r - l + 1; }
inline ll mi() { return (l + r) >> 1; }
}node[N << 2];
ll n, m, l, r, addnum;
inline ll read() { // 快读
ll x = 0;
char ch = getchar();
while(ch < '0' || ch > '9')
ch = getchar();
while(ch >= '0' && ch <= '9') {
x = (x << 3) + (x << 1) + (ch ^ 48);
ch = getchar();
}
return x;
}
inline void update(int k) {
node[k].sum = node[ls].sum + node[rs].sum;
}
inline void push(int k) {
node[ls].lazy += node[k].lazy;
node[rs].lazy += node[k].lazy;
node[ls].sum += node[k].lazy * node[ls].length();
node[rs].sum += node[k].lazy * node[rs].length();
node[k].lazy = 0L;
}
void build(int l, int r, int k) {
if(l == r) {
ll a = read();
node[k] = Node(l, r, a);
return ;
}
node[k].l = l; node[k].r = r;
build(l, mid, ls);
build(mid + 1, r, rs);
update(k);
}
inline void add(int k) {
if(node[k].l >= l && node[k].r <= r) {
node[k].sum += node[k].length() * addnum;
node[k].lazy += addnum;
return ;
}
if(node[k].lazy) push(k);
if(r > node[k].mi()) add(rs);
if(l <= node[k].mi()) add(ls);
update(k);
}
inline ll query(int k) {
if(node[k].l >= l && node[k].r <= r)
return node[k].sum;
ll ans = 0L;
if(node[k].lazy) push(k);
if(r > node[k].mi()) ans += query(rs);
if(l <= node[k].mi()) ans += query(ls);
return ans;
}
int main() {
n = read(), m = read();
build(1L, n, 1L);
while(m--) {
ll type;
type = read(); l = read(), r = read();
if(type == 2L) // 区间查询
printf("%lld\n", query(1L));
else if(type == 1L) { // 区间加
addnum = read();
add(1L);
}
}
return 0;
}
区间加 + 区间求和,这是最基本的线段树,板子题luogu 3372
区间乘 + 区间求和,其实像维护加法懒标记一样,再维护一个乘法的懒标记就可以了,再稍微改改懒标记下传,板子题luogu 3373
区间修改 + 区间求最值,如果没有区间修改,那打个ST就行了(不知道ST的话可以百度一下,很多博客都讲得很清楚),常数还小,有修改就用线段树就行,维护也很简单,取个max就行了
( a i + x ) 2 = a i 2 + 2 x ∗ a i + x 2 ∑ i = l r ( ( a i + x ) 2 ) = ∑ i = l r a i 2 + 2 x ∗ ∑ i = l r a i + ( l − r + 1 ) ∗ x 2 (a_i + x)^2 = a_i^2+2x*a_i+x^2 \\ \sum_{i=l}^{r}((a_i+x)^2) = \sum_{i=l}^{r}a_i^2+2x*\sum_{i=l}^{r}a_i+(l-r+1)*x^2 (ai+x)2=ai2+2x∗ai+x2i=l∑r((ai+x)2)=i=l∑rai2+2x∗i=l∑rai+(l−r+1)∗x2
可以按照上面的公式维护 ∑ a i \sum a_i ∑ai和 ∑ a i 2 \sum a^2_i ∑ai2,立方类似,题目HDU 4578 Transformation
开根号操作会让区间里的值变得更加接近,那只要维护区间 m a x max max,如果 m a x ≠ 1 max \neq 1 max=1,就暴力地把这个区间上的数都开方,且因为一个数 n n n最多被开方 l o g n logn logn次就会变成1,所以每个数暴力其实最多 O ( l o g n ) O(logn) O(logn),不会超时
然而线段树的很多题都结合了各种技巧,如下面这道:
POJ 2528 Mayor’s posters
思路:离散化+线段树
HDU 2795 Billboard
思路:我们把高度那一维当做线段树的区间进行建树,然后维护区间最大值,询问时先判断能不能贴上,即根节点的最大值和 w i d t h width width比较,然后优先向左儿子走,如果左儿子的最大值大于等于 w i d t h width width,就进左儿子;否就进右儿子,到叶子节点就输出。可是, h h h的数据范围是 1 e 9 1e9 1e9,如果直接这样存线段树绝对爆空间,而我们发现其实 n n n的数据量只有 2 e 5 2e5 2e5,而 h h h超过 n n n是没有必要的,我们只需要最靠上的广告位,所以如果 h > n h > n h>n,就让 h = n h = n h=n,这样就完成了这题