线段树

线段树详解

By 岩之痕

目录:
一:综述
二:原理
三:递归实现
四:非递归原理
五:非递归实现
六:线段树解题模型
七:扫描线
八:可持久化 (主席树)
九:练习题



一:综述

假设有编号从1到n的n个点,每个点都存了一些信息,用[L,R]表示下标从L到R的这些点。
线段树的用处就是,对编号连续的一些点进行修改或者统计操作,修改和统计的复杂度都是O(log2(n)).

线段树的原理,就是,将[1,n]分解成若干特定的子区间(数量不超过4*n),然后,将每个区间[L,R]都分解为
少量特定的子区间,通过对这些少量子区间的修改或者统计,来实现快速对[L,R]的修改或者统计。

由此看出,用线段树统计的东西,必须符合区间加法,否则,不可能通过分成的子区间来得到[L,R]的统计结果。

符合区间加法的例子:
数字之和——总数字之和 = 左区间数字之和 + 右区间数字之和
最大公因数(GCD)——总GCD = gcd( 左区间GCD , 右区间GCD );
最大值——总最大值=max(左区间最大值,右区间最大值)
不符合区间加法的例子:
众数——只知道左右区间的众数,没法求总区间的众数
01序列的最长连续零——只知道左右区间的最长连续零,没法知道总的最长连续零

一个问题,只要能化成对一些连续点的修改和统计问题,基本就可以用线段树来解决了, 具体怎么转化在第六节会讲。
由于点的信息可以千变万化,所以线段树是一种非常灵活的数据结构,可以做的题的类型特别多,只要会转化。
线段树当然是可以维护线段信息的,因为线段信息也是可以转换成用点来表达的(每个点代表一条线段)。
所以在以下对结构的讨论中,都是对点的讨论,线段和点的对应关系在第七节扫描线中会讲。

本文二到五节是讲对线段树操作的原理和实现。
六到八节介绍了线段树解题模型,以及一些例题。

初学者可以先看这篇文章: 线段树从零开始

二:原理

(注:由于线段树的每个节点代表一个区间,以下叙述中不区分节点和区间,只是根据语境需要,选择合适的词)
线段树本质上是维护下标为1,2,..,n的n个按顺序排列的数的信息,所以,其实是“点树”,是维护n的点的信息,至于每个点的数据的含义可以有很多,
在对线段操作的线段树中,每个点代表一条线段,在用线段树维护数列信息的时候,每个点代表一个数,但本质上都是每个点代表一个数。以下,在讨论线段树的时候,区间[L,R]指的是下标从L到R的这(R-L+1)个数,而不是指一条连续的线段。只是有时候这些数代表实际上一条线段的统计结果而已。


线段树是将每个区间[L,R]分解成[L,M]和[M+1,R] (其中M=(L+R)/2 这里的除法是整数除法,即对结果下取整)直到 L==R 为止。 
开始时是区间[1,n] ,通过递归来逐步分解,假设根的高度为1的话,树的最大高度为(n>1)。
线段树对于每个n的分解是唯一的, 所以n相同的线段树结构相同,这也是实现可持久化线段树的基础。
下图展示了区间[1,13]的分解过程:


上图中,每个区间都是一个节点,每个节点存自己对应的区间的统计信息。

(1)线段树的点修改:


假设要修改[5]的值,可以发现,每层只有一个节点包含[5],所以修改了[5]之后,只需要每层更新一个节点就可以线段树每个节点的信息都是正确的,所以修改次数的最大值为层数
复杂度O(log2(n))


(2)线段树的区间查询:


线段树能快速进行区间查询的基础是下面的定理:
定理:n>=3时,一个[1,n]的线段树可以将[1,n]的任意子区间[L,R]分解为不超过个子区间。
这样,在查询[L,R]的统计值的时候,只需要访问不超过个节点,就可以获得[L,R]的统计信息,实现了O(log2(n))的区间查询。

下面给出证明:

(2.1)先给出一个粗略的证明(结合下图):
先考虑树的最下层,将所有在区间[L,R]内的点选中,然后,若相邻的点的直接父节点是同一个,那么就用这个父节点代替这两个节点(父节点在上一层)。这样操作之后,本层最多剩下两个节点。若最左侧被选中的节点是它父节点的右子树,那么这个节点会被剩下。若最右侧被选中的节点是它的父节点的左子树,那么这个节点会被剩下。中间的所有节点都被父节点取代。
对最下层处理完之后,考虑它的上一层,继续进行同样的处理,可以发现,每一层最多留下2个节点,其余的节点升往上一层,这样可以说明分割成的区间(节点)个数是大概是树高的两倍左右。

下图为n=13的线段树,区间[2,12],按照上面的叙述进行操作的过程图:

由图可以看出:在n=13的线段树中,[2,12]=[2] + [3,4] + [5,7] + [8,10] + [11,12] 。


(2.2)然后给出正式一点的证明:
定理:n>=3时,一个[1,n]的线段树可以将[1,n]的任意子区间[L,R]分解为不超过个子区间。

用数学归纳法,证明上面的定理:
首先,n=3,4,5时,用穷举法不难证明定理成立。
假设对于n= 3,4,5,…,k-1上式都成立,下面来证明对于n=k ( k>=6 )成立:
分为4种情况来证明:

情况一:[L,R]包含根节点(L=1且R=n),此时,[L,R]被分解为了一个节点,定理成立。

情况二:[L,R]包含根节点的左子节点,此时[L,R]一定不包含根的右子节点(因为如果包含, 就可以合并左右子节点,
用根节点替代,此时就是情况一)。这时,以右子节点为根的这个树的元素个数为
[L,R]分成的子区间由两部分组成:
一:根的左子结点,区间数为1 
二:以根的右子节点为根的树中,进行区间查询,这个可以递归使用本定理。
由归纳假设可得,[L,R]一共被分成了个区间。
情况三:跟情况二对称,不一样的是,以根的左子节点为根的树的元素个数为
[L,R]一共被分成了个区间。
从公式可以看出,情况二的区间数小于等于情况三的区间数,于是只需要证明情况三的区间数符合条件就行了。
线段树_第1张图片
于是,情况二和情况三定理成立。

情况四:[L,R]不包括根节点以及根节点的左右子节点。
于是,剩下的层,每层最多两个节点(参考粗略证明中的内容)。
于是[L,R]最多被分解成了个区间,定理成立。


上面只证明了是上界,但是,其实它是最小上界。
n=3,4时,有很多组区间的分解可以达到最小上界。
当n>4时,当且仅当n=2^t (t>=3),L=2,R=2^t -1 时,区间[L,R]的分解可以达到最小上界
就不证明了,有兴趣可以自己去证明。
下图是n=16 , L=2 , R=15 时的操作图,此图展示了达到最小上界的树的结构。

线段树_第2张图片线段树_第3张图片线段树_第4张图片线段树_第5张图片




(3)线段树的区间修改:

线段树的区间修改也是将区间分成子区间,但是要加一个标记,称作懒惰标记。
标记的含义:
本节点的统计信息已经根据标记更新过了,但是本节点的子节点仍需要进行更新。
即,如果要给一个区间的所有值都加上1,那么,实际上并没有给这个区间的所有值都加上1,而是打个标记,记下来,这个节点所包含的区间需要加1.打上标记后,要根据标记更新本节点的统计信息,比如,如果本节点维护的是区间和,而本节点包含5个数,那么,打上+1的标记之后,要给本节点维护的和+5。这是向下延迟修改,但是向上显示的信息是修改以后的信息,所以查询的时候可以得到正确的结果。有的标记之间会相互影响,所以比较简单的做法是,每递归到一个区间,首先下推标记(若本节点有标记,就下推标记),然后再打上新的标记,这样仍然每个区间操作的复杂度是O(log2(n))。

标记有相对标记绝对标记之分:
相对标记是将区间的所有数+a之类的操作,标记之间可以共存,跟打标记的顺序无关(跟顺序无关才是重点)。
所以,可以在区间修改的时候不下推标记,留到查询的时候再下推。
      注意:如果区间修改时不下推标记,那么PushUp函数中,必须考虑本节点的标记。
                 而如果所有操作都下推标记,那么PushUp函数可以不考虑本节点的标记,因为本节点的标记一定已经被下推了(也就是对本节点无效了)
绝对标记是将区间的所有数变成a之类的操作,打标记的顺序直接影响结果,
所以这种标记在区间修改的时候必须下推旧标记,不然会出错。

注意,有多个标记的时候,标记下推的顺序也很重要,错误的下推顺序可能会导致错误。

之所以要区分两种标记,是因为非递归线段树只能维护相对标记。
因为非递归线段树是自底向上直接修改分成的每个子区间,所以根本做不到在区间修改的时候下推标记。
非递归线段树一般不下推标记,而是自下而上求答案的过程中,根据标记更新答案。

(4)线段树的存储结构:

线段树是用数组来模拟树形结构,对于每一个节点R ,左子节点为 2*R (一般写作R<<1)右子节点为 2*R+1(一般写作R<<1|1)
然后以1为根节点,所以,整体的统计信息是存在节点1中的。
这么表示的原因看下图就很明白了,左子树的节点标号都是根节点的两倍,右子树的节点标号都是左子树+1:
线段树_第6张图片
线段树需要的数组元素个数是:,一般都开4倍空间,比如: int A[n<<2];


三:递归实现

以下 以维护数列区间和的线段树为例,演示最基本的线段树代码。

(0)定义:

[cpp] view plain copy
print ?
  1. #define maxn 100007  //元素总个数  
  2. #define ls l,m,rt<<1  
  3. #define rs m+1,r,rt<<1|1  
  4. int Sum[maxn<<2],Add[maxn<<2];//Sum求和,Add为懒惰标记   
  5. int A[maxn],n;//存原数组数据下标[1,n]   
#define maxn 100007  //元素总个数




#define ls l,m,rt<<1 #define rs m+1,r,rt<<1|1 int Sum[maxn<<2],Add[maxn<<2];//Sum求和,Add为懒惰标记 int A[maxn],n;//存原数组数据下标[1,n]

(1)建树:

[cpp] view plain copy
print ?
  1. //PushUp函数更新节点信息 ,这里是求和  
  2. void PushUp(int rt){Sum[rt]=Sum[rt<<1]+Sum[rt<<1|1];}  
  3. //Build函数建树   
  4. void Build(int l,int r,int rt){ //l,r表示当前节点区间,rt表示当前节点编号  
  5.     if(l==r) {//若到达叶节点   
  6.         Sum[rt]=A[l];//储存数组值   
  7.         return;  
  8.     }  
  9.     int m=(l+r)>>1;  
  10.     //左右递归   
  11.     Build(l,m,rt<<1);  
  12.     Build(m+1,r,rt<<1|1);  
  13.     //更新信息   
  14.     PushUp(rt);  
  15. }  
//PushUp函数更新节点信息 ,这里是求和
void PushUp(int rt){Sum[rt]=Sum[rt<<1]+Sum[rt<<1|1];}
//Build函数建树 
void Build(int l,int r,int rt){ //l,r表示当前节点区间,rt表示当前节点编号
    if(l==r) {//若到达叶节点 
        Sum[rt]=A[l];//储存数组值 
        return;
    }
    int m=(l+r)>>1;
    //左右递归 
    Build(l,m,rt<<1);
    Build(m+1,r,rt<<1|1);
    //更新信息 
    PushUp(rt);
}


(2)点修改:

假设A[L]+=C:
[cpp] view plain copy
print ?
  1. void Update(int L,int C,int l,int r,int rt){//l,r表示当前节点区间,rt表示当前节点编号  
  2.     if(l==r){//到叶节点,修改   
  3.         Sum[rt]+=C;  
  4.         return;  
  5.     }  
  6.     int m=(l+r)>>1;  
  7.     //根据条件判断往左子树调用还是往右   
  8.     if(L <= m) Update(L,C,l,m,rt<<1);  
  9.     else       Update(L,C,m+1,r,rt<<1|1);  
  10.     PushUp(rt);//子节点更新了,所以本节点也需要更新信息   
  11. }   
void Update(int L,int C,int l,int r,int rt){//l,r表示当前节点区间,rt表示当前节点编号
    if(l==r){//到叶节点,修改 
        Sum[rt]+=C;
        return;
    }
    int m=(l+r)>>1;
    //根据条件判断往左子树调用还是往右 
    if(L <= m) Update(L,C,l,m,rt<<1);
    else       Update(L,C,m+1,r,rt<<1|1);
    PushUp(rt);//子节点更新了,所以本节点也需要更新信息 
} 

(3)区间修改:


假设A[L,R]+=C
[cpp] view plain copy
print ?
  1. void Update(int L,int R,int C,int l,int r,int rt){//L,R表示操作区间,l,r表示当前节点区间,rt表示当前节点编号   
  2.     if(L <= l && r <= R){//如果本区间完全在操作区间[L,R]以内   
  3.         Sum[rt]+=C*(r-l+1);//更新数字和,向上保持正确  
  4.         Add[rt]+=C;//增加Add标记,表示本区间的Sum正确,子区间的Sum仍需要根据Add的值来调整  
  5.         return ;   
  6.     }  
  7.     int m=(l+r)>>1;  
  8.     PushDown(rt,m-l+1,r-m);//下推标记  
  9.     //这里判断左右子树跟[L,R]有无交集,有交集才递归   
  10.     if(L <= m) Update(L,R,C,l,m,rt<<1);  
  11.     if(R >  m) Update(L,R,C,m+1,r,rt<<1|1);   
  12.     PushUp(rt);//更新本节点信息   
  13. }   
void Update(int L,int R,int C,int l,int r,int rt){//L,R表示操作区间,l,r表示当前节点区间,rt表示当前节点编号 
    if(L <= l && r <= R){//如果本区间完全在操作区间[L,R]以内 
        Sum[rt]+=C*(r-l+1);//更新数字和,向上保持正确
        Add[rt]+=C;//增加Add标记,表示本区间的Sum正确,子区间的Sum仍需要根据Add的值来调整
        return ; 
    }
    int m=(l+r)>>1;
    PushDown(rt,m-l+1,r-m);//下推标记
    //这里判断左右子树跟[L,R]有无交集,有交集才递归 
    if(L <= m) Update(L,R,C,l,m,rt<<1);
    if(R >  m) Update(L,R,C,m+1,r,rt<<1|1); 
    PushUp(rt);//更新本节点信息 
} 

(4)区间查询:

询问A[L,R]的和
首先是下推标记的函数:
[cpp] view plain copy
print ?
  1. void PushDown(int rt,int ln,int rn){  
  2.     //ln,rn为左子树,右子树的数字数量。   
  3.     if(Add[rt]){  
  4.         //下推标记   
  5.         Add[rt<<1]+=Add[rt];  
  6.         Add[rt<<1|1]+=Add[rt];  
  7.         //修改子节点的Sum使之与对应的Add相对应   
  8.         Sum[rt<<1]+=Add[rt]*ln;  
  9.         Sum[rt<<1|1]+=Add[rt]*rn;  
  10.         //清除本节点标记   
  11.         Add[rt]=0;  
  12.     }  
  13. }  
void PushDown(int rt,int ln,int rn){
    //ln,rn为左子树,右子树的数字数量。 
    if(Add[rt]){
        //下推标记 
        Add[rt<<1]+=Add[rt];
        Add[rt<<1|1]+=Add[rt];
        //修改子节点的Sum使之与对应的Add相对应 
        Sum[rt<<1]+=Add[rt]*ln;
        Sum[rt<<1|1]+=Add[rt]*rn;
        //清除本节点标记 
        Add[rt]=0;
    }
}

然后是区间查询的函数:
[cpp] view plain copy
print ?
  1. int Query(int L,int R,int l,int r,int rt){//L,R表示操作区间,l,r表示当前节点区间,rt表示当前节点编号  
  2.     if(L <= l && r <= R){  
  3.         //在区间内,直接返回   
  4.         return Sum[rt];  
  5.     }  
  6.     int m=(l+r)>>1;  
  7.     //下推标记,否则Sum可能不正确  
  8.     PushDown(rt,m-l+1,r-m);   
  9.       
  10.     //累计答案  
  11.     int ANS=0;  
  12.     if(L <= m) ANS+=Query(L,R,l,m,rt<<1);  
  13.     if(R >  m) ANS+=Query(L,R,m+1,r,rt<<1|1);  
  14.     return ANS;  
  15. }   
int Query(int L,int R,int l,int r,int rt){//L,R表示操作区间,l,r表示当前节点区间,rt表示当前节点编号
    if(L <= l && r <= R){
        //在区间内,直接返回 
        return Sum[rt];
    }
    int m=(l+r)>>1;
    //下推标记,否则Sum可能不正确
    PushDown(rt,m-l+1,r-m); 

    //累计答案
    int ANS=0;
    if(L <= m) ANS+=Query(L,R,l,m,rt<<1);
    if(R >  m) ANS+=Query(L,R,m+1,r,rt<<1|1);
    return ANS;
} 

(5)函数调用:


[cpp] view plain copy
print ?
  1. //建树   
  2. Build(1,n,1);   
  3. //点修改  
  4. Update(L,C,1,n,1);  
  5. //区间修改   
  6. Update(L,R,C,1,n,1);  
  7. //区间查询   
  8. int ANS=Query(L,R,1,n,1);  
 
    //建树 
    Build(1,n,1); 
    //点修改
    Update(L,C,1,n,1);
    //区间修改 
    Update(L,R,C,1,n,1);
    //区间查询 
    int ANS=Query(L,R,1,n,1);

感谢几位网友指出了我的错误。
我说相对标记在Update时可以不下推,这一点是对的,但是原来的代码是错误的。
因为原来的代码中,PushUP函数是没有考虑本节点的Add值的,如果Update时下推标记,那么PushUp的时候,节点的Add值一定为零,所以不需要考虑Add。
但是,如果Update时暂时不下推标记的话,那么PushUp函数就必须考虑本节点的Add值,否则会导致错误。
为了简便,上面函数中,PushUp函数没有考虑Add标记。所以无论是相对标记还是绝对标记,在更新信息的时候,
到达的每个节点都必须调用PushDown函数来下推标记,另外,代码中,点修改函数中没有PushDown函数,因为这里假设只有点修改一种操作,
如果题目中是点修改和区间修改混合的话,那么点修改中也需要PushDown。


四:非递归原理

非递归的思路很巧妙,思路以及部分代码实现 来自  清华大学 张昆玮 《统计的力量》 ,有兴趣可以去找来看。
非递归的实现,代码简单(尤其是点修改和区间查询),速度快,建树简单,遍历元素简单。总之能非递归就非递归吧。
不过,要支持区间修改的话,代码会变得复杂,所以区间修改的时候还是要取舍。有个特例,如果区间修改,但是只需要
在所有操作结束之后,一次性下推所有标记,然后求结果,这样的话,非递归写起来也是很方便的。
下面先讲思路,再讲实现。

点修改:

非递归的思想总的来说就是自底向上进行各种操作。回忆递归线段树的点修改,首先由根节点1向下递归,找到对应的叶
节点,然后,修改叶节点的值,再向上返回,在函数返回的过程中,更新路径上的节点的统计信息。而非递归线段树的思路是,
如果可以直接找到叶节点,那么就可以直接从叶节点向上更新,而一个节点找父节点是很容易的,编号除以2再下取整就行了。
那么,如何可以直接找到叶节点呢?非递归线段树扩充了普通线段树(假设元素数量为n),使得所有非叶结点都有两个子结点且叶子结点都在同一层。
来观察一下扩充后的性质:

线段树_第7张图片
可以注意到红色和黑色数字的差是固定的,如果事先算出这个差值,就可以直接找到叶节点。

注意:区分3个概念:原数组下标,线段树中的下标和存储下标。
原数组下标,是指,需要维护统计信息(比如区间求和)的数组的下标,这里都默认下标从1开始(一般用A数组表示)
线段树下标,是指,加入线段树中某个位置的下标,比如,原数组中的第一个数,一般会加入到线段树中的第二个位置,
为什么要这么做,后面会讲。
存储下标,是指该元素所在的叶节点的编号,即实际存储的位置。

【在上面的图片中,红色为原数组下标,黑色为存储下标】

有了这3个概念,下面开始讲区间查询。

点修改下的区间查询:

首先,区间的划分没有变,现在关键是如何直接找到被分成的区间。原来是递归查找,判断左右子区间跟[L,R]是否有交点,
若有交点则向下递归。现在要非递归实现,这就是巧妙之处,见下图,以查询[3,11]为例子。

线段树_第8张图片 线段树_第9张图片 线段树_第10张图片 线段树_第11张图片


其实,容易发现,紫色部分的变化,跟原来分析线段树的区间分解的时候是一样的规则,图中多的蓝色是什么意思呢?
首先注意到,蓝色节点刚好在紫色节点的两端。
回忆一下,原来线段树在区间逐层被替代的过程中,哪些节点被留了下来?最左侧的节点,若为其父节点的右子节点,则留下。
最右侧的节点,若为其父节点的左子节点则留下。那么对于包裹着紫色的蓝色节点来看,刚好相反。
比如,以左侧的的蓝色为例,若该节点是其父节点的右子节点,就证明它右侧的那个紫色节点不会留下,会被其父替代,所以没必要在这一步计算,若该节点是其父节点的左子节点,就证明它右侧的那个紫色节点会留在这一层,所以必须在此刻计算,否则以后都不会再计算这个节点了。这样逐层上去,容易发现,对于左侧的蓝色节点来说,只要它是左子节点,那么就要计算对应的右子节点。同理,对于右侧的蓝色节点,只要它是右子节点,就需要计算它对应的左子节点。这个计算一直持续到左右蓝色节点的父亲为同一个的时候,才停止。于是,区间查询,其实就是两个蓝色节点一路向上走,在路径上更新答案。这样,区间修改就变成了两条同时向根走的链,明显复杂度O(log2(n))。并且可以非递归实现。
至此,区间查询也解决了,可以直接找到所有分解成的区间。
但是有一个问题,如果要查询[1,5]怎么办?[1]左边可是没地方可以放置蓝色节点了。
问题的解决办法简单粗暴,原数组的1到n就不存在线段树的1到n了,而是存在线段树的2到n+1,
而开始要建立一颗有n+2个元素的树,空出第一个和最后一个元素的空间。

现在来讲如何对线段树进行扩充。
线段树_第12张图片
再来看这个二叉树,令N=8;注意到,该树可以存8个元素,并且[1..7]是非叶节点,[8..15]是叶节点。
也就是说,左下角为N的二叉树,可以存N个元素,并且[1..N-1]是非叶节点,[N..2N-1]是叶节点。
并且,线段树下标+N-1=存储下标 (还记不记得原来对三个下标的定义)

这时,这个线段树存在两段坐标映射:
原数组下标+1=线段树下标
线段树下标+N-1=存储下标 
联立方程得到:原数组下标+N=存储下标
于是从原数组下标到存储下标的转换及其简单。

下一个问题:N怎么确定?
上面提到了,N的含义之一是,这棵树可以存N个元素,也就是说N必须大于等于n+2
于是,N的定义,N是大于等于n+2的,某个2的次方。

区间修改下的区间查询:

方法之一:如果题目许可,可以直接打上标记,最后一次下推所有标记,然后就可以遍历叶节点来获取信息。
方法之二:如果题目查询跟修改混在一起,那么,采用标记永久化思想。也就是,不下推标记。
递归线段树是在查询区间的时候下推标记,使得到达每个子区间的时候,Sum已经是正确值。
非递归没法这么做,非递归是从下往上,遇到标记就更新答案。
这题是Add标记,一个区间Add标记表示这个区间所有元素都需要增加Add
Add含义不变,Add仍然表示本节点的Sum已经更新完毕,但是子节点的Sum仍需要更新.
现在就是如何在查询的时候根据标记更新答案。
观察下图:
线段树_第13张图片
左边的蓝色节点从下往上走,在蓝色节点到达[1,4]时,注意到,左边蓝色节点之前计算过的所有节点(即[3,4])都是目前蓝色节点的子节点 也就是说,当前蓝色节点的Add是要影响这个节点已经计算过的所有数。多用一个变量来记录这个蓝色节点已经计算过多少个数, 根据个数以及当前蓝色节点的Add,来更新最终答案。
更新完答案之后,再加上[5,8]的答案,同时当前蓝色节点计算过的个数要+4(因为[5,8]里有4个数)
然后当这个节点到达[1,8]节点时,可以更新[1,8]的Add.
这里,本来左右蓝色节点相遇之后就不再需要计算了,但是由于有了Add标记,左右蓝色节点的公共祖先上的Add标记会影响目前的所有数,所以还需要一路向上查询到根,沿路根据Add更新答案。

区间修改:

这里讲完了查询,再来讲讲修改
修改的时候,给某个区间的Add加上了C,这个区间的子区间向上查询时,会经过这个节点,也就是会计算这个Add,但是
如果路径经过这个区间的父节点,就不会计算这个节点的Add,也就会出错。这里其实跟递归线段树一样,改了某个区间的Add
仍需要向上更新所有包含这个区间的Sum,来保持上面所有节点的正确性。

五:非递归实现

以下以维护数列区间和的线段树为例,演示最基本的非递归线段树代码。

(0)定义

[cpp] view plain copy
print ?
  1. //   
  2. #define maxn 100007  
  3. int A[maxn],n,N;//原数组,n为原数组元素个数 ,N为扩充元素个数   
  4. int Sum[maxn<<2];//区间和   
  5. int Add[maxn<<2];//懒惰标记   
// 




#define maxn 100007 int A[maxn],n,N;//原数组,n为原数组元素个数 ,N为扩充元素个数 int Sum[maxn<<2];//区间和 int Add[maxn<<2];//懒惰标记

(1)建树:

[cpp] view plain copy
print ?
  1. //  
  2. void Build(int n){  
  3.     //计算N的值   
  4.     N=1;while(N < n+2) N <<= 1;  
  5.     //更新叶节点   
  6.     for(int i=1;i<=n;++i) Sum[N+i]=A[i];//原数组下标+N=存储下标  
  7.     //更新非叶节点   
  8.     for(int i=N-1;i>0;–i){  
  9.         //更新所有非叶节点的统计信息   
  10.         Sum[i]=Sum[i<<1]+Sum[i<<1|1];  
  11.         //清空所有非叶节点的Add标记   
  12.         Add[i]=0;  
  13.     }  
  14. }   
//
void Build(int n){
    //计算N的值 
    N=1;while(N < n+2) N <<= 1;
    //更新叶节点 
    for(int i=1;i<=n;++i) Sum[N+i]=A[i];//原数组下标+N=存储下标
    //更新非叶节点 
    for(int i=N-1;i>0;--i){
        //更新所有非叶节点的统计信息 
        Sum[i]=Sum[i<<1]+Sum[i<<1|1];
        //清空所有非叶节点的Add标记 
        Add[i]=0;
    }
} 

(2)点修改:

A[L]+=C
[cpp] view plain copy
print ?
  1. //  
  2. void Update(int L,int C){  
  3.     for(int s=N+L;s;s>>=1){  
  4.         Sum[s]+=C;  
  5.     }  
  6. }   
//
void Update(int L,int C){
    for(int s=N+L;s;s>>=1){
        Sum[s]+=C;
    }
} 

(3)点修改下的区间查询:

求A[L..R]的和(点修改没有使用Add所以不需要考虑)
代码非常简洁,也不难理解,
s和t分别代表之前的论述中的左右蓝色节点,其余的代码根据之前的论述应该很容易看懂了。
s^t^1 在s和t的父亲相同时值为0,终止循环。
两个if是判断s和t分别是左子节点还是右子节点,根据需要来计算Sum
[cpp] view plain copy
print ?
  1. //  
  2. int Query(int L,int R){  
  3.     int ANS=0;  
  4.     for(int s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1){  
  5.         if(~s&1) ANS+=Sum[s^1];  
  6.         if( t&1) ANS+=Sum[t^1];  
  7.     }  
  8.     return ANS;  
  9. }   
//
int Query(int L,int R){
    int ANS=0;
    for(int s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1){
        if(~s&1) ANS+=Sum[s^1];
        if( t&1) ANS+=Sum[t^1];
    }
    return ANS;
} 

(4)区间修改:

A[L..R]+=C
[cpp] view plain copy
print ?
  1. “font-size:14px;”>//  
  2. void Update(int L,int R,int C){  
  3.     int s,t,Ln=0,Rn=0,x=1;  
  4.     //Ln:  s一路走来已经包含了几个数  
  5.     //Rn:  t一路走来已经包含了几个数  
  6.     //x:   本层每个节点包含几个数  
  7.     for(s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1,x<<=1){  
  8.         //更新Sum  
  9.         Sum[s]+=C*Ln;  
  10.         Sum[t]+=C*Rn;  
  11.         //处理Add  
  12.         if(~s&1) Add[s^1]+=C,Sum[s^1]+=C*x,Ln+=x;  
  13.         if( t&1) Add[t^1]+=C,Sum[t^1]+=C*x,Rn+=x;  
  14.     }  
  15.     //更新上层Sum  
  16.     for(;s;s>>=1,t>>=1){  
  17.         Sum[s]+=C*Ln;  
  18.         Sum[t]+=C*Rn;  
  19.     }   
  20.   
//
void Update(int L,int R,int C){
    int s,t,Ln=0,Rn=0,x=1;
    //Ln:  s一路走来已经包含了几个数
    //Rn:  t一路走来已经包含了几个数
    //x:   本层每个节点包含几个数
    for(s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1,x<<=1){
        //更新Sum
        Sum[s]+=C*Ln;
        Sum[t]+=C*Rn;
        //处理Add
        if(~s&1) Add[s^1]+=C,Sum[s^1]+=C*x,Ln+=x;
        if( t&1) Add[t^1]+=C,Sum[t^1]+=C*x,Rn+=x;
    }
    //更新上层Sum
    for(;s;s>>=1,t>>=1){
        Sum[s]+=C*Ln;
        Sum[t]+=C*Rn;
    } 
} 

(5)区间修改下的区间查询:

求A[L..R]的和
[cpp] view plain copy
print ?
  1. //  
  2. int Query(int L,int R){  
  3.     int s,t,Ln=0,Rn=0,x=1;  
  4.     int ANS=0;  
  5.     for(s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1,x<<=1){  
  6.         //根据标记更新   
  7.         if(Add[s]) ANS+=Add[s]*Ln;  
  8.         if(Add[t]) ANS+=Add[t]*Rn;  
  9.         //常规求和   
  10.         if(~s&1) ANS+=Sum[s^1],Ln+=x;  
  11.         if( t&1) ANS+=Sum[t^1],Rn+=x;   
  12.     }  
  13.     //处理上层标记  
  14.     for(;s;s>>=1,t>>=1){  
  15.         ANS+=Add[s]*Ln;  
  16.         ANS+=Add[t]*Rn;  
  17.     }  
  18.     return ANS;  
  19. }  
//
int Query(int L,int R){
    int s,t,Ln=0,Rn=0,x=1;
    int ANS=0;
    for(s=N+L-1,t=N+R+1;s^t^1;s>>=1,t>>=1,x<<=1){
        //根据标记更新 
        if(Add[s]) ANS+=Add[s]*Ln;
        if(Add[t]) ANS+=Add[t]*Rn;
        //常规求和 
        if(~s&1) ANS+=Sum[s^1],Ln+=x;
        if( t&1) ANS+=Sum[t^1],Rn+=x; 
    }
    //处理上层标记
    for(;s;s>>=1,t>>=1){
        ANS+=Add[s]*Ln;
        ANS+=Add[t]*Rn;
    }
    return ANS;
}

六:线段树解题模型

给出线段树解题模型以及一些例题。
线段树_第14张图片
先对图中各个名字给出定义:
问题:可能可以用线段树解决的问题
目标信息:由问题转换而成的,为了解决问题而需要统计的信息(可能不满足区间加法)。
点信息:每个点储存的信息
区间信息:每个区间维护的信息(线段树节点定义) (必须满足区间加法)
区间信息包括 统计信息标记
——–统计信息:统计节点代表的区间的信息,一般自下而上更新
——–标记:对操作进行标记(在区间修改时需要),一般自上而下传递,或者不传递
区间加法:实现区间加法的代码
查询:实现查询操作的代码
修改:实现修改操作的代码

图中紫线右边是实际线段树的实现,左边是对问题的分析以及转换。

一个问题,若能转换成对一些连续点的修改或者统计,就可以考虑用线段树解决。
首先确定目标信息点信息,然后将目标信息转换成区间信息(必要时,增加信息,使之符合区间加法)。
之后就是线段树的代码实现了,包括:
1.区间加法 
2.建树,点信息到区间信息的转换 
3.每种操作(包括查询,修改)对区间信息的调用,修改

这样,点的信息不同,区间信息不同,线段树可以维护很多种类的信息,所以是一种非常实用的数据结构。
可以解决很多问题,下面给出几个例子来说明。

(1):字符串哈希

题目:URAL1989 Subpalindromes     题解
给定一个字符串(长度<=100000),有两个操作。   1:改变某个字符。 2:判断某个子串是否构成回文串。 
直接判断会超时。这个题目,是用线段树维护字符串哈希
对于一个字符串a[0],a[1],…,a[n-1] 它对应的哈希函数为a[0]+a[1]*K + a[2]*K^2 +…+a[n-1]*K^(n-1)
再维护一个从右往左的哈希值:a[0]*K^(n-1) + a[1]*K^(n-2) +…+a[n-1]
若是回文串,则左右的哈希值会相等。而左右哈希值相等,则很大可能这是回文串。
若出现误判,可以再用一个K2,进行二次哈希判断,可以减小误判概率。
实现上,哈希值最好对某个质数取余数,这样分布更均匀。


解题模型:
问题经过转换之后:
目标信息:某个区间的左,右哈希值
点信息:一个字符
目标信息已经符合区间加法,所以区间信息=目标信息
所以线段树的结构为:
区间信息:区间哈希值
点信息:一个字符
代码主要需要注意2个部分:
1.区间加法 :(PushUp函数,Pow[a]=K^a)
2.点信息->区间信息:(叶节点上,区间只包含一个点,所以需要将点信息转换成区间信息)
修改以及查询,在有了区间加法的情况下,没什么难度了。

可以看出,上述解题过程的核心,就是找到区间信息, 写好区间加法
下面是维护区间和的部分,下面的代码没有取余,也就是实际上是对2^32取余数,这样其实分布不均匀,容易出现误判:
[cpp] view plain copy
print ?
  1. //   
  2. #define K 137  
  3. #define maxn 100001   
  4. char str[maxn];  
  5. int Pow[maxn];//K的各个次方   
  6. struct Node{  
  7.     int KeyL,KeyR;  
  8.     Node():KeyL(0),KeyR(0){}  
  9.     void init(){KeyL=KeyR=0;}  
  10. }node[maxn<<2];  
  11. void PushUp(int L,int R,int rt){  
  12.     node[rt].KeyL=node[rt<<1].KeyL+node[rt<<1|1].KeyL*Pow[L];  
  13.     node[rt].KeyR=node[rt<<1].KeyR*Pow[R]+node[rt<<1|1].KeyR;  
  14. }  
// 




#define K 137 #define maxn 100001 char str[maxn]; int Pow[maxn];//K的各个次方 struct Node{ int KeyL,KeyR; Node():KeyL(0),KeyR(0){} void init(){KeyL=KeyR=0;} }node[maxn<<2]; void PushUp(int L,int R,int rt){ node[rt].KeyL=node[rt<<1].KeyL+node[rt<<1|1].KeyL*Pow[L]; node[rt].KeyR=node[rt<<1].KeyR*Pow[R]+node[rt<<1|1].KeyR; }

(2):最长连续零

题目:Codeforces 527C Glass Carving   题解
题意是给定一个矩形,不停地纵向或横向切割,问每次切割后,最大的矩形面积是多少。
最大矩形面积=最长的长*最宽的宽
这题,长宽都是10^5,所以,用01序列表示每个点是否被切割,然后,
最长的长就是长的最长连续0的数量+1
最长的宽就是宽的最长连续0的数量+1
于是用线段树维护最长连续零

问题转换成:
目标信息:区间最长连续零的个数
点信息:0 或 1
由于目标信息不符合区间加法,所以要扩充目标信息。

转换后的线段树结构
区间信息:从左,右开始的最长连续零,本区间是否全零,本区间最长连续零。
点信息:0 或 1
然后还是那2个问题:

1.区间加法:
这里,一个区间的最长连续零,需要考虑3部分:
-(1):左子区间最长连续零
-(2):右子区间最长连续零
-(3):左右子区间拼起来,而在中间生成的连续零(可能长于两个子区间的最长连续零)
而中间拼起来的部分长度,其实是左区间从右开始的最长连续零+右区间从左开始的最长连续零。
所以每个节点需要多两个量,来存从左右开始的最长连续零。
然而,左开始的最长连续零分两种情况,
–(1):左区间不是全零,那么等于左区间的左最长连续零
–(2):左区间全零,那么等于左区间0的个数加上右区间的左最长连续零
于是,需要知道左区间是否全零,于是再多加一个变量。
最终,通过维护4个值,达到了维护区间最长连续零的效果。

2.点信息->区间信息 : 
如果是0,那么  最长连续零=左最长连续零=右最长连续零=1 ,全零=true。
如果是1,那么  最长连续零=左最长连续零=右最长连续零=0, 全零=false。

至于修改和查询,有了区间加法之后,机械地写一下就好了。
由于这里其实只有对整个区间的查询,所以查询函数是不用写的,直接找根的统计信息就行了。

代码如下:
[cpp] view plain copy
print ?
  1. //  
  2. #define maxn 200001  
  3. using namespace std;  
  4. int L[maxn<<2][2];//从左开始连续零个数   
  5. int R[maxn<<2][2];//从右   
  6. int Max[maxn<<2][2];//区间最大连续零   
  7. bool Pure[maxn<<2][2];//是否全零   
  8. int M[2];  
  9. void PushUp(int rt,int k){//更新rt节点的四个数据  k来选择两棵线段树  
  10.     Pure[rt][k]=Pure[rt<<1][k]&&Pure[rt<<1|1][k];   
  11.     Max[rt][k]=max(R[rt<<1][k]+L[rt<<1|1][k],max(Max[rt<<1][k],Max[rt<<1|1][k]));  
  12.     L[rt][k]=Pure[rt<<1][k]?L[rt<<1][k]+L[rt<<1|1][k]:L[rt<<1][k];  
  13.     R[rt][k]=Pure[rt<<1|1][k]?R[rt<<1|1][k]+R[rt<<1][k]:R[rt<<1|1][k];  
  14. }  
//




#define maxn 200001 using namespace std; int L[maxn<<2][2];//从左开始连续零个数 int R[maxn<<2][2];//从右 int Max[maxn<<2][2];//区间最大连续零 bool Pure[maxn<<2][2];//是否全零 int M[2]; void PushUp(int rt,int k){//更新rt节点的四个数据 k来选择两棵线段树 Pure[rt][k]=Pure[rt<<1][k]&&Pure[rt<<1|1][k]; Max[rt][k]=max(R[rt<<1][k]+L[rt<<1|1][k],max(Max[rt<<1][k],Max[rt<<1|1][k])); L[rt][k]=Pure[rt<<1][k]?L[rt<<1][k]+L[rt<<1|1][k]:L[rt<<1][k]; R[rt][k]=Pure[rt<<1|1][k]?R[rt<<1|1][k]+R[rt<<1][k]:R[rt<<1|1][k]; }

(3):计数排序

题目:Codeforces 558E A Simple Task  题解

给定一个长度不超过10^5的字符串(小写英文字母),和不超过5000个操作。

每个操作 L R K 表示给区间[L,R]的字符串排序,K=1为升序,K=0为降序。

最后输出最终的字符串。


题目转换成:

目标信息:区间的计数排序结果

点信息:一个字符

这里,目标信息是符合区间加法的,但是为了支持区间操作,还是需要扩充信息。


转换后的线段树结构

区间信息:区间的计数排序结果,排序标记,排序种类(升,降)

点信息:一个字符


代码中需要解决的四个问题(难点在于标记下推和区间修改):

1.区间加法

对应的字符数量相加即可(注意标记是不上传的,所以区间加法不考虑标记)。

2.点信息->区间信息:把对应字符的数量设置成1,其余为0,排序标记为false。

3.标记下推

明显,排序标记是绝对标记,也就是说,标记对子节点是覆盖式的效果,一旦被打上标记,下层节点的一切信息都无效。

下推标记时,根据自己的排序结果,将元素分成对应的部分,分别装入两个子树。

4.区间修改

这个是难点,由于要对某个区间进行排序,首先对各个子区间求和(求和之前一定要下推标记,才能保证求的和是正确的)

由于使用的计数排序,所以求和之后,新顺序也就出来了。然后按照排序的顺序按照每个子区间的大小来分配字符。

操作后,每个子区间都被打上了标记。


最后,在所有操作结束之后,一次下推所有标记,就可以得到最终的字符序列。


这里只给出节点定义。
[cpp] view plain copy
print ?
  1. //   
  2. struct Node{  
  3.     int d[26];//计数排序   
  4.     int D;//总数  
  5.     bool sorted;//是否排好序   
  6.     bool Inc;//是否升序  
  7. };  
// 
struct Node{
    int d[26];//计数排序 
    int D;//总数
    bool sorted;//是否排好序 
    bool Inc;//是否升序
};

(4)总结:

总结一下,线段树解题步骤。

:将问题转换成点信息目标信息
即,将问题转换成对一些点的信息的统计问题。

:将目标信息根据需要扩充成区间信息
1.增加信息符合区间加法。
2.增加标记支持区间操作。

:代码中的主要模块:
1.区间加法 
2.标记下推 
3.点信息->区间信息 
4.操作(各种操作,包括修改和查询)


完成第一步之后,题目有了可以用线段树解决的可能。
完成第二步之后,题目可以由线段树解决。
第三步就是慢慢写代码了。

七:扫描线

线段树的一大应用是扫描线。

先把相关题目给出,有兴趣可以去找来练习:

POJ 1177 Picture:给定若干矩形求合并之后的图形周长    题解
HDU 1255 覆盖的面积:给定平面上若干矩形,求出被这些矩形覆盖过至少两次的区域的面积.   题解
HDU 3642 Get The Treasury:给定若干空间立方体,求重叠了3次或以上的体积(这个是扫描面,每个面再扫描线)题解
再补充一道稍微需要一点模型转换的扫描线题:
POJ 2482 Stars in your window : 给定一些星星的位置和亮度,求用W*H的矩形能够框住的星星亮度之和最大为多少。
这题是把星星转换成了矩形,把矩形框转换成了点,然后再扫描线。  题解


扫描线求重叠矩形面积:

考虑下图中的四个矩形:
线段树_第15张图片

线段树_第16张图片
线段树_第17张图片

观察第三个图:
扫描线的思路:使用一条垂直于X轴的直线,从左到右来扫描这个图形,明显,只有在碰到矩形的左边界或者右边界的时候,
这个线段所扫描到的情况才会改变,所以把所有矩形的入边,出边按X值排序。然后根据X值从小到大去处理,就可以
用线段树来维护扫描到的情况。如上图,X1到X8是所有矩形的入边,出边的X坐标。
而红色部分的线段,是这样,如果碰到矩形的入边,就把这条边加入,如果碰到出边,就拿走。红色部分就是有线段覆盖的部分。
要求面积,只需要知道图中的L1到L8。而线段树就是用来维护这个L1到L8的。
扫描线算法流程:

X1:首先遇到X1,将第一条线段加入线段树,由线段树统计得到线段长度为L1.

X2:然后继续扫描到X2,此时要进行两个动作:
1.计算面积,目前扫过的面积=L1*(X2-X1)
2.更新线段。由于X2处仍然是入边,所以往线段树中又加了一条线段,加的这条线段可以参考3幅图中的第一幅。
然后线段树自动得出此时覆盖的线段长度为L2 (注意两条线段有重叠部分,重叠部分的长度只能算一次)

X3:继续扫描到X3,步骤同X2
先计算 扫过的面积+=L2*(X3-X2)
再加入线段,得到L3.

X4:扫描到X4有些不一样了。
首先还是计算  扫过的面积+=L3*(X4-X3)
然后这时遇到了第一个矩形的出边,这时要从线段树中删除一条线段。
删除之后的结果是线段树中出现了2条线段,线段树自动维护这两条线段的长度之和L4

讲到这里算法流程应该很清晰了。
首先将所有矩形的入边,出边都存起来,然后根据X值排序。
这里用一个结构体,来存这些信息,然后排序。
[cpp] view plain copy
print ?
  1. //  
  2. struct LINE{  
  3.     int x;//横坐标   
  4.     int y1,y2;//矩形纵向线段的左右端点   
  5.     bool In;//标记是入边还是出边   
  6.     bool operator < (const Line &B)const{return x < B.x;}  
  7. }Line[maxn];   
//
struct LINE{
    int x;//横坐标 
    int y1,y2;//矩形纵向线段的左右端点 
    bool In;//标记是入边还是出边 
    bool operator < (const Line &B)const{return x < B.x;}
}Line[maxn]; 

然后扫描的时候,需要两个变量,一个叫PreL,存前一个x的操作结束之后的L值,和X,前一个横坐标。
假设一共有Ln条线段,线段下标从0开始,已经排好序。
那么算法大概是这样:
[cpp] view plain copy
print ?
  1. //  
  2. int PreL=0;//前一个L值,刚开始是0,所以第一次计算时不会引入误差   
  3. int X;//X值   
  4. int ANS=0;//存累计面积  
  5. int I=0;//线段的下标   
  6.   
  7. while(I < Ln){  
  8.     //先计算面积   
  9.     ANS+=PreL*(Line[I].x-X);  
  10.     X=Line[I].x;//更新X值  
  11.     //对所有X相同的线段进行操作   
  12.     while(I < Ln && Line[I].x == X){  
  13.         //根据入边还是出边来选择加入线段还是移除线段   
  14.         if(Line[I].In) Cover(Line[I].y1,Line[I].y2-1,1,n,1);  
  15.         else         Uncover(Line[I].y1,Line[I].y2-1,1,n,1);  
  16.         ++I;  
  17.     }   
  18. }  
//
int PreL=0;//前一个L值,刚开始是0,所以第一次计算时不会引入误差 
int X;//X值 
int ANS=0;//存累计面积
int I=0;//线段的下标 

while(I < Ln){
    //先计算面积 
    ANS+=PreL*(Line[I].x-X);
    X=Line[I].x;//更新X值
    //对所有X相同的线段进行操作 
    while(I < Ln && Line[I].x == X){
        //根据入边还是出边来选择加入线段还是移除线段 
        if(Line[I].In) Cover(Line[I].y1,Line[I].y2-1,1,n,1);
        else         Uncover(Line[I].y1,Line[I].y2-1,1,n,1);
        ++I;
    } 
}

无论是求面积还是周长,扫描线的结构大概就是上面的样子。

需要解决的几个问题:

现在有两点需要说明一下。
(1):线段树进行线段操作时,每个点的含义(比如为什么Cover函数中,y2后面要-1)。
(2):线段树如何维护扫描线过程中的覆盖线段长度。
(3):线段树如何维护扫描线过程中线段的数量。

(1):线段树中点的含义

线段树如果没有离散化,那么线段树下标为1,就代表线段[1,2)
线段树下标为K的时候,代表的线段为[K,K+1) (长度为1)
所以,将上面的所有线段都化为[y1,y2)就可以理解了,线段[y1,y2)只包括线段树下标中的y1,y1+1,…,y2-1
当y值的范围是10^9时,就不能再按照上面的办法按值建树了,这时需要离散化。
下面是离散化的代码:
[cpp] view plain copy
print ?
  1. //  
  2. int Rank[maxn],Rn;  
  3. void SetRank(){//调用前,所有y值被无序存入Rank数组,下标为[1..Rn]   
  4.     int I=1;  
  5.     //第一步排序   
  6.     sort(Rank+1,Rank+1+Rn);   
  7.     //第二步去除重复值   
  8.     for(int i=2;i<=Rn;++i) if(Rank[i]!=Rank[i-1]) Rank[++I]=Rank[i];  
  9.     Rn=I;  
  10.     //此时,所有y值被从小到大无重复地存入Rank数组,下标为[1..Rn]   
  11. }   
  12. int GetRank(int x){//给定x,求x的下标   
  13.     //二分法求下标   
  14.     int L=1,R=Rn,M;//[L,R] first >=x  
  15.     while(L!=R){  
  16.         M=(L+R)>>1;  
  17.         if(Rank[M]
  18.         else R=M;  
  19.     }  
  20.     return L;  
  21. }  
//
int Rank[maxn],Rn;
void SetRank(){//调用前,所有y值被无序存入Rank数组,下标为[1..Rn] 
    int I=1;
    //第一步排序 
    sort(Rank+1,Rank+1+Rn); 
    //第二步去除重复值 
    for(int i=2;i<=Rn;++i) if(Rank[i]!=Rank[i-1]) Rank[++I]=Rank[i];
    Rn=I;
    //此时,所有y值被从小到大无重复地存入Rank数组,下标为[1..Rn] 
} 
int GetRank(int x){//给定x,求x的下标 
    //二分法求下标 
    int L=1,R=Rn,M;//[L,R] first >=x
    while(L!=R){
        M=(L+R)>>1;
        if(Rank[M]

此时,线段树的下标的含义就变成:如果线段树下标为K,代表线段[ Rank[K] , Rank[K+1] )。
下标为K的线段长度为Rank[K+1]-Rank[K]
所以此时叶节点的线段长度不是1了。
这时,之前的扫描线算法的函数调用部分就稍微的改变了一点:
[cpp] view plain copy
print ?
  1. //   
  2. if(Line[I].In) Cover(GetRank(Line[I].y1),GetRank(Line[I].y2)-1,1,n,1);  
  3. else         Uncover(GetRank(Line[I].y1),GetRank(Line[I].y2)-1,1,n,1);  
// 
if(Line[I].In) Cover(GetRank(Line[I].y1),GetRank(Line[I].y2)-1,1,n,1);
else         Uncover(GetRank(Line[I].y1),GetRank(Line[I].y2)-1,1,n,1);
看着有点长,其实不难理解,只是多了一步从y值到离散之后的下标的转换。

注意一点,如果下标为K的线段长度为Rank[K+1]-Rank[K],那么下标为Rn的线段树的长度呢?
其实这个不用担心,Rank[Rn]作为所有y值中的最大值,它肯定是一个线段的右端点,
而右端点求完离散之后的下标还要-1,所以上面的线段覆盖永远不会覆盖到Rn。
所以线段树其实只需要建立Rn-1个元素,因为下标为Rn的无法定义,也不会被访问。
不过有时候留着也有好处,这个看具体实现时自己取舍。

(2):如何维护覆盖线段长度

先提一个小技巧,一般,利用两个子节点来更新本节点的函数写成PushUp();
但是,对于比较复杂的子区间合并问题,在区间查询的时候,需要合并若干个子区间。
而合并子区间是没办法用PushUp函数的。于是,对于比较复杂的问题,把单个节点的信息写成一个结构体。
在结构体内重载运算符”+”,来实现区间合并。这样,不仅在PushUp函数可以调用这个加法,区间询问时也可以
调用这个加法,这样更加方便。

下面给出维护线段覆盖长度的节点定义:
[cpp] view plain copy
print ?
  1. //  
  2. struct Node{  
  3.     int Cover;//区间整体被覆盖的次数   
  4.     int L;//Length : 所代表的区间总长度  
  5.     int CL;//Cover Length :实际覆盖长度  
  6.     Node operator +(const Node &B)const{  
  7.         Node X;  
  8.         X.Cover=0;//因为若上级的Cover不为0,不会调用子区间加法函数   
  9.         X.L=L+B.L;  
  10.         X.CL=CL+B.CL;  
  11.         return X;  
  12.     }  
  13. }K[maxn<<2];  
//
struct Node{
    int Cover;//区间整体被覆盖的次数 
    int L;//Length : 所代表的区间总长度
    int CL;//Cover Length :实际覆盖长度
    Node operator +(const Node &B)const{
        Node X;
        X.Cover=0;//因为若上级的Cover不为0,不会调用子区间加法函数 
        X.L=L+B.L;
        X.CL=CL+B.CL;
        return X;
    }
}K[maxn<<2];


 这样定义之后,区间的信息更新是这样的: 
  
若本区间的覆盖次数大于0,那么令CL=L,直接为全覆盖,不管下层是怎么覆盖的,反正本区间已经全被覆盖。
若本区间的覆盖次数等于0,那么调用上面结构体中的加法函数,利用子区间的覆盖来计算。
加入一条线段就是给每一个分解的子区间的Cover+1,删除线段就-1,每次修改Cover之后,更新区间信息。
这里完全没有下推标记的过程。
查询的代码如下:
如果不把区间加法定义成结构体内部的函数,而是定义在PushUp函数内,那么这里几乎就要重写一遍区间合并。
因为PushUp在这里用不上。
[cpp] view plain copy
print ?
  1. //  
  2. Node Query(int L,int R,int l,int r,int rt){  
  3.     if(L <= l && r <= R){  
  4.         return K[rt];  
  5.     }  
  6.     int m=(l+r)>>1;  
  7.     Node LANS,RANS;  
  8.     int X=0;  
  9.     if(L <= m) LANS=Query(L,R,ls),X+=1;  
  10.     if(R >  m) RANS=Query(L,R,rs),X+=2;  
  11.     if(X==1) return LANS;  
  12.     if(X==2) return RANS;  
  13.     return LANS+RANS;  
  14. }  
//
Node Query(int L,int R,int l,int r,int rt){
    if(L <= l && r <= R){
        return K[rt];
    }
    int m=(l+r)>>1;
    Node LANS,RANS;
    int X=0;
    if(L <= m) LANS=Query(L,R,ls),X+=1;
    if(R >  m) RANS=Query(L,R,rs),X+=2;
    if(X==1) return LANS;
    if(X==2) return RANS;
    return LANS+RANS;
}

维护线段覆盖3次或以上的长度:

[cpp] view plain copy
print ?
  1. //  
  2. struct Nodes{    
  3.     int C;//Cover    
  4.     int CL[4];//CoverLength[0~3]    
  5.     //CL[i]表示被覆盖了大于等于i次的线段长度,CL[0]其实就是线段总长   
  6. }ST[maxn<<2];    
  7. void PushUp(int rt){    
  8.     for(int i=1;i<=3;++i){    
  9.         if(ST[rt].C < i) ST[rt].CL[i]=ST[rt<<1].CL[i-ST[rt].C]+ST[rt<<1|1].CL[i-ST[rt].C];    
  10.         else ST[rt].CL[i]=ST[rt].CL[0];    
  11.     }    
  12. }    
//
struct Nodes{  
    int C;//Cover  
    int CL[4];//CoverLength[0~3]  
    //CL[i]表示被覆盖了大于等于i次的线段长度,CL[0]其实就是线段总长 
}ST[maxn<<2];  
void PushUp(int rt){  
    for(int i=1;i<=3;++i){  
        if(ST[rt].C < i) ST[rt].CL[i]=ST[rt<<1].CL[i-ST[rt].C]+ST[rt<<1|1].CL[i-ST[rt].C];  
        else ST[rt].CL[i]=ST[rt].CL[0];  
    }  
}  

这里给出节点定义和PushUp().
更新节点信息的思路大概就是:
假设要更新CL[3],然后发现本节点被覆盖了2次,那么本节点被覆盖三次或以上的长度就等于子节点被覆盖了1次或以上的长度之和。
而CL[0]建树时就赋值,之后不需要修改。

(3):如何维护扫描线过程中线段的数量

[cpp] view plain copy
print ?
  1. //   
  2. struct Node{    
  3.     int cover;//完全覆盖层数    
  4.     int lines;//分成多少个线段    
  5.     bool L,R;//左右端点是否被覆盖    
  6.     Node operator +(const Node &B){//连续区间的合并     
  7.         Node C;    
  8.         C.cover=0;    
  9.         C.lines=lines+B.lines-(R&&B.L);    
  10.         C.L=L;C.R=B.R;    
  11.         return C;    
  12.     }    
  13. }K[maxn<<2];    
// 
struct Node{  
    int cover;//完全覆盖层数  
    int lines;//分成多少个线段  
    bool L,R;//左右端点是否被覆盖  
    Node operator +(const Node &B){//连续区间的合并   
        Node C;  
        C.cover=0;  
        C.lines=lines+B.lines-(R&&B.L);  
        C.L=L;C.R=B.R;  
        return C;  
    }  
}K[maxn<<2];  

要维护被分成多少个线段,就需要记录左右端点是否被覆盖,知道了这个,就可以合并区间了。
左右两个区间合并时,若左区间的最右侧有线段且右区间的最左侧也有线段,那么这两个线段会合二为一,于是总线段数量会少1.

扫描线求重叠矩形周长:

线段树_第18张图片
这个图是在原来的基础上多画了一些东西,这次是要求周长。
所有的横向边都画了紫色,所有的纵向边画了绿色。

先考虑绿色的边,由图可以观察到,绿色边的长度其实就是L的变化值。
比如考虑X1,本来L是0,从0变到L1,所以绿色边长为L1.
再考虑X2,由L1变成了L2,所以绿色边长度为L2-L1,
于是,绿色边的长度就是L的变化值(注意上图中令L0=0,L9=0)。
因为长度是从0开始变化,最终归0.

再考虑紫色的边,要计算紫色边,其实就是计算L的线段是有几个线段组成的,每个线段会贡献两个端点(紫色圆圈)
而每个端点都会向右延伸出一条紫色边一直到下一个X值。

所以周长就是以上两部分的和。而两部分怎么维护,前面都讲过了,下面给出代码。
[cpp] view plain copy
print ?
  1. //   
  2. struct Node{    
  3.     int cover;//完全覆盖层数    
  4.     int lines;//分成多少个线段    
  5.     bool L,R;//左右端点是否被覆盖    
  6.     int CoverLength;//覆盖长度     
  7.     int Length;//总长度     
  8.     Node(){}    
  9.     Node(int cover,int lines,bool L,bool R,int CoverLength):cover(cover),lines(lines),L(L),R(R),CoverLength(CoverLength){}    
  10.     Node operator +(const Node &B){//连续区间的合并     
  11.         Node C;    
  12.         C.cover=0;    
  13.         C.lines=lines+B.lines-(R&&B.L);    
  14.         C.CoverLength=CoverLength+B.CoverLength;    
  15.         C.L=L;C.R=B.R;    
  16.         C.Length=Length+B.Length;    
  17.         return C;    
  18.     }    
  19. }K[maxn<<2];    
  20. void PushUp(int rt){//更新非叶节点     
  21.     if(K[rt].cover){    
  22.         K[rt].CoverLength=K[rt].Length;    
  23.         K[rt].L=K[rt].R=K[rt].lines=1;    
  24.     }    
  25.     else{    
  26.         K[rt]=K[rt<<1]+K[rt<<1|1];    
  27.     }    
  28. }    
// 
struct Node{  
    int cover;//完全覆盖层数  
    int lines;//分成多少个线段  
    bool L,R;//左右端点是否被覆盖  
    int CoverLength;//覆盖长度   
    int Length;//总长度   
    Node(){}  
    Node(int cover,int lines,bool L,bool R,int CoverLength):cover(cover),lines(lines),L(L),R(R),CoverLength(CoverLength){}  
    Node operator +(const Node &B){//连续区间的合并   
        Node C;  
        C.cover=0;  
        C.lines=lines+B.lines-(R&&B.L);  
        C.CoverLength=CoverLength+B.CoverLength;  
        C.L=L;C.R=B.R;  
        C.Length=Length+B.Length;  
        return C;  
    }  
}K[maxn<<2];  
void PushUp(int rt){//更新非叶节点   
    if(K[rt].cover){  
        K[rt].CoverLength=K[rt].Length;  
        K[rt].L=K[rt].R=K[rt].lines=1;  
    }  
    else{  
        K[rt]=K[rt<<1]+K[rt<<1|1];  
    }  
}  

扫描的代码:

[cpp] view plain copy
print ?
  1. int PreX=L[0].x;//前X坐标     
  2. int ANS=0;//目前累计答案     
  3. int PreLength=0;//前线段总长    
  4. int PreLines=0;//前线段数量     
  5. Build(1,20001,1);    
  6. for(int i=0;i
  7.     //操作     
  8.     if(L[i].c) Cover(L[i].y1,L[i].y2-1,1,20001,1);    
  9.     else Uncover(L[i].y1,L[i].y2-1,1,20001,1);    
  10.     //更新横向的边界     
  11.     ANS+=2*PreLines*(L[i].x-PreX);    
  12.     PreLines=K[1].lines;    
  13.     PreX=L[i].x;    
  14.     //更新纵向边界     
  15.     ANS+=abs(K[1].CoverLength-PreLength);    
  16.     PreLength=K[1].CoverLength;    
  17. }    
  18. //输出答案     
  19. printf(”%d\n”,ANS);    
        int PreX=L[0].x;//前X坐标   
        int ANS=0;//目前累计答案   
        int PreLength=0;//前线段总长  
        int PreLines=0;//前线段数量   
        Build(1,20001,1);  
        for(int i=0;i


求立方体重叠3次或以上的体积:

这个首先扫描面,每个面内求重叠了3次或以上的面积,然后乘以移动距离就是体积。
面内扫描线,用线段树维护重叠了3次或以上的线段长度,然后用长度乘移动距离就是重叠了3次或以上的面积。
扫描面基本原理都跟扫描线一样,就是嵌套了一层而已,写的时候细心一点就没问题了。


八:可持久化 (主席树)

可持久化线段树,也叫主席树。
可持久化数据结构思想,就是保留整个操作的历史,即,对一个线段树进行操作之后,保留访问操作前的线段树的能力。
最简单的方法,每操作一次,建立一颗新树。这样对空间的需求会很大。
而注意到,对于点修改,每次操作最多影响个节点,于是,其实操作前后的两个线段树,结构一样,
而且只有个节点不同,其余的节点都一样,于是可以重复利用其余的点。
这样,每次操作,会增加个节点。
于是,这样的线段树,每次操作需要O(log2(n))的空间。

题目:HDU 2665 Kth number      题解
给定10万个数,10万个询问。
每个询问,问区间[L,R]中的数,从小到大排列的话,第k个数是什么。

这个题,首先对十万个数进行离散化,然后用线段树来维护数字出现的次数。
每个节点都存出现次数,那么查询时,若左节点的数的个数>=k,就往左子树递归,否则往右子树递归。
一直到叶节点,就找到了第k大的数。

这题的问题是,怎么得到一个区间的每个数出现次数。
注意到,数字的出现次数是满足区间减法的。
于是要求区间[L,R]的数,其实就是T[R]-T[L-1]  ,其中T[X]表示区间[1,X]的数形成的线段树。
现在的问题就是,如何建立这10万个线段树。

由之前的分析,需要O(n log2(n))的空间
下面是代码:
[cpp] view plain copy
print ?
  1. //主席树     
  2. int L[maxnn],R[maxnn],Sum[maxnn],T[maxn],TP;//左右子树,总和,树根,指针     
  3. void Add(int &rt,int l,int r,int x){//建立新树,l,r是区间, x是新加入的数字的排名  
  4.     ++TP;L[TP]=L[rt];R[TP]=R[rt];Sum[TP]=Sum[rt]+1;rt=TP;//复制&新建    
  5.     if(l==r) return;    
  6.     int m=(l+r)>>1;    
  7.     if(x <= m) Add(L[rt],l,m,x);    
  8.     else       Add(R[rt],m+1,r,x);    
  9. }    
  10. int Search(int TL,int TR,int l,int r,int k){//区间查询第k大    
  11.     if(l==r) return l;//返回第k大的下标    
  12.     int m=(l+r)>>1;    
  13.     if(Sum[L[TR]]-Sum[L[TL]]>=k) return Search(L[TL],L[TR],l,m,k);    
  14.     else return Search(R[TL],R[TR],m+1,r,k-Sum[L[TR]]+Sum[L[TL]]);    
  15. }    
//主席树   
int L[maxnn],R[maxnn],Sum[maxnn],T[maxn],TP;//左右子树,总和,树根,指针   
void Add(int &rt,int l,int r,int x){//建立新树,l,r是区间, x是新加入的数字的排名
    ++TP;L[TP]=L[rt];R[TP]=R[rt];Sum[TP]=Sum[rt]+1;rt=TP;//复制&新建  
    if(l==r) return;  
    int m=(l+r)>>1;  
    if(x <= m) Add(L[rt],l,m,x);  
    else       Add(R[rt],m+1,r,x);  
}  
int Search(int TL,int TR,int l,int r,int k){//区间查询第k大  
    if(l==r) return l;//返回第k大的下标  
    int m=(l+r)>>1;  
    if(Sum[L[TR]]-Sum[L[TL]]>=k) return Search(L[TL],L[TR],l,m,k);  
    else return Search(R[TL],R[TR],m+1,r,k-Sum[L[TR]]+Sum[L[TL]]);  
}  

以上就是主席树部分的代码。
熟悉SBT的,应该都很熟悉这种表示方法。
L,R是伪指针,指向左右子节点。
特殊之处是,0 表示空树,并且 L[0]=R[0]=0.
也就是说,空树的左右子树都是空树。
而本题中,每一颗树其实都是完整的,刚开始有一颗空树。
但是刚开始的空树,真的需要用空间去存吗?
其实不需要,刚开始的空树有这些性质:
1.每个节点的Sum值为0
2.每个非叶节点的左右子节点的Sum值也是0

而SBT的空树刚好满足这个性质。而线段树不依赖L,R指针来结束递归。
线段树是根据区间l,r来结束的,所以不会出现死循环。
所以只需要把Sum[0]=0;那么刚开始就不需要建树了,只有每个操作的个节点。

这个线段树少了表示父节点的int rt,因为不需要(也不能够)通过rt来找子节点了,而是直接根据L,R来找。

—————————–     补充     ————————————-

终于又找到一道可以用主席树的题目了:Codeforces 650D.Zip-line  题解
做这题之前需要会求普通的LIS问题(最长上升子序列问题)。

九:练习题

适合非递归线段树的题目:


Codeforces 612D The Union of k-Segments :  题解
题意:线段求交,给定一堆线段,按序输出被覆盖k次或以上的线段和点。
基础题,先操作,最后一次下推标记,然后输出,
维护两个线段树,一个线段覆盖,一个点覆盖。

Codeforces 35E Parade : 题解

题意:给定若干矩形,下端挨着地面,求最后的轮廓形成的折线,要求输出每一点的坐标。

思路:虽然是区间修改的线段树,但只需要在操作结束后一次下推标记,然后输出,所以适合非递归线段树。


URAL 1846 GCD2010 :  题解

题意:总共10万个操作,每次向集合中加入或删除一个数,求集合的最大公因数。(规定空集的最大公因数为1)


Codeforces 12D Ball :   题解

题意:

给N (N<=500000)个点,每个点有x,y,z ( 0<= x,y,z <=10^9 )

对于某点(x,y,z),若存在一点(x1,y1,z1)使得x1 > x && y1 > y && z1 > z 则点(x,y,z)是特殊点。

问N个点中,有多少个特殊点。


提示:排序+线段树


Codeforces 19D Points : 题解

题意:

给定最多20万个操作,共3种:

1.add x y         :加入(x,y)这个点

2.remove x y  :删除(x,y)这个点

3.find x y         :找到在(x,y)这点右上方的x最小的点,若x相同找y最小的点,输出这点坐标,若没有,则输出-1.

提示:排序,线段树套平衡树


Codeforces 633E Startup Funding : 题解

这题需要用到一点概率论,组合数学知识,和二分法。

非递归线段树在这题中主要解决RMQ问题(区间最大最小值问题),由于不带修改,这题用Sparse Table求解RMQ是标答。

因为RMQ询问是在二分法之内求的,而Sparse Table可以做到O(1)查询,所以用Sparse Table比较好,总复杂度O(n*log(n))。

不过非递归线段树也算比较快的了,虽然复杂度是O(n*log(n)*log(n)),还是勉强过了这题。


扫描线题目:

POJ 1177 Picture:给定若干矩形求合并之后的图形周长    题解
HDU 1255 覆盖的面积:给定平面上若干矩形,求出被这些矩形覆盖过至少两次的区域的面积.   题解
HDU 3642 Get The Treasury:给定若干空间立方体,求重叠了3次或以上的体积(这个是扫描面,每个面再扫描线)题解
POJ 2482 Stars in your window : 给定一些星星的位置和亮度,求用W*H的矩形能够框住的星星亮度之和最大为多少。    题解

递归线段树题目:

Codeforces 558E A Simple Task  题解

给定一个长度不超过10^5的字符串(小写英文字母),和不超过5000个操作。

每个操作 L R K 表示给区间[L,R]的字符串排序,K=1为升序,K=0为降序。

最后输出最终的字符串。


Codeforces 527C Glass Carving  :  题解
给定一个矩形,不停地纵向或横向切割,问每次切割后,最大的矩形面积是多少。

URAL1989 Subpalindromes     题解
给定一个字符串(长度<=100000),有10万个操作。
操作有两种:   
1:改变某个字符。 
2:判断某个子串是否构成回文串。 

HDU 4288 Coder :  题解
 题意:对一个集合进行插入与删除操作。要求询问某个时刻,集合中的元素从小到大排序之后,序号%5 ==3 的元素值之和。
这题其实不一定要用线段树去做的,不过线段树还是可以做的。

HDU 2795 BillBoard : 题解

题意:有一个板,h行,每行w长度的位置。每次往上面贴一张海报,长度为1*wi .

每次贴的时候,需要找到最上面的,可以容纳的空间,并且靠边贴。


Codeforces 374D Inna and Sequence :题解
题意:给定百万个数a[m],然后有万个操作,每次给现有序列加一个字符(0或1),或者删掉已有序列中,第 a[0] 个,第a[1]个,…,第a[m]个。

Codeforces 482B Interesting Array:  题解

题意就是,给定n,m.

满足m个条件的n个数,或说明不存在。

每个条件的形式是,给定 Li,Ri,Qi ,要求   a[Li]&a[Li+1]&…&a[Ri] = Qi ;

Codeforces 474E Pillar (线段树+动态规划):  题解

题意就是,给定10^5 个数(范围10^15),求最长子序列使得相邻两个数的差大于等于 d。


POJ 2777  Count Color :   题解

给线段涂颜色,最多30种颜色,10万个操作。

每个操作给线段涂色,或问某一段线段有多少种颜色。

30种颜色用int的最低30位来存,然后线段树解决。


URAL 1019 Line Painting: 线段树的区间合并  题解

给一段线段进行黑白涂色,最后问最长的一段白色线段的长度。


Codeforces 633H Fibonacci-ish II  :题解

这题需要用到莫队算法(Mo’s Algorithm)+线段树区间修改,不过是单边界的区间,写起来挺有趣。

另一种解法就是暴力,很巧妙的方法,高复杂度+低常数居然就这么给过了。


树套树题目:

ZOJ 2112 Dynamic Rankings 动态区间第k大  题解
做法:树状数组套主席树 或者 线段树套平衡树



Codeforces 605D Board Game :  题解
做法:广度优先搜索(BFS)  +  线段树套平衡树

Codeforces 19D Points : 题解

题意:

给定最多20万个操作,共3种:

1.add x y         :加入(x,y)这个点

2.remove x y  :删除(x,y)这个点

3.find x y         :找到在(x,y)这点右上方的x最小的点,若x相同找y最小的点,输出这点坐标,若没有,则输出-1.

提示:排序,线段树套平衡树



转载请注明出处: 原文地址:http://blog.csdn.net/zearot/article/details/48299459

                

你可能感兴趣的:(数据结构,数据结构)