线段树 Segment_tree
网上有人把线段树翻译成 Interval_Tree
Interval_Tree 是另外一种数据结构 而且并非二叉树
这个是线段树的标准E文翻译
可以看wikipedia的原文 http://en.wikipedia.org/wiki/Segment_tree
顾名思义 线段树存储的是连续的线段而非离散的节点
先看一张经典的线段树图解
这个就是标准的线段树
既然是树形结构 我们就得先考虑怎么存储这棵树
分析线段树的定义
*线段树是一棵二叉树 记为T(a, b)
*参数a,b表示区间[a,b] 其中b-a称为区间的长度 记为L
*线段树T(a,b)也可递归定义为
-若L>1 [a, (a+b) div 2]为T的左儿子
[(a+b) div 2,b]为T的右儿子
-若L=1 T为叶子节点
可以得到一些基本性质
*线段树除最后一层外是满二叉树
*线段树是平衡的 高度是Log2L左右
如此我们有2种存储方法
*直接用指针
定义节点
struct node{ int L,r; int color; }post[N<<2];
其中ls rs分别为左右儿子 l,r是区间的范围
真正实现时一般用数组模拟指针
我们只需定义longint数组ls[]rs[] l[] r[]
*用*2和*2+1代替左右儿子指针
由于是除最后一层外是满二叉树
我们可以向存储堆一样存储线段树
用l[]r[]来存储节点区间范围
x的左右儿子分别就是x*2和x*2+1
具体实现用位移代替乘2
这样乘法指针运算和上述数组调用一样 几乎不需要时间
具体用哪种纯粹是个人喜好 没什么区别
(下文中我的程序都是用的数组模拟 直接存储儿子指针)
接下来讨论线段树的具体操作
也就是维护这种数据结构的算法 (srO 数据结构+算法=程序 Orz)
总结起来就两个词 递归 & 分治
结合一个具体问题吧 PKU 2777
http://poj.org/problem?id=2777
这是线段树的入门题 相当经典
要求程序实现一个涂色的程序
支持对区间[A,B]涂C的颜色和统计区间[A,B]的颜色种类
朴素的做法是用数组a[]存储下整个区间[0,100000]
然后循环涂色 循环查询 这样的复杂度是N*N 大大地TLE
我们考虑用线段树处理这个区间问题
首先我们得建树
先看程序
void Build(int L,int r,int id){ post[id].L=L; post[id].r=r; post[id].color=1; if(L!=r){ int mid=(L+r)>>1; Build(L,mid,id<<1); Build(mid+1,r,id<<1|1); } }*build函数是一个递归的过程 参数L,r表示当前建立区间[L,r]的节点
* L!=r 是递归的边界条件 即建立到叶子节点了
*根据线段树定义 分别递归建立左右儿子区间
-2*id,2*id+1分别为当前节点的左子树和右子树
-注意使用位运算提高效率 还需注意L r mid 皆为区间端点
其实上文中建好的线段树其实是一个骨架
就相当于朴素做法中我们还未操作的空数组 等待我们给它刷颜色
既然要刷颜色 我们就得存储各区间的颜色 给每个节点新开一个域n来记录颜色
表现在数组模拟上就是新建数组n[]
n数组代表当前节点所代表区间的颜色
因为这个问题的染色是覆盖类型的染色
对一个区间染色自然把为当前区间的子区间也染色了
所以是对子树染色而非区间染色
接着这样的思路 我们可以写出如下程序
int mid=(post[id].r+post[id].L)>>1; if(post[id].L==L&&post[id].r==r){ post[id].color=color; return; } if(post[id].color==color) return; if(post[id].color>0){ post[id<<1].color=post[id<<1|1].color=post[id].color; post[id].color=0; }*判断当前区间是否在需要覆盖的区间内 是就修改颜色
这里需要说明一下这种写法的正确性
即不会出现[L,r]在[l[x],r[x]]外与当前区间没有交集的情况
首先在根节点处[L,r]和区间显然有交集
然后运用数学归纳法的思路 说明当前节点区间和[L,r]有交集的时候 递归插入儿子也是保证和儿子区间有交集的
这样只要执行插入函数就有交集 就能保证程序正确性
给出所有和当前区间有交集的情况图 可以发现经过if语句判断 递归插入都保证还是和儿子区间有交集
(黑色为当前区间 红色为欲染色区间 一共6种情况)
不难分析出这个插入函数的复杂度是O(N)级别的(需要遍历子树) 从常数上看比朴素还慢
但是不覆盖子树上的区间又会产生错误 我们需要对插入进行改进
改进后 我们的n[]数组不单记录一个节点的颜色 而是记录的子树的颜色
我们看具体操作
*如果当前区间已经染色且颜色和欲染色一致 则直接退出(这句话可以不要)
*如果当前区间被完全覆盖 就说明子树也被完全覆盖了 直接给当前节点染色退出
*如果没有被完全覆盖
-就给先给左右儿子染色成当前节点的颜色 然后当前节点赋值为混合颜色=0
-然后再递归染色左右子树
这样修改完全覆盖的区间时就可以直接修改然后退出 不用遍历子树了
而没有完全覆盖时 需要把颜色先下传给左右子树 再递归修改 保证子树颜色的正确性
这样我们访问的区间总数就降到了O(LogN)级别个 比O(N)好了不少
这个其实是一种最原始的Lazy-Tag思想
这种思想很重要 也比较难掌握 我们以后详细讨论
给出改进后的代码
void update(int L,int r,int color,int id){ int mid=(post[id].r+post[id].L)>>1; if(post[id].L==L&&post[id].r==r){ post[id].color=color; return; } if(post[id].color==color) return; if(post[id].color>0){ post[id<<1].color=post[id<<1|1].color=post[id].color; post[id].color=0; } if(r<=mid) update(L,r,color,id<<1); else if(L>mid) update(L,r,color,id<<1|1); else{ update(L,mid,color,id<<1); update(mid+1,r,color,id<<1|1); } }最后就是统计了
统计相对很简单 一共30种颜色 用个Simple Hash即可
这时候我们记录的混合颜色就有用了 用于判断
结构和插入差不多 不过递归的条件不再是是否有交集而是是否为空节点了
void query(int L,int r,int id){ int mid=(post[id].L+post[id].r)>>1; if(post[id].color>0){ visit[post[id].color]=1; return; } if(r<=mid) query(L,r,id<<1); else if(L>mid) query(L,r,id<<1|1); else{ query(L,mid,id<<1); query(mid+1,r,id<<1|1); } }
最后是我的AC代码#include<iostream> #include<cstdio> #include<cstring> using namespace std; #define N 450000 struct node{ int L,r; int color; }post[N<<2]; bool visit[50]; void Build(int L,int r,int id){ post[id].L=L; post[id].r=r; post[id].color=1; if(L!=r){ int mid=(L+r)>>1; Build(L,mid,id<<1); Build(mid+1,r,id<<1|1); } } void update(int L,int r,int color,int id){ int mid=(post[id].r+post[id].L)>>1; if(post[id].L==L&&post[id].r==r){ post[id].color=color; return; } if(post[id].color==color) return; if(post[id].color>0){ post[id<<1].color=post[id<<1|1].color=post[id].color; post[id].color=0; } if(r<=mid) update(L,r,color,id<<1); else if(L>mid) update(L,r,color,id<<1|1); else{ update(L,mid,color,id<<1); update(mid+1,r,color,id<<1|1); } } void query(int L,int r,int id){ int mid=(post[id].L+post[id].r)>>1; if(post[id].color>0){ visit[post[id].color]=1; return; } if(r<=mid) query(L,r,id<<1); else if(L>mid) query(L,r,id<<1|1); else{ query(L,mid,id<<1); query(mid+1,r,id<<1|1); } } int main(){ int L,v,n,a,b,c,i,j; char tmp[3]; int sum=0; while(scanf("%d%d%d",&L,&v,&n)!=EOF){ Build(1,L,1); for(i=0;i<n;i++){ scanf("%s",tmp); if(tmp[0]=='P'){ scanf("%d%d",&a,&b); sum=0; memset(visit,0,sizeof(visit)); query(a,b,1); for(j=1;j<=v;j++) if(visit[j]) sum++; printf("%d\n",sum); }else{ scanf("%d%d%d",&a,&b,&c); update(a,b,c,1); } } } }