偏序,相信大家应该都听说过。
简单地说(不严谨的说),偏序就是满足【自反性】【反对称性】【传递性】的关系。
那么偏序具体是什么呢,举个例子:有理数上的小于等于关系就是一个偏序关系。如果我们只将数进行两两对比,如果是一个偏序集中的元素。
(1) a<=a显然成立
(2)若a<=b且b<=a,那么a=b
(3)a<=b,,b<=c,那么 a<=c显然成立
以上三点分别对应自反性,反对称性和传递性。
刚才笔者给大家解释了什么叫做偏序,上述偏序也是一维偏序。
那么什么叫二维偏序呢,若
那么如何解决偏序问题呢?
首先从最简单的一维偏序开始。
【问题1】 给定一个无序序列,求出序列中比a小的元素有多少个?
【分析】将序列排序后可很轻松的解决。
这就是最简单的一维偏序问题。
接下来我们看二维偏序。
【问题2】给定一个无序序列,求出其最长上升子序列。
【分析】肯定有读者会有疑问了,最长上升子序列是偏序问题我明白,可是它为什么是二维的呢?它当然是二维的,因为我们有一维是序列,还有另外一维是时间。我们要保证权值大小关系的同时,还需要保证出现的先后。所以最长上升子序列是一个二维的偏序问题。
【解答】我们先按时间维排序后,然后再看序列元素之间的大小关系。怎么按时间维排序呢?在序列中,它本来就是按时间维排好序的。然后怎么做呢?我们接着往下看,然后大家就能明白了。
给定一个序列 a【2 1 5 3 6 4 8 9 7】
我们新开一个数组,为tmp。
我把数组画在下面:
这是初始状态
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp |
遍历元素a[1] = 2
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 |
遍历元素a[2] = 1
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 |
遍历元素a[3] = 5
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 |
遍历元素a[4] = 3
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 2 |
遍历元素a[5] = 6
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 2 | 3 |
遍历元素a[6] = 4
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 3 | 2 | 3 |
遍历元素a[7] = 8
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 3 | 2 | 3 | 4 |
遍历元素a[8] = 9
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 3 | 2 | 3 | 4 | 5 |
遍历元素a[9] = 7
a | 2 | 1 | 5 | 3 | 6 | 4 | 8 | 9 | 7 | |
---|---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
tmp | 1 | 1 | 2 | 3 | 2 | 3 | 4 | 4 | 5 |
好了,至此,整个过程就算结束了(10个表格画了半天啊!)(骗你的,其实是复制的表格 )
我们来找规律吧!
我开玩笑的,我们来看解答过程。
我们一个一个遍历序列元素,在tmp中将该元素前面最大值记录下来,再加一,存进tmp[a[i]]中,表示在序列中a[i]前面有几个比他小。
于是我们就可以发现,下标就是一个时间维,我们将序列中小于它的并且时间小于它的放入tmp里面维护,tmp中的最大值就是最长上升子序列,其中tmp[a[i]]表示序列中从1到 i 的最长上升子序列是多少。
维护tmp的时候十分类似前缀和,所以我们用树状数组来维护。这样时间复杂度为O(nlogn)。
下面是代码:
#include
using namespace std;
const int maxn = 1e5+7;
int sum[maxn];
int a[maxn];
int n;
void add(int p,int x)
{
for(int i=p;i<=n;i+=(i & -i))
{
sum[i] = max(sum[i],x);
}
}
int query(int p)
{
int ans = 0;
for(int i=p;i;i-=(i & -i))
{
ans = max(ans,sum[i]);
}
return ans;
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;i++)
{
scanf("%d",a+i);
}
int ans = 0;
for(int i=1;i<=n;i++)
{
int t = query(a[i]-1)+1;
ans = max(ans,t);
add(a[i],t);
}
printf("%d\n",ans);
return 0;
}
以上就是树状数组求LIS的算法啦!
接下来我们来看三维偏序问题。
【问题3】洛谷P3810陌上花开
【分析】这个题目虽说是模板题,可是还是和一般的模板题有一点区别的,这道题需要记录答案,而不是直接询问。
不过它终究还是个三维的偏序问题,这个就是一个很好理解的三维了,因为(x,y,z)总共三个维度嘛。那么这道题要怎么解决呢,我们需要一个新的知识,叫做CDQ分治。
我们将x排序后,我们只需要关心(y,z)的关系就可以了,我们对于y进行递归排序,然后归并排序,就可以保证y有序,然后我们在归并的时候将z加入树状数组,就可以统计出答案了。不过好像也可以不归并排序,在二维的时候继续CDQ分治降到一维,然后统计答案。
下面是代码:
#include
using namespace std;
const int maxn = 2e5+7;
int n,m,k;
struct node
{
int x,y,z;
int w,ans;
};
node a[maxn],b[maxn];
int sum[maxn],cnt[maxn];
bool cmpx(node a,node b)
{
if(a.x==b.x)
{
if(a.y==b.y) return a.z<b.z;
return a.y<b.y;
}
return a.x<b.x;
}
bool cmpy(node a,node b)
{
if(a.y==b.y) return a.z<b.z;
return a.y<b.y;
}
void add(int p,int x)
{
for(int i=p;i<=k;i+=(i & -i)) sum[i] += x;
}
int query(int p)
{
int ans = 0;
for(int i=p;i;i-=(i & -i)) ans += sum[i];
return ans;
}
void cdq(int l,int r)
{
if(l==r) return;
int m = (l+r)/2;
cdq(l,m);
cdq(m+1,r);
sort(a+l,a+1+m,cmpy);
sort(a+1+m,a+1+r,cmpy);
int i=m+1,j=l;
for(;i<=r;i++)
{
while(a[j].y<=a[i].y && j<=m)
{
add(a[j].z,a[j].w);
j++;
}
a[i].ans += query(a[i].z);
}
for(i=l;i<j;i++)
{
add(a[i].z,-a[i].w);
}
}
int main()
{
scanf("%d%d",&n,&k);
m = 0;
for(int i=1;i<=n;i++)
{
scanf("%d%d%d",&b[i].x,&b[i].y,&b[i].z);
}
sort(b+1,b+1+n,cmpx);
int c = 0;
for(int i=1;i<=n;i++)
{
c++;
if(b[i].x!=b[i+1].x || b[i].y!=b[i+1].y || b[i].z!=b[i+1].z)
{
a[++m] = b[i];
a[m].w = c;
c = 0;
}
}
cdq(1,m);
for(int i=1;i<=m;i++)
{
cnt[a[i].ans+a[i].w-1] += a[i].w;
}
for(int i=0;i<n;i++) printf("%d\n",cnt[i]);
return 0;
}
因为有重复的元素,所以我们在树状数组的时候加上的是重复元素的个数,而不是1。
最后统计答案的时候要算上相同元素内部的贡献,也就是ans+=w-1。如果不理解的话请看下面的例子:(1,1,1),(1,1,1),(1,1,1),(1,1,2),我们在统计答案的过程中中间两个(1,1,1)被抹掉了,就变成了(1,1,1),(1,1,2),然后答案就是ans = 1,我们需要将中间的两个(1,1,1)的贡献加回来,也就是ans += w-1了,然后cnt[ans]+=w就可以记录个数了。