cdq是何许人也?请参看这篇:https://wenku.baidu.com/view/3b913556fd0a79563d1e7245.html。
在这篇论文中,cdq提出了对修改/询问型问题(Modify-Query问题)的分治做法,下面来具体讨论一下:
我们将修改/询问看作在时间轴上的一系列元素,把修改和询问统称为“操作”,并用记号([l,r])表示第(l)个操作到第(r)个操作的序列。
在时间轴上进行的操作,众所周知有这样的特性:时间早的会影响时间晚的,而反过来不会,这就是cdq分治的本质:用前面的修改更新后面的答案。
假设我们要计算一段长为(m)的区间([l,r])的答案,考虑计算([l,mid])和([mid+1,r]),最终将两段区间合并,其中(mid=leftlfloorfrac{l+r}{2} ight floor)。
这里,([l,r])的答案,指的就是,单纯的([l,r])的答案。不考虑更早的操作对([l,r])的影响。
这样的做法是否似曾相识?典型的分治—合并的思路,就出现在最稳定的排序方法——归并排序上。
其时间复杂度为(T(1)=Theta(1), T(n)=2T(frac{n}{2})+Theta(n)=Theta(n\,log\,n)),其中合并区间的复杂度为(Theta(n))。
提出这个例子只是为了回忆起对分治感觉和思路。
看一道例题,方便讲解:(这题就是论文中的题目)
给你(q)个操作:①插入一个点((x,y)),②询问当前所有的点中,满足(x_ileq x,y_ileq y)的点(x_i,y_i)的个数((1leq q,x,yleq 100000))。
我们采用cdq分治的方法,将这些操作按照时间顺序分治。
假设我们要获取([l,r])的答案,而我们已经对([l,mid],[mid+1,r])进行了递归处理,这时我们需要处理出完整的答案。
就像归并排序的过程一样,左边的区间和右边的区间都自己处理好自己的答案了,可是整个区间的答案仍没有完全算出,这是因为没有考虑左边区间对右边区间的影响。
在本题中,“影响”就是([l,mid])中插入的点,会被统计到([mid+1,r])中去。
这时,发现(可以造成影响的)左侧只有修改,右侧只有询问,考虑将修改和询问都按照他们的(x_i)为第一关键字,(y_i)为第二关键字,修改优先,查询后置为第三关键字排序,放到树状数组里去处理。
因为不需要考虑时间的顺序了,所以这很容易就能做到。
时间复杂度统计:(T(1)=Theta(1),T(n)=2T(frac{n}{2})+Theta(n\,log\,y)=Theta(n\,log\,n\,log\,y))。
分析:使用cdq分治,我们将有时间顺序的操作转换成修改在前,询问在后的操作,相当于把问题简单化,“去时间化”了。
更深入地说,对于这样一个问题:初始时有一些三维点((x_i,y_i,z_i)),只需要查询满足(x_ileq x,y_ileq y,z_ileq z)的点(x_i,y_i,z_i)的个数。
这看似和上一题相比,多了一维,但是若我们将所有的点和查询按照(z_i,x_i,y_i,)修改-查询依次为关键字排序,再把(z)坐标扔掉,这不就把空间上的维度转化成时间轴上的顺序了吗?所以这题本质上和上一题相同,可以用同样的算法解决。
这题就是洛谷的P3810 三维偏序,我的代码如下:
1 #include<cstdio> 2 #include<algorithm> 3 struct ww{int x,y,z,w,I;}a[100001],tmp[100001]; 4 inline bool cmp1(ww p1,ww p2){return p1.x==p2.x?(p1.y==p2.y?p1.z<p2.z:p1.y<p2.y):p1.x<p2.x;} 5 int n,nn,k,bit[200001],ans[100001],Ans[100001]; 6 inline void Ins(int i,int x){for(;i<=k;bit[i]+=x,i+=i&-i);} 7 inline int Qur(int i){int sum=0;for(;i;sum+=bit[i],i-=i&-i);return sum;} 8 void cdq(int l,int r){ 9 if(l==r) return; 10 int mid=(l+r)>>1; 11 cdq(l,mid); cdq(mid+1,r); 12 for(int i=l,lf=l,rt=mid+1;lf<=mid||rt<=r;++i){ 13 if((lf<=mid&&rt>r)||(lf<=mid&&rt<=r&&a[lf].y<=a[rt].y)) Ins(a[lf].z,a[lf].w), tmp[i]=a[lf], ++lf; 14 else Ans[a[rt].I]+=Qur(a[rt].z), tmp[i]=a[rt], ++rt; 15 } 16 for(int i=l;i<=mid;++i) Ins(a[i].z,-a[i].w); 17 for(int i=l;i<=r;++i) a[i]=tmp[i]; 18 } 19 int main(){ 20 scanf("%d%d",&n,&k); 21 for(int i=1;i<=n;++i) scanf("%d%d%d",&a[i].x,&a[i].y,&a[i].z); 22 std::sort(a+1,a+n+1,cmp1); 23 for(int i=1;i<=n;++i) if(a[i].x!=a[i-1].x||a[i].y!=a[i-1].y||a[i].z!=a[i-1].z) a[++nn]=a[i], a[nn].w=1, a[nn].I=nn; else ++a[nn].w; 24 cdq(1,nn); 25 for(int i=1;i<=nn;++i) ans[Ans[a[i].I]+a[i].w-1]+=a[i].w; 26 for(int i=0;i<n;++i) printf("%d ",ans[i]); 27 return 0; 28 }
偏序其实就是两个元素的值都对应地大(小)(等)于的关系,有时间顺序的问题也可以通过记时间标记转化成偏序问题,上面的两道题就是偏序问题。
数据结构(树状数组,线段树,平衡树等)通常可以处理较低维的偏序问题,而cdq分治则是处理偏序问题的利器。
把偏序问题中的某一维排序变为时间轴,在这时间轴之上分治处理,在合并时,就巧妙地将修改和查询分离开来,成为两个不相交的部分,没有了时间顺序的困扰,解决自然变得容易。
若是更高维的偏序,转化后仍不能处理的,我们可以将转化后的(没有时间顺序的)操作序列再排序,分离出时间轴来,对之下的在进行一次cdq分治,即cdq套cdq。
这样做,思维难度、代码复杂度以及调试难度都有所提升,但cdq分治本质上熟练了就很好写了,应该要多多益善地练习相关题目。
运用cdq的注意事项:所有的修改和查询都必须是已知的,即cdq是离线算法,对于强制在线的题目,就要另寻他法了。
cdq分治的应用不止于此,还有许多问题,运用相似的思想——分治,也能获得简便的解决,在此就不一一列举了。
更多例题:P4093 [HEOI2016/TJOI2016]序列