• 浅析树链剖分


    前言


    树链剖分我觉得最精妙的地方就在于它是通过$dfs$序将树形结构转为线性结构便于处理,进而可以用数据结构(线段树、树状数组等)去进行修改和查询。

    将复杂的结构转化为相对我们熟悉简单的结构,这个思想对很多问题是通吃的,不仅仅在树形问题,算法中,在其他领域中也常常会用到这种思想

    我们先来回顾两个问题

    1.将树从$x$到$y$结点最短路径上所有节点的值都加上z

    我们很容易想到,树上差分可以以 $O(n+m)$的优秀复杂度解决这个问题

     2.求树从$x$到$y$结点最短路径上所有节点的值之和

    $lca$大水题,我们又很容易地想到, $dfs$ $O(n)$预处理每个节点的$dis$(即到根节点的最短路径长度)

    然后对于每个询问,求出$x,y$两点的$lca$,利用$lca$的性质$dis(x,y)=dis(x)+dis(y)-2*dis(lca)$求出结果,时间复杂度 $O(mlogn+n)$

    现在来思考一个$bug$:

    如果刚才的两个问题结合起来,成为一道题的两种操作呢?

    刚才的方法显然就不够优秀了(每次询问之前要跑$dfs$更新 $dis$ )

    理解


    树剖是通过轻重边剖分将树分割成多条链,然后利用数据结构来维护这些链(本质上是一种优化暴力)

    给定一棵有根树,对于每个非叶结点$u$,设$u$的子树中结点数最多的子树的树根为$v$,则标记$(u,v)$为重边,从$u$出发往下的其他边均为轻边

    如图所示(结点中的数字代表结点的$size$值,即以该结点为根的子树的结点数)

    根据上面的定义,只需一次$DFS$就能把一棵有根树分解成若干重路径(重边组成的路径)和若干轻边

    有些资料也把重路径称为树链,因此轻重路径剖分也称树链剖分。 (下面的定理结论可不看)

    路径剖分中最重要的定理如下:若$v$是$u$的子结点,$(u,v)$是轻边,则$size(v)<size(u)/2$,其中$size(u)$表示以$u$为根的子树中的结点总数(可以自己推导下)

    由此可以得到如下的重要结论:对于任意非根结点$u$,在$u$到根的路径上,轻边和重路径的条数均不超过$log_{2}n$,因为每碰到一条轻边,$size$值就会减半。(对于概念,我还是觉得刘汝佳讲的最准确和便于理解)

    因此重链剖分可以将树上的任意一条路径划分成不超过$O(logn)$条连续的链,每条链上的点深度互不相同(即是自底向上的一条链,链上所有点的 $LCA$ 为链的一个端点)。

    重链剖分还能保证划分出的每条链上的节点 $DFS$ 序连续,因此可以方便地用一些维护序列的数据结构(如线段树)来维护树上路径的信息,如:

    1.修改 树上两点之间的路径上 所有点的值
    2.查询 树上两点之间的路径上 节点权值的 和/极值/其它(在序列上可以用数据结构维护,便于合并的信息)
    除了配合数据结构来维护树上路径信息,树剖还可以用来$O(logn)$  (且常数较小)地求 $LCA$。
    在某些题目中,还可以利用其性质来灵活地运用树剖

    实现


    我们先给出一些定义:

    $f(x)$表示节点$x$在树上的父亲。
    $dep(x)$表示节点$x$在树上的深度。
    $size(x)$表示节点$x$的子树的节点个数。
    $son(x)$表示节点$x$的 重儿子 。
    $top(x)$表示节点$x$所在 重链 的顶部节点(深度最小)。
    $id(x)$表示节点$x$的 $dfs$ 序 ,也是其在线段树中的编号。
    $rk(x)$表示 $dfs$ 序所对应的节点编号,有$rk(dfs(x))=x$

    首先第一遍$dfs$,对于每个节点,我们主要是求出它所在子树的大小并标记重儿子

    void dfs1(int u, int fa){
        size[u] = 1; //这个点本身size=1
        for(int i = head[u]; i; i = e[i].next){
            int v = e[i].to;
            if(v==fa) continue;
            dep[v] = dep[u] + 1, f[v] = u;
            dfs1(v, u), size[u] += size[v]; //子节点的size已被处理,用它来更新父节点的size
            if(size[v]>size[son[u]]) son[u] = v; //选取size最大的作为重儿子
        }
    } 

     处理后如下图:

     第二遍 dfs,然后连接重链,同时标记每一个节点的 dfs序,并且为了用数据结构来维护重链,我们在 dfs时保证一条重链上各个节点 dfs序连续

    void dfs2(int u, int t){ //当前节点、重链顶端
        top[u] = t, id[u] = ++cnt;  //标记dfs序
        rk[cnt] = u; //序号cnt对应节点u
        if(son[u]) dfs2(son[u], t); //我们选择优先进入重儿子来保证一条重链上各个节点dfs序连续
        for(int i = head[u]; i; i = e[i].next){
            int v = e[i].to;
            if(v==son[u]||v==f[u]) continue;
            dfs2(v, v); //一个点位于轻链底端,那么它的top必然是它本身
        }
    }

     可以结合下图理解一下:

    通过 $dfs$我们已经保证一条重链上各个节点$dfs$序连续,剖分完以后,每一条重链相当于一个区间,我们维护处理完的数据结构即可

     常见应用


     路径上维护

    那么我们每次对$u,v$两个点进行询问

    若两点在同一条链上,则直接在线段树上进行询问;若不在一条链上,则每次选择深度较大的链往上跳,直到两点在同一条链上

    子树维护 

    有时会要求维护子树上的信息,譬如将以$x$为根的子树的所有结点的权值增加$v$

    由于在$dfs$搜索时,子树的编号是连续的,根节点的编号到加上子树大小-1的区间即为子树区间,我们处理这段区间即可

    求最近公共祖先

    假设两点在同一条重链上,显然它们中深度较小的点即为它们的最近公共祖先

    由这个我们得到种做法,即不断向上跳重链,当跳到同一条重链上时,深度较小的结点即为 $LCA$

    向上跳重链时需要先跳所在重链顶端深度较大的那个

    代码如下:

    int lca(int u,int v){ 
        while(top[u]!=top[v]){
            if(dep[top[u]]<dep[top[v]]) swap(u,v);
            u = fa[top[u]];
        }
        return dep[u]<dep[v] ? u : v;
    }

    例题


     待补~


    参考自:
    https://www.xuebuyuan.com/552070.html 

     

  • 相关阅读:
    超简单实例使用websocket进行server和client实时通信
    antd的table行key自增长
    selenium元素定位Xpath,Contains,CssSelector
    slenium使用鼠标+键盘事件或者双击实现代码
    使用python+pychram进行API测试(接口测试)初级STEP 1
    linux命令小常识
    sql中limit使用方法
    Swagger-API测试工具实战
    写 test-case心得
    测试之路之[前奏]
  • 原文地址:https://www.cnblogs.com/wizarderror/p/12192803.html
Copyright © 2020-2023  润新知