• 图的遍历


    图的遍历

    《算法设计手册》面试题解答 第五章:图的遍历 附:DFS应用之找挂接点

    第五章面试题解答

    5-31.

      DFS和BFS使用了哪些数据结构?

    解析:

      其实刚读完这一章,我一开始想到的是用邻接表来表示图,但其实用邻接矩阵也能实现啊?后来才发现应该回答,BFS用队列实现;DFS可以用栈实现也可以改写成递归形式。用栈来消除递归改写DFS也出现在《算法导论》的练习题22.3-6。

     

    5-32.

      写一个函数,在遍历二叉查找数的时候,输出第i个结点。

    解析:

      模仿DFS遍历时维护一个进入时间数组和完成时间数组的特点,维护一个全局变量n,在中序遍历的时候,每遍历一个结点就n++,直到n=i时打印这个结点,或者遍历完成时仍然n!=i时报错即可。

     

    题外话:

      第5章“图遍历”的Interview Problems部分确实只有这两题,而第6章“带权图算法”干脆就没Interview Problems这一部分。其实图本身的表示就比较复杂,几个基本的图算法虽然思路不难,但是代码量不小,同时要写繁琐的初始化方法,写具体算法实现时还要用到各种辅助数据结构,编码起来想少都不行。况且就算真写出来了,正确性的证明又很费功夫(比如拓扑排序、强联通分支),因此面试时除了专门做这个方向的,很少会考到具体的代码书写,更不用说其他变形、改进了。这也就是为什么图相关的面试题并不多的原因。

      另外提一下,《算法设计手册》上的拓扑排序和强联通分支算法是基于边分类的,而且它把DFS写成了一个可扩充的框架;而《算法导论》则是利用最后完成时间来实现这两个算法,在此之前把DFS写成了一个子程序供这两个算法调用。究竟孰优孰劣我不评价,从先入为主和对我而言易于理解的角度和来说,我更倾向于使用后者。

     

    DFS应用之找挂接点(Articulation Vertices,《算法导论》中文版的翻译) 

      既然提到了《算法设计手册》上DFS的框架写法了,这个算法正好来进行演示。(《算法导论》思考题22-2曾提到了这个概念)。

      先来看看《算法设计手册》版DFS框架:

     《算法设计手册》版DFS框架

    //图用邻接表实现
    //entry_time[] 某结点开始处理的时间
    //exit_time[] 某结点处理完毕的时间
    //discoverd[] 某个结点是否已被发现
    //process_vertex_early() 某个结点刚发现时采取的处理
    //process_edge() 对边的处理
    //process_vertex_late() 某个结点所有邻接边处理完后的动作
    //以上三个函数决定了DFS的行为,如果只需要基本的功能,可以实现为空操作,或者输出该结点/边用于追踪遍历过程

    dfs(graph *g, int v)
    {
    edgenode *p; /* temporary pointer */
    int y; /* successor vertex */
    if (finished) return; /* allow for search termination */

    discovered[v] = TRUE;
    time = time + 1;
    entry_time[v] = time;
    process_vertex_early(v);
    p = g->edges[v];
    while (p != NULL) {
    y= p->y;
    if (discovered[y] == FALSE) {
    parent[y] = v;
    process_edge(v,y);
    dfs(g,y);
    }
    else if ((!processed[y]) || (g->directed))
    process_edge(v,y);
    if (finished) return;
    p = p->next;
    }
    process_vertex_late(v);
    time = time + 1;
    exit_time[v] = time;
    processed[v] = TRUE;
    }

    《算法设计手册》版DFS框架

      挂接点是指,如果我们从连通图中删除这个结点,会导致图不再连通。下图中的白点就是挂接点,可以把它看作为图上最脆弱的点。

      使用DFS或BFS写一个暴力算法很简单:删除一个结点,用DFS或BFS判断是否连通;恢复原图,删除下一个结点继续判断,直至所有接点都判断过。如果结点数n个,边数m个,暴力算法时间复杂度为O(n(m+n))。

      现在用DFS遍历时生成树的角度来看。对于这棵树上所有在原图的边,归为TREE边;其余所有边是BACK边,即它们指向一个先于这个结点遍历的另一个结点。

      可以发现一些规律:

    DFS树的叶结点不可能是挂接点,删去它树的连通性未被破坏。只有树的内结点可能是挂接点。

    对于DFS树的根,如果它只有一个孩子,那么删去它和删去一个叶结点是一样的。而孩子多于1个时,删去根会导致孩子们不再连通,也即它是挂接点。 

    对于一个BACK边,它连接的两个结点的TREE路径(即DFS时形成的路径)上的所有结点都不可能是挂接点。

      寻找挂接点需要维护BACK边连接DFS树上结点与其祖先的信息。用reachable_ancesor[v]表示结点v用BACK边能连接的最老祖先(初始化为v),tree_out_degree[v]表示结点在DFS树的出度。edge_classification(int x,int y)用于判断(x,y)是TREE还是BACK。

    复制代码
    int reachable_ancestor[MAXV+1]; /* earliest reachable ancestor of v */
    int tree_out_degree[MAXV+1]; /* DFS tree outdegree of v */
    process_vertex_early(int v)
    {
        reachable_ancestor[v] = v;
    }
    
    process_edge(int x, int y)
    {
        int class; /* edge class */
        class = edge_classification(x,y);
        if (class == TREE)
            tree_out_degree[x] = tree_out_degree[x] + 1;
        if ((class == BACK) && (parent[x] != y)) {
            if (entry_time[y] < entry_time[ reachable_ancestor[x] ] )
                reachable_ancestor[x] = y;
        }
    }

    int edge_classification(int x, int y)
    {
        if (parent[y] == x) 
            return TREE;
        else
            return BACK;
    }
    复制代码

      下面是v与祖先的连通性和v是否是挂接点的关系,一共是三种情况:

      用代码实现在process_vertex_late()里,即:

    复制代码
    process_vertex_late(int v)
    {
        bool root; /* is the vertex the root of the DFS tree? */
        int time_v; /* earliest reachable time for v */
        int time_parent; /* earliest reachable time for parent[v] */
        if (parent[v] < 1) { /* test if v is the root */
            if (tree_out_degree[v] > 1)
                printf("root articulation vertex: %d 
    ",v);
            return;
        }
    
        root = (parent[parent[v]] < 1); /* is parent[v] the root? */
        if ((reachable_ancestor[v] == parent[v]) && (!root))
            printf("parent articulation vertex: %d 
    ",parent[v]);
    
        if (reachable_ancestor[v] == v) {
            printf("bridge articulation vertex: %d 
    ",parent[v]);
            if (tree_out_degree[v] > 0) /* test if v is not a leaf */
                printf("bridge articulation vertex: %d 
    ",v);
        }
    
        time_v = entry_time[reachable_ancestor[v]];
        time_parent = entry_time[ reachable_ancestor[parent[v]] ];
        if (time_v < time_parent)
            reachable_ancestor[parent[v]] = reachable_ancestor[v];
    }
    复制代码

       最后几行用entry_time[v]表示v的年龄,time_v是v通过BACK边达到的最老结点。如果v的parent能通过v的BACK到达v的最老祖先,那么parent(v)肯定不是挂接点,下次处理parent(v)时做出这样的标记让它能通过v的BACK到达v的最老祖先。

     


    作者:五岳 
    出处:http://www.cnblogs.com/wuyuegb2312 
    对于标题未标注为“转载”的文章均为原创,其版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

     
     
    标签: 算法面试DFS挂接点
  • 相关阅读:
    node之时间
    node之querystring
    学图像处理应该学Matlab还是C++
    柯西—施瓦茨不等式
    矿区 GPS 变形监测及其伪卫星增强技术 GPS and its Pseudolite Augmented Technique for Deformation Monitoring in the Mining Area
    伪卫星
    The Principles of Selection. The Cartographic Journal, 3, 10-16. http://dx.doi.org/10.1179/caj.1966.3.1.10 Topfer, F. and Pillewizer, W. (1966)
    基于采样的网络地图的多尺度曲线绘制表达
    Coursera上Python课程(公开课)汇总
    三江源区高寒草地地上生物量遥感反演模型研究 Modeling Aboveground Biomass of Alpine Grassland in the Three-River Headwaters Region Based on Remote Sensing Data
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/3287587.html
Copyright © 2020-2023  润新知