• 深度优先和广度优先搜索


    一、二叉树深度优先(DFS)和广度优先(BFS)搜索算法

    树的相关概念参见 红黑树详解

    (1)深度优先搜索算法(Depth First Search),是搜索算法的一种。是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。当节点v的所有边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访问为止。


    如下图所示的二叉树:



    A 是第一个访问的,然后顺序是 B、D,然后是 E。接着再是 C、F、G。那么,怎么样才能来保证这个访问的顺序呢?分析一下,在遍历了根结点后,就开始遍历左子树,最后才是右子树。因此可以借助堆栈的数据结构,由于堆栈是后进先出的顺序,由此可以先将右子树压栈,然后再对左子树压栈,这样一来,左子树结点就存在了栈顶上,因此某结点的左子树能在它的右子树遍历之前被遍历。

    深度优先遍历代码片段:

    //深度优先遍历:非递归,使用栈模拟
    void depthFirstSearch(Tree root){
        stack<Node *> nodeStack;  //使用C++的STL标准模板库
        nodeStack.push(root);
        Node *node;
        while(!nodeStack.empty()){
            node = nodeStack.top();
            printf(format, node->data);  //遍历根结点
            nodeStack.pop();
            if(node->rchild){
                nodeStack.push(node->rchild);  //先将右子树压栈
            }
            if(node->lchild){
                nodeStack.push(node->lchild);  //再将左子树压栈
            }
        }
    }
    
    //深度优先遍历:递归,中序遍历
    void MidOrder(TreeNode node)         
    {            
        if (node != null)            
        {                
            MidOrder(node->lchild);                
            printf(format, node->data);  //遍历根结点             
            MidOrder(node->lchild);            
        }            
        else            
        {                
            //done            
        }        
    }

    (2)广度优先搜索算法(Breadth First Search),又叫宽度优先搜索,或横向优先搜索。是从根节点开始,沿着树的宽度遍历树的节点。如果所有节点均被访问,则算法中止。

    如下图所示的二叉树:

    A 是第一个访问的,然后顺序是 B、C,然后再是 D、E、F、G。那么,怎样才能来保证这个访问的顺序呢?借助队列数据结构,由于队列是先进先出的顺序,因此可以先将左子树入队,然后再将右子树入队。这样一来,左子树结点就存在队头,可以先被访问到。

    广度优先遍历代码片段:

    //广度优先遍历:使用队列模拟
    void breadthFirstSearch(Tree root){
        queue<Node *> nodeQueue;  //使用C++的STL标准模板库
        nodeQueue.push(root);
        Node *node;
        while(!nodeQueue.empty()){
            node = nodeQueue.front();
            nodeQueue.pop();
            printf(format, node->data);
            if(node->lchild){
                nodeQueue.push(node->lchild);  //先将左子树入队
            }
            if(node->rchild){
                nodeQueue.push(node->rchild);  //再将右子树入队
            }
        }
    }

    二、图的深度优先(DFS)和广度优先(BFS)搜索算法

    在介绍图的搜索之前,有必要先了解计算机中图的存储方式。图的存储表示方法很多,这里介绍两种最常用的方法。至于具体选择哪一种表示法,主要取决于具体的应用和欲施加的操作。为了适合用C语言描述,以下假定顶点序号从0开始,即图G的顶点集的一般形式是V(G)={v0,vi,…,Vn-1}。
    (1)图的邻接矩阵表示法
    1.图的邻接矩阵表示法
         

    在图的邻接矩阵表示法中:  

      ① 用邻接矩阵表示顶点间的相邻关系  

      ② 用一个顺序表来存储顶点信息

    2.图的邻接矩阵(Adacency Matrix)      

    设G=(V,E)是具有n个顶点的图,则G的邻接矩阵是具有如下性质的n阶方阵:   

       
    【例】下图中无向图G5和有向图G6的邻接矩阵分别为Al和A2

       

    3.网络的邻接矩阵      

    若G是网络,则邻接矩阵可定义为:    

            
    其中:      

      wij表示边上的权值;      

      ∞表示一个计算机允许的、大于所有边上权值的数。

    【例】下面带权图的两种邻接矩阵分别为A3和A4


           
    4.图的邻接矩阵存储结构形式说明   

    #define MaxVertexNum l00 //最大顶点数,应由用户定义
      typedef char VertexType; //顶点类型应由用户定义
      typedef int EdgeType; //边上的权值类型应由用户定义
      typedef struct{
          VextexType vexs[MaxVertexNum] //顶点表
          EdeType edges[MaxVertexNum][MaxVertexNum];
                        //邻接矩阵,可看作边表
          int n,e; //图中当前的顶点数和边数
       }MGragh;

    注意:     

      ① 在简单应用中,可直接用二维数组作为图的邻接矩阵(顶点表及顶点数等均可省略)。      

      ② 当邻接矩阵中的元素仅表示相应的边是否存在时,EdgeTyPe可定义为值为0和1的枚举类型。      

      ③ 无向图的邻接矩阵是对称矩阵,对规模特大的邻接矩阵可压缩存储。      

      ④ 邻接矩阵表示法的空间复杂度S(n)=0(n2)。

    5.建立无向网络的算法。 

    void CreateMGraph(MGraph *G)
        {//建立无向网的邻接矩阵表示
          int i,j,k,w;
          scanf("%d%d",&G->n,&G->e); //输入顶点数和边数
          for(i=0;i<G->n;i++) //读人顶点信息,建立顶点表
            G->vexs[i]=getchar();
          for(i=0;i<G->n;i++)
            for(j=0;j<G->n;j++) 
              G->edges[i][j]=0//邻接矩阵初始化
          for(k=0;k<G->e;k++){//读入e条边,建立邻接矩阵
            scanf("%d%d%d",&i,&j,&w);//输入边(vi,vj)上的权w
            G->edges[i][j]=w;
            G->edges[j][i]=w;
           }
        }//CreateMGraph

    该算法的执行时间是0(n+n2+e)。由于e<n2,算法的时间复杂度是0(n2)。

    (2)图的邻接表表示法 
      图的邻接表表示法类似于树的孩子链表表示法。对于图G中的每个顶点vi,该方法把所有邻接于vi的顶点vj链成一个带头结点的单链表,这个单链表就称为顶点vi的邻接表(Adjacency
    List)。
    1. 邻接表的结点结构
    (1)表结点结构

    邻接表中每个表结点均有两个域:
      ① 邻接点域adjvex:存放与vi相邻接的顶点vj的序号j。
      ② 链域next:将邻接表的所有表结点链在一起。
    注意:若要表示边上的信息(如权值),则在表结点中还应增加一个数据域。

    (2)头结点结构

    顶点vi邻接表的头结点包含两个域:
      ① 顶点域vertex:存放顶点vi的信息
      ② 指针域firstedge:vi的邻接表的头指针。

    注意:
       ① 为了便于随机访问任一顶点的邻接表,将所有头结点顺序存储在一个向量中就构成了图的邻接表表示。
         ② 有时希望增加对图的顶点数及边数等属性的描述,可将邻接表和这些属性放在一起来描述图的存储结构。
    2.无向图的邻接表

      对于无向图,vi的邻接表中每个表结点都对应于与vi相关联的一条边。因此,将邻接表的表头向量称为顶点表。将无向图的邻接表称为边表。
    【例】对于无向图G5,其邻接表表示如下面所示,其中顶点v0的边表上三个表结点中的顶点序号分别为1、2和3,它们分别表示关联于v0的三条边(v0,v1),(v0,v2)和(v0,v3)。

    注意:n个顶点e条边的无向图的邻接表表示中有n个顶点表结点和2e个边表结点。
    3.有向图的邻接表
      对于有向图,vi的邻接表中每个表结点都对应于以vi为始点射出的一条边。因此,将有向图的邻接表称为出边表。
    【例】有向图G6的邻接表表示如下面(a)图所示,其中顶点v1的邻接表上两个表结点中的顶点序号分别为0和4,它们分别表示从v1射出的两条边(简称为v1的出边):<v1,v0>和<v1,v4>。

     注意:n个顶点e条边的有向图,它的邻接表表示中有n个顶点表结点和e个边表结点。
    4.有向图的逆邻接表
    在有向图中,为图中每个顶点vi建立一个入边表的方法称逆邻接表表示法。
    入边表中的每个表结点均对应一条以vi为终点(即射入vi)的边。
    【例】G6的逆邻表如上面(b)图所示,其中v0的人边表上两个表结点1和3分别表示射人v0的两条边(简称为v0的入边):<v1,v0>和<v3,v0>。
    注意:n个顶点e条边的有向图,它的接表表示中有n个顶点表结点和e个边表结点。

    5.邻接表的形式说明及其建表算法
    (1)邻接表的形式说明

    typedef struct node{//边表结点
           int adjvex; //邻接点域
           struct node *next; //链域
         //若要表示边上的权,则应增加一个数据域
       }EdgeNode;
         typedef struct vnode{ //顶点表结点
           VertexType vertex; //顶点域
           EdgeNode *firstedge;//边表头指针
        }VertexNode;
         typedef VertexNode AdjList[MaxVertexNum];//AdjList是邻接表类型
          typedef struct{
           AdjList adjlist;//邻接表
           int n,e; // 图中当前顶点数和边数 
       }ALGraph; //对于简单的应用,无须定义此类型,可直接使用AdjList类型。

    (2)建立无向图的邻接表算法

    void CreateALGraPh(ALGrahp *G)
        {//建立无向图的邻接表表示
          int i,j,k;
          EdgeNode *s;
          scanf("%d%d",&G->n,&G->e); //读人顶点数和边数
          for(i=0;i<G->n;i++){//建立顶点表
            G->adjlist[i].vertex=getchar(); //读入顶点信息
            G->adjlist[i].firstedge=NULL;//边表置为空表
           }
          for(k=0;k<G->e;k++){//建立边表
             scanf("%d%d",&i,&j);// 读入边(vi,vj)的顶点对序号
             s=(EdgeNode *)malloc(sizeof(EdgeNode)); //生成边表结点
             s->adjvex=j; //邻接点序号为j
             s->next=G->adjlist[i].firstedge;
             G->adjlist[i].firstedge=s; //将新结点*s插入顶点vi的边表头部
             s=(EdgeNode *)malloc(sizeof(EdgeNode));
             s->adjvex=i; //邻接点序号为i
             s->next=G->adjlist[j].firstedge;
             G->adjlistk[j].firstedge=s; //将新结点*s插入顶点vj的边表头部
            }//end for 
       }CreateALGraph

    该算法的时间复杂度是O(n+e)。
    注意:

      ①建立有向图的邻接表更简单,每当读人一个顶点对序号<i,j>时,仅需生成一个邻接序号为j的边表结点,将其插入到vj的出边表头部即可。
      ② 建立网络的邻接表时,需在边表的每个结点中增加一个存储边上权的数据域。

    (3)图的遍历

    1、图的遍历
      和树的遍历类似,图的遍历也是从某个顶点出发,沿着某条搜索路径对图中每个顶点各做一次且仅做一次访问。它是许多图的算法的基础。深度优先遍历和广度优先遍历是最为重要的两种遍历图的方法。它们对无向图和有向图均适用。

    注意:
      以下假定遍历过程中访问顶点的操作是简单地输出顶点。

    2、布尔向量visited[0..n-1]的设置
      图中任一顶点都可能和其它顶点相邻接。在访问了某顶点之后,又可能顺着某条回路又回到了该顶点。为了避免重复访问同一个顶点,必须记住每个已访问的顶点。为此,可设一布尔向量visited[0..n-1],其初值为假,一旦访问了顶点Vi之后,便将visited[i]置为真。

    深度优先遍历(Depth-First Traversal)

    1.图的深度优先遍历的递归定义

    假设给定图G的初态是所有顶点均未曾访问过。在G中任选一顶点v为初始出发点(源点),则深度优先遍历可定义如下:首先访问出发点v,并将其标记为已访问过;然后依次从v出发搜索v的每个邻接点w。若w未曾访问过,则以w为新的出发点继续进行深度优先遍历,直至图中所有和源点v有路径相通的顶点(亦称为从源点可达的顶点)均已被访问为止。若此时图中仍有未访问的顶点,则另选一个尚未访问的顶点作为新的源点重复上述过程,直至图中所有顶点均已被访问为止。
         图的深度优先遍历类似于树的前序遍历。采用的搜索方法的特点是尽可能先对纵深方向进行搜索。这种搜索方法称为深度优先搜索(Depth-First Search)。相应地,用此方法遍历图就很自然地称之为图的深度优先遍历。

    2、深度优先搜索的过程
         设x是当前被访问顶点,在对x做过访问标记后,选择一条从x出发的未检测过的边(x,y)。若发现顶点y已访问过,则重新选择另一条从x出发的未检测过的边,否则沿边(x,y)到达未曾访问过的y,对y访问并将其标记为已访问过;然后从y开始搜索,直到搜索完从y出发的所有路径,即访问完所有从y出发可达的顶点之后,才回溯到顶点x,并且再选择一条从x出发的未检测过的边。上述过程直至从x出发的所有边都已检测过为止。此时,若x不是源点,则回溯到在x之前被访问过的顶点;否则图中所有和源点有路径相通的顶点(即从源点可达的所有顶点)都已被访问过,若图G是连通图,则遍历过程结束,否则继续选择一个尚未被访问的顶点作为新源点,进行新的搜索过程。

    3、深度优先遍历的递归算法

    //(1)深度优先遍历算法
      typedef enum{FALSE,TRUE}Boolean;//FALSE为0,TRUE为1
      Boolean visited[MaxVertexNum]; //访问标志向量是全局量
      void DFSTraverse(ALGraph *G)
      { //深度优先遍历以邻接表表示的图G,而以邻接矩阵表示G时,算法完全与此相同
        int i;
        for(i=0;i<G->n;i++)
          visited[i]=FALSE; //标志向量初始化
        for(i=0;i<G->n;i++)
          if(!visited[i]) //vi未访问过
            DFS(G,i); //以vi为源点开始DFS搜索
       }//DFSTraverse
    
    //(2)邻接表表示的深度优先搜索算法
      void DFS(ALGraph *G,int i){ 
        //以vi为出发点对邻接表表示的图G进行深度优先搜索
        EdgeNode *p;
        printf("visit vertex:%c",G->adjlist[i].vertex);//访问顶点vi
        visited[i]=TRUE; //标记vi已访问
        p=G->adjlist[i].firstedge; //取vi边表的头指针
        while(p){//依次搜索vi的邻接点vj,这里j=p->adjvex
          if (!visited[p->adjvex])//若vi尚未被访问
            DFS(G,p->adjvex);//则以Vj为出发点向纵深搜索
          p=p->next; //找vi的下一邻接点
         }
       }//DFS
    
    //(3)邻接矩阵表示的深度优先搜索算法
      void DFSM(MGraph *G,int i)
      { //以vi为出发点对邻接矩阵表示的图G进行DFS搜索,设邻接矩阵是0,l矩阵
        int j;
        printf("visit vertex:%c",G->vexs[i]);//访问顶点vi
        visited[i]=TRUE;
        for(j=0;j<G->n;j++) //依次搜索vi的邻接点
          if(G->edges[i][j]==1&&!visited[j])
            DFSM(G,j)//(vi,vj)∈E,且vj未访问过,故vj为新出发点
       }//DFSM

    4、算法分析 
      对于具有n个顶点和e条边的无向图或有向图,遍历算法DFSTraverse对图中每顶点至多调用一次DFS或DFSM。从DFSTraverse中调用DFS(或DFSM)及DFS(或DFSM)内部递归调用自己的总次数为n。
      当访问某顶点vi时,DFS(或DFSM)的时间主要耗费在从该顶点出发搜索它的所有邻接点上。用邻接矩阵表示图时,其搜索时间为O(n);用邻接表表示图时,需搜索第i个边表上的所有结点。因此,对所有n个顶点访问,在邻接矩阵上共需检查n2个矩阵元素,在邻接表上需将边表中所有O(e)个结点检查一遍。
    所以,DFSTraverse的时间复杂度为O(n2) (调用DFSM)或0(n+e)(调用DFS)。

    5、深度优先遍历的非递归算法

    // 图的深度优先遍历:非递归,邻接矩阵存储
    void DFSTraverse_NonRecursion(ALGraph *G)  
    {  
        int i, j, k;  
        stack st;  
       EdgeNode *p;
    for(i=0; i<G->n; i++) visited[i]=FALSE; for(i=0; i<G->n; i++) // 遍历所有点,处理包括非连通图情况 if(!visited[i]) { visited[i]=TRUE; printf("visit vertex:%c",G->vexs[i]);//访问顶点vi push_stack(st, i); k = i;
           
    while (!empty_stack(st)) {
              p = st.top();
              k = p->adjvex;
              st.pop();
    for(j=0;j<G->n;j++) { if(G->edges[k][j]==1 && !visited[j]) { visited[j]=TRUE; printf("visit vertex:%c",G->vexs[j]);//访问顶点vi st.push(j); k = j; } } } } }

    广度优先遍历(Breadth-FirstTraversal)

    1、广度优先遍历的递归定义      

    设图G的初态是所有顶点均未访问过。在G中任选一顶点v为源点,则广度优先遍历可以定义为:首先访问出发点v,接着依次访问v的所有邻接点w1,w2,…,wt,然后再依次访问与wl,w2,…,wt邻接的所有未曾访问过的顶点。依此类推,直至图中所有和源点v有路径相通的顶点都已访问到为止。此时从v开始的搜索过程结束。      

    若G是连通图,则遍历完成;否则,在图C中另选一个尚未访问的顶点作为新源点继续上述的搜索过程,直至G中所有顶点均已被访问为止。      

    广度优先遍历类似于树的按层次遍历。采用的搜索方法的特点是尽可能先对横向进行搜索,故称其为广度优先搜索(Breadth-FirstSearch)。相应的遍历也就自然地称为广度优先遍历。

    2、广度优先搜索过程     

    在广度优先搜索过程中,设x和y是两个相继要被访问的未访问过的顶点。它们的邻接点分别记为x1,x2,…,xs和y1,y2,…,yt。      

    为确保先访问的顶点其邻接点亦先被访问,在搜索过程中使用FIFO队列来保存已访问过的顶点。当访问x和y时,这两个顶点相继入队。此后,当x和y相继出队时,我们分别从x和y出发搜索其邻接点x1,x2,…,xs和y1,y2,…,yt,对其中未访者进行访问并将其人队。这种方法是将每个已访问的顶点人队,故保证了每个顶点至多只有一次人队。

    3、广度优先搜索算法

    //(1)邻接表表示图的广度优先搜索算法
      void BFS(ALGraph*G,int k)
      {// 以vk为源点对用邻接表表示的图G进行广度优先搜索
        int i;
        CirQueue Q; //须将队列定义中DataType改为int
        EdgeNode *p;
        InitQueue(&Q);//队列初始化
         //访问源点vk
         printf("visit vertex:%e",G->adjlist[k].vertex);
        visited[k]=TRUE; 
        EnQueue(&Q,k);//vk已访问,将其人队。(实际上是将其序号人队)
        while(!QueueEmpty(&Q)){//队非空则执行
            i=DeQueue(&Q); //相当于vi出队
            p=G->adjlist[i].firstedge; //取vi的边表头指针
            while(p){//依次搜索vi的邻接点vj(令p->adjvex=j)
                if(!visited[p->adivex]){ //若vj未访问过
                  printf("visitvertex:%c",C->adjlistlp->adjvex].vertex); //访问vj
                  visited[p->adjvex]=TRUE; 
                  EnQueue(&Q,p->adjvex);//访问过的vj人队
                 }//endif
                p=p->next;//找vi的下一邻接点
             }//endwhile
          }//endwhile
       }//end of BFS 
    
    
    //(2)邻接矩阵表示的图的广度优先搜索算法
      void BFSM(MGraph *G,int k)
      {// 以vk为源点对用邻接矩阵表示的图G进行广度优先搜索
       int i,j;
       CirQueue Q;
      InitQueue(&Q);
       printf("visit vertex:%c",G->vexs[k]); //访问源点vk
       visited[k]=TRUE;
       EnQueue(&Q,k);
       while(!QueueEmpty(&Q)){
          i=DeQueue(&Q); //vi出队
          for(j=0;j<G->n;j++)//依次搜索vi的邻接点vj
              if(G->edges[i][j]==1&&!visited[j]){//vi未访问
                  printf("visit vertex:%c",G->vexs[j]);//访问vi
                  visited[j]=TRUE;
                  EnQueue(&Q,j);//访问过的vi人队
                     }
         }//endwhile
      }//BFSM

    4、算法分析
     对于具有n个顶点和e条边的无向图或有向图,每个顶点均入队一次。广度优先遍历(BFSTraverse)图的时间复杂度和DFSTraverse算法相同。
     当图是连通图时,BFSTraverse算法只需调用一次BFS或BFSM即可完成遍历操作,此时BFS和BFSM的时间复杂度分别为O(n+e)和0(n2)。

     【参考】http://sjjp.tjuci.edu.cn/sjjg/DataStructure/DS/web/tu/tu7.1.1.htm

  • 相关阅读:
    摄像机标定公式推导
    roscpp源码阅读
    机器学习(Machine Learning)&深度学习(Deep Learning)资料汇总 (上)
    机器学习(Machine Learning)&深度学习(Deep Learning)资料(下)
    【概率论与数理统计】全概率公式和贝叶斯公式
    机器学习之一些基本概念及符号系统
    机器学习之代价函数(cost function)
    机器学习之逻辑回归(Logistic Regression)
    机器学习之神经网络模型-下(Neural Networks: Representation)
    机器学习之神经网络模型-上(Neural Networks: Representation)
  • 原文地址:https://www.cnblogs.com/yyxt/p/4244387.html
Copyright © 2020-2023  润新知