• 最短路径算法总结


    定义

    (还记得这些定义吗?如果对 图的概念 存储 不了解请点击链接)

    • 路径
    • 最短路
    • 有向图中的最短路、无向图中的最短路
    • 单源最短路、每对结点之间的最短路

    性质

    对于边权为正的图,任意两个结点之间的最短路,不会经过重复的结点。

    对于边权为正的图,任意两个结点之间的最短路,不会经过重复的边。

    对于边权为正的图,任意两个结点之间的最短路,任意一条的结点数不会超过 (n) ,边数不会超过 (n-1)

    Floyd 算法

    是用来求任意两个结点之间的最短路的。

    复杂度比较高,但是常数小,容易实现。(我会说只有三个 for 吗?)

    适用于任何图,不管有向无向,边权正负,但是最短路必须存在。(不能有个负环)

    实现

    我们定义一个数组 f[k][x][y] ,表示只允许经过结点 (1)(k) ,结点 (x) 到结点 (y) 的最短路长度。

    很显然, f[n][x][y] 就是结点 (x) 到结点 (y) 的最短路长度。

    我们来考虑怎么求这个数组

    f[0][x][y] :边权,或者 (0) ,或者 (+infty)f[0][x][x] 什么时候应该是 (+infty) ?)

    f[k][x][y] = min(f[k-1][x][y], f[k-1][x][k]+f[k-1][k][y])

    上面两行都显然是对的,然而这个做法空间是 (O(N^3))

    但我们发现数组的第一维是没有用的,于是可以直接改成 f[x][y] = min(f[x][y], f[x][k]+f[k][y])

    for (int k = 1; k <= n; ++k)
    for (int i = 1; i <= n; ++i)
    for (int j = 1; j <= n; ++j)
        f[i][j] = min(f[i][j], f[i][k] + f[k][j]);
    

    时间复杂度是 (O(N^3)) ,空间复杂度是 (O(N^2))

    应用

    "给一个正权无向图,找一个最小权值和的环。"
    首先这一定是一个简单环。

    想一想这个环是怎么构成的。

    考虑环上编号最大的结点 u。

    f[u-1][x][y] 和 (u,x), (u,y)共同构成了环。

    在 Floyd 的过程中枚举 u,计算这个和的最小值即可。

    (O(n^3))

    "已知一个有向图中任意两点之间是否有连边,要求判断任意两点是否连通。"
    该问题即是求 图的传递闭包

    我们只需要按照 Floyd 的过程,逐个加入点判断一下。

    只是此时的边的边权变为 (1/0) ,而取 (min) 变成了 运算。

    再进一步用 bitset 优化,复杂度可以到 (O(frac{n^3}{w}))

    // std::bitset<SIZE> f[SIZE];
    for (k = 1; k <= n; k++)
    for (i = 1; i <= n; i++)
     if (f[i][k]) f[i] = f[i] & f[k];
    

    Bellman-Ford 算法

    一种基于松弛(relax)操作的最短路算法。

    支持负权。

    能找到某个结点出发到所有结点的最短路,或者报告某些最短路不存在。

    在国内 OI 界,你可能听说过的“SPFA”,就是 Bellman-Ford 算法的一种实现。(优化)

    实现

    假设结点为 (S)

    先定义 (dist(u))(S)(u) (当前)的最短路径长度。

    (relax(u,v)) 操作指: (dist(v) = min(dist(v), dist(u) + edge\_len(u, v))) .

    (relax) 是从哪里来的呢?

    三角形不等式: (dist(v) leq dist(u) + edge\_len(u, v))

    证明:反证法,如果不满足,那么可以用松弛操作来更新 (dist(v)) 的值。

    Bellman-Ford 算法如下:

    while (1) for each edge(u, v) relax(u, v);
    

    当一次循环中没有松弛操作成功时停止。

    每次循环是 (O(m)) 的,那么最多会循环多少次呢?

    答案是 (infty) !(如果有一个 (S) 能走到的负环就会这样)

    但是此时某些结点的最短路不存在。

    我们考虑最短路存在的时候。

    由于一次松弛操作会使最短路的边数至少 (+1) ,而最短路的边数最多为 (n-1)

    所以最多执行 (n-1) 次松弛操作,即最多循环 (n-1) 次。

    总时间复杂度 (O(NM))(对于最短路存在的图)

    relax(u, v) {
    	dist[v] = min(dist[v], dist[u] + edge_len(u, v));
    }
    for (i = 1; i <= n; i++) {
    	dist[i] = edge_len(S, i);
    }
    for (i = 1; i < n; i++) {
    	for each edge(u, v) {
    		relax(u, v);
    	}
    }
    

    注:这里的 (edge\_len(u, v)) 表示边的权值,如果该边不存在则为 (+infty)(u=v) 则为 (0)

    应用

    给一张有向图,问是否存在负权环。

    做法很简单,跑 Bellman-Ford 算法,如果有个点被松弛成功了 (n) 次,那么就一定存在。

    如果 (n-1) 次之内算法结束了,就一定不存在。

    队列优化:SPFA

    Shortest Path Faster Algorithm

    很多时候我们并不需要那么多无用的松弛操作。

    很显然,只有上一次被松弛的结点,所连接的边,才有可能引起下一次的松弛操作。

    那么我们用队列来维护“哪些结点可能会引起松弛操作”,就能只访问必要的边了。

    q = new queue();
    q.push(S);
    in_queue[S] = true;
    while (!q.empty()) {
    	u = q.pop();
    	in_queue[u] = false;
    	for each edge(u, v) {
    		if (relax(u, v) && !in_queue[v]) {
    			q.push(v);
    			in_queue[v] = true;
    		}
    	}
    }
    

    虽然在大多数情况下 SPFA 跑得很快,但其最坏情况下的时间复杂度为 (O(NM)) ,将其卡到这个复杂度也是不难的,所以考试时要谨慎使用(在没有负权边时最好使用 Dijkstra 算法,在有负权边且题目中的图没有特殊性质时,若 SPFA 是标算的一部分,题目不应当给出 Bellman-Ford 算法无法通过的数据范围)。

    SPFA 的优化之 SLF

    即 Small Label First。

    即在新元素加入队列时,如果队首元素权值大于新元素权值,那么就把新元素加入队首,否则依然加入队尾。

    该优化在确实在一些图上有显著效果,但是如果有负权边的话,可以直接卡到指数级。


    Dijkstra 算法

    Dijkstra 是个人名(荷兰姓氏)。

    IPA:/ˈdikstrɑ/或/ˈdɛikstrɑ/。

    这种算法只适用于非负权图,但是时间复杂度非常优秀。

    也是用来求单源最短路径的算法。

    实现

    主要思想是,将结点分成两个集合:已确定最短路长度的,未确定的。

    一开始第一个集合里只有 (S)

    然后重复这些操作:

    1. 对那些刚刚被加入第一个集合的结点的所有出边执行松弛操作。
    2. 从第二个集合中,选取一个最短路长度最小的结点,移到第一个集合中。

    直到第二个集合为空,算法结束。

    时间复杂度:只用分析集合操作, (n)delete-min(m)decrease-key

    如果用暴力: (O(n^2 + m) = O(n^2))

    如果用堆 (O(m log n))

    如果用 priority_queue(O(m log m))

    (注:如果使用 priority_queue,无法删除某一个旧的结点,只能插入一个权值更小的编号相同结点,这样操作导致堆中元素是 (O(m)) 的)

    如果用线段树(ZKW 线段树): (O(m log n + n) = O(m log n))

    如果用 Fibonacci 堆: (O(n log n + m)) (这就是为啥优秀了)。

    等等,还没说正确性呢!

    分两步证明:先证明任何时候第一个集合中的元素的 (dist) 一定不大于第二个集合中的。

    再证明第一个集合中的元素的最短路已经确定。

    第一步,一开始时成立(基础),在每一步中,加入集合的元素一定是最大值,且是另一边最小值,每次松弛操作又是加上非负数,所以仍然成立。(归纳)(利用非负权值的性质)

    第二步,考虑每次加进来的结点,到他的最短路,上一步必然是第一个集合中的元素(否则他不会是第二个集合中的最小值,而且有第一步的性质),又因为第一个集合内的点已经全部松弛过了,所以最短路显然确定了。

    H = new heap();
    H.insert(S, 0);
    dist[S] = 0;
    for (i = 1; i <= n; i++) {
    	u = H.delete_min();
    	for each edge(u, v) {
    		if (relax(u, v)) {
    			H.decrease_key(v, dist[v]);
    		}
    	}
    }
    

    Johnson 全源最短路径算法

    Johnson 和 Floyd 一样,是一种能求出无负环图上任意两点间最短路径的算法。该算法在 1977 年由 Donald B. Johnson 提出。

    任意两点间的最短路可以通过枚举起点,跑 (n) 次 Bellman-Ford 算法解决,时间复杂度是 (O(n^2m)) 的,也可以直接用 Floyd 算法解决,时间复杂度为 (O(n^3))

    注意到堆优化的 Dijkstra 算法求单源最短路径的时间复杂度比 Bellman-Ford 更优,如果枚举起点,跑 (n) 次 Dijkstra 算法,就可以在 (O(nmlog m)) (取决于 Dijkstra 算法的实现)的时间复杂度内解决本问题,比上述跑 (n) 次 Bellman-Ford 算法的时间复杂度更优秀,在稀疏图上也比 Floyd 算法的时间复杂度更加优秀。

    但 Dijkstra 算法不能正确求解带负权边的最短路,因此我们需要对原图上的边进行预处理,确保所有边的边权均非负。

    一种容易想到的方法是给所有边的边权同时加上一个正数 (x) ,从而让所有边的边权均非负。如果新图上起点到终点的最短路经过了 (k) 条边,则将最短路减去 (kx) 即可得到实际最短路。

    但这样的方法是错误的。考虑下图:

    (1 o 2) 的最短路为 (1 o 5 o 3 o 2) ,长度为 (−2)

    但假如我们把每条边的边权加上 (5) 呢?

    新图上 (1 o 2) 的最短路为 (1 o 4 o 2) ,已经不是实际的最短路了。

    Johnson 算法则通过另外一种方法来给每条边重新标注边权。

    我们新建一个虚拟节点(在这里我们就设它的编号为 (0) )。从这个点向其他所有点连一条边权为 (0) 的边。

    接下来用 Bellman-Ford 算法求出从 (0) 号点到其他所有点的最短路,记为 (h_i)

    假如存在一条从 (u) 点到 (v) 点,边权为 (w) 的边,则我们将该边的边权重新设置为 (w+h_u-h_v)

    接下来以每个点为起点,跑 (n) 轮 Dijkstra 算法即可求出任意两点间的最短路了。

    一开始的 Bellman-Ford 算法并不是时间上的瓶颈,若使用 priority_queue 实现 Dijkstra 算法,该算法的时间复杂度是 (O(nmlog m))

    实现

    #include <algorithm>
    #include <iostream>
    #include <queue>
    #include <vector>
    using namespace std;
    
    //节点编号1 ~ |V|
    const int MAXV = 100 + 1;
    const int INF  = 1e5;
    
    vector<vector<int>> dist(MAXV, vector<int>(MAXV, INF)); // 距离矩阵,第一维是起始点,0编号存放S'到各个点的距离
    vector<vector<int>> parent(MAXV, vector<int>(MAXV, 0)); //前驱子图,第一维是起始点
    
    struct E {
        int v;
        int w;
        E(int v, int w) : v(v), w(w) {}
        E() {}
    };
    typedef pair<int, int> P; //first存d,second存下标
    
    struct Graph {
        vector<E> adj[MAXV];
        int n;
        int m;
    };
    Graph graph;
    
    bool bellman_ford(int s) {
        dist[s][s] = 0;
        int n      = graph.n + 1;
        for (int k = 1; k <= n - 1; ++k) {
            for (int u = 0; u <= graph.n; ++u) { //u从0开始,0代表新添加的点
                for (int j = 0; j < graph.adj[u].size(); ++j) {
                    E e   = graph.adj[u][j];
                    int v = e.v;
                    if (dist[s][v] > dist[s][u] + e.w) {
                        dist[s][v] = dist[s][u] + e.w;
                    }                        //end if
                }                            //end for
            }                                //end for
        }                                    //end for
                                             //检查有没有从s可达的负圈
        for (int u = 0; u <= graph.n; ++u) { // u从0开始
            for (int j = 0; j < graph.adj[u].size(); ++j) {
                E e = graph.adj[u][j]; //边
                if (dist[s][e.v] > dist[s][u] + e.w) {
                    return false;
                } //endif
            }     //end for
        }         //end for
        return true;
    }
    
    struct cmp {
        bool operator()(P &p1, P &p2) {
            return p1.first > p2.first;
        }
    };
    
    //O(nlogn + mlogn), m>n时,O(mlogn); 斐波那契堆 O(nlogn + m)
    void dijkstra(int s) {
        dist[s][s] = 0;
        priority_queue<P, vector<P>, cmp> pq;
        pq.push(P(0, s));
        while (!pq.empty()) {
            P v_m = pq.top();
            pq.pop(); //共执行n次,logn
            int u = v_m.second;
            if (dist[s][u] < v_m.first) continue;           //d[u]小于上界,说明之前更新过了,重复放入的元素
            for (int i = 0; i < graph.adj[u].size(); ++i) { //共执行m次
                E e = graph.adj[u][i];
                if (dist[s][e.v] > dist[s][u] + e.w) {
                    dist[s][e.v]   = dist[s][u] + e.w;
                    parent[s][e.v] = u;
                    pq.push(P(dist[s][e.v], e.v)); //logn
                }
            }
        }
    }
    
    //O(mnlogn+n*nlogn),m>n时,O(mnlogn); 对于斐波那契堆为O(mn + n*nlogn)
    void johnson() {
        //create G' add S' s' = 0
        for (int i = 1; i <= graph.n; ++i) {
            graph.adj[0].push_back(E(i, 0)); //w = 0
        }
        if (!bellman_ford(0)) {
            cout << "the input graph contains a negative-weight cycle" << endl;
            return;
        }
        //d(u)= shortest path from S to u,w'(u,v)=w(u,v)+dist(u)-dist(v) >= 0
        for (int u = 1; u <= graph.n; ++u) {
            for (int v = 0; v < graph.adj[u].size(); ++v) {
                graph.adj[u][v].w = graph.adj[u][v].w + dist[0][u] - dist[0][v]; //update w'
            }
        }
        for (int u = 1; u <= graph.n; ++u) {
            dijkstra(u);
            for (int v = 1; v <= graph.n; ++v) {                   //更新所有从u出发到所有顶点的距离
                dist[u][v] = dist[u][v] - dist[0][u] + dist[0][v]; //d'(u,v)=d(u,v)+dist(u)-dist(v)
            }
        }
    }
    
    void createGraph() {
        int u, v, k, w;
        cin >> graph.n >> graph.m;
    
        for (k = 1; k <= graph.m; ++k) {
            cin >> u >> v >> w;
            graph.adj[u].push_back(E(v, w));
        }
    }
    
    void print_shortest_path(int s, int v) {
        if (v == s) {
            cout << s << " ";
            return;
        }
        if (parent[s][v] == 0) {
            cout << "no path from " << s << " to " << v << endl;
            return;
        }
        print_shortest_path(s, parent[s][v]);
        cout << v << " ";
    }
    void print_path() {
        for (int s = 1; s <= graph.n; ++s) {
            cout << "start point=" << s << ":" << endl;
            for (int v = 1; v <= graph.n; ++v) {
                print_shortest_path(s, v);
                cout << ",dist=" << dist[s][v] << endl;
            }
            cout << endl;
        }
    }
    
    int main() {
        createGraph();
        johnson();
        print_path();
    }
    

    正确性证明

    为什么这样重新标注边权的方式是正确的呢?

    在讨论这个问题之前,我们先讨论一个物理概念——势能。

    诸如重力势能,电势能这样的势能都有一个特点,势能的变化量只和起点和终点的相对位置有关,而与起点到终点所走的路径无关。

    势能还有一个特点,势能的绝对值往往取决于设置的零势能点,但无论将零势能点设置在哪里,两点间势能的差值是一定的。

    接下来回到正题。

    在重新标记后的图上,从 (s) 点到 (t) 点的一条路径 (s o p_1 o p_2 o dots o p_k o t) 的长度表达式如下:

    ((w(s,p_1)+h_s-h_{p_1})+(w(p_1,p_2)+h_{p_1}-h_{p_2})+ dots +(w(p_k,t)+h_{p_k}-h_t))

    化简后得到:

    (w(s,p_1)+w(p_1,p_2)+ dots +w(p_k,t)+h_s-h_t)

    无论我们从 (s)(t) 走的是哪一条路径, (h_s-h_t) 的值是不变的,这正与势能的性质相吻合!

    为了方便,下面我们就把 (h_i) 称为 (i) 点的势能。

    上面的新图中 (s o t) 的最短路的长度表达式由两部分组成,前面的边权和为原图中 (s o t) 的最短路,后面则是两点间的势能差。因为两点间势能的差为定值,因此原图上 (s o t) 的最短路与新图上 (s o t) 的最短路相对应。

    到这里我们的正确性证明已经解决了一半——我们证明了重新标注边权后图上的最短路径仍然是原来的最短路径。接下来我们需要证明新图中所有边的边权非负,因为在非负权图上,Dijkstra 算法能够保证得出正确的结果。

    根据三角形不等式,图上任意一边 ((u,v)) 上两点满足: (h_v leq h_u + w(u,v)) 。这条边重新标记后的边权为 (w'(u,v)=w(u,v)+h_u-h_v geq 0) 。这样我们证明了新图上的边权均非负。

    这样,我们就证明了 Johnson 算法的正确性。


    不同方法的比较

    Floyd Bellman-Ford Dijkstra Johnson
    每对结点之间的最短路 单源最短路 单源最短路 每对结点之间的最短路
    没有负环的图 任意图(可以判定负环是否存在) 非负权图 没有负环的图
    (O(N^3)) (O(NM)) (O(Mlog M)) (O(NMlog M))

    注:表中的 Dijkstra 算法在计算复杂度时均用 priority_queue 实现。

    输出方案

    开一个 pre 数组,在更新距离的时候记录下来后面的点是如何转移过去的,算法结束前再递归地输出路径即可。

    比如 Floyd 就要记录 pre[i][j] = k; ,Bellman-Ford 和 Dijkstra 一般记录 pre[v] = u

    具体代码实现可看相应的文章:Dijkstra 算法Bellman Ford 算法SPFA 算法Floyd算法

    Reference

    The desire of his soul is the prophecy of his fate
    你灵魂的欲望,是你命运的先知。

  • 相关阅读:
    帧间编码的预测自适应量化系数扫描排序
    调试vp8编码和解码程序
    WPF学习——制作一个简单的录入界面(2):用C#编程实现所有控件的功能
    自适应变异引用(AWR)方法(an adaptive warped reference (AWR) method )
    vp8编解码调试(环境vs2005)
    加油
    开始工作blog了
    vs2010编译vp8
    WPF学习——制作一个简单的录入界面(1): 添加需要的控件
    JPEG编码
  • 原文地址:https://www.cnblogs.com/RioTian/p/14686567.html
Copyright © 2020-2023  润新知