Java教程

【算法学习】最短路径问题

本文主要是介绍【算法学习】最短路径问题,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

最短路径问题

 

大家好,这里是新来的工人~

 

是一个没学过太多算法编程内容的rookie

 

所以文章的问题也不难,欢迎小白们一起来看

 

语言用的是C++,当然,算法部分比较重要

 

希望第一篇文章能写好,

 

让同为小白的读者读懂吧~

 

话不多说,那就开始本期的内容吧

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

目录

01 问题介绍

02 深度优先遍历

03 Floyd算法

04 Dijkstra算法

05 Bellman-Ford算法

06 SPFA算法

07 算法总结

 

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

01

问题介绍

 

 

简单地说,就是给定一组点,给定每个点间的距离,求出点之间的最短路径。举个例子,乘坐地铁时往往有很多线路,连接着不同的城市。每个城市间距离不一样,我们要试图找到这些城市间的最短路线。

路径问题大概有以下几种:


 

  • 确定起点的最短路径问题:已知起始点,求起点到其他任意点最短路径的问题。即单源最短路径问题。

  • 确定终点的最短路径问题:与确定起点的问题相反,该问题是已知终点,求最短路径的问题。在无向图(即点之间的路径没有方向的区别)中该问题与确定起点的问题完全等同,在有向图(路径间有确定的方向)中该问题等同于把所有路径方向反转的确定起点的问题。

  • 确定起点终点的最短路径问题:已知起点和终点,求任意两点之间的最短路径。即多源最短路径问题。 

 

我们先说明如何输入一个图,并以此为例:

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

我们通过这样的形式输入数据:
5 8 
1 2 2 
1 5 10 
2 3 3
2 5 7 
3 1 4 
3 4 4 
4 5 5 
5 3 3

其中,第一行表示共有5个点(可以理解为城市),8条边(理解为路)。

 

注意,这里一行的三个数据分别表示i点,j点,和从i到j的单向距离!单向!单向!

 

我们直接输出最短路程。(也可以加上标记输出路径) 

在具体解决问题之前,我们先要把这些数据存储起来,方便调用。

这里我们直接用一个二维数组来模拟这个图(它的名字叫邻接矩阵):

 

 

1

2

3

4

5

1

0

2

10

2

0

3

7

3

4

0

4

4

0

5

5

3

0

∞表示到达不了。

 

在图中,第i列第j行表示的是i到j的距离。其中,将到自己的距离定义为0,用无穷定义没有路径连通。存储到数组中,可以通过二维数组表示。

 

下面我们就开始分别讲解几种解决最短路径问题的经典算法。

 

 

02

深度优先遍历(DFS)

 

我们知道,深度优先搜索常用于走迷宫,是一种遍历全图的暴力方法。同理,我们利用深度优先遍历,也是通过暴力遍历全图的方法来找到最短路径。

 

因为我们可以在输入数据是对城市进行编号,所以我们将问题的描述改为求从1号城市到5号城市的最短路径长度 。(即初始城市到最后的城市)

 

我们通过DFS递归函数,从起始1号城市起,不断地判断是否可以通过一个城市到达最后的5号城市(在回溯中判断),然后记录最小路程,不断更新。

 

关于深度优先搜索的知识在此就不细讲了,有兴趣的朋友可以自行搜索。

 

这里直接附上C++的代码,讲解见注释。

 

  •  
//DFS解最短路径问题 
#include <iostream>using namespace std; const int INF=99999999;//正无穷int minn=INF;int n,dist[105][105],book[105]; void dfs(int cur,int dis){    int j;    //一点点优化:如果本次查找的路径到此已经超过前面查找的最短路径总长,就不需要再继续了    if(dis>minn)        return;    if(cur==n)//到达要查的城市     {        minn=min(dis,minn);        return;    }     for(j=1;j<=n;j++)//从1号城市到n号城市依次尝试看是否能通过j到达n     {        if(dist[cur][j]!=INF&&book[j]==0)//判断当前城市cur到城市j是否有路,并判断城市j是否已经走过        {            book[j]=1;//标记已经走过            dfs(j,dis+dist[cur][j]);//从城市j再出发,继续寻找            book[j]=0;        }    }    return;}int main(){    int i,j,m,a,b,c;    cin>>n>>m;    //初始化二维矩阵    for(i=1;i<=n;i++)        for(j=1;j<=n;j++)            if(i==j)    dist[i][j]=0;   //到自己的距离为0                else    dist[i][j]=INF;  //距离为无限,默认到不了              //读入城市之间的距离            for(i=1;i<=m;i++)            {                cin>>a>>b>>c;                dist[a][b]=c;            }             //从1号城市出发,接下来就交给函数dfs了~             book[1]=1;            dfs(1,0);            cout<<minn;        return 0;}

 

 

可能有人会问,深度优先搜索的兄弟广度优先搜索算法呢?事实上,基于广度优先遍历依照节点到初始点的节点数遍历全图的特点,它能解决没有权值(也就是默认每条路程一样长)的图的最小路径问题,但对有权值的图,BFS很难解决(即使加上minn指标,我们也无法处理“回头”的路径)。我们就不在此讲解了。

 

贴上运行结果:

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

03

Floyd算法

 

Floyd它可以方便地求出任意两点间的距离,求的是多源最短路径。最大的优点就是容易理解和编写,算法的核心代码只有5行:

  •  
     //核心代码     for(k=1;k<=n;k++)         for(i=1;i<=n;i++)             for(j=1;j<=n;j++)                if(dist[i][k]+dist[k][j]<dist[i][j])                     dist[i][j]=dist[i][k]+dist[k][j]; 

 

 

但看了代码后童鞋们会发现,Floyd算法的时间复杂度比较高(n^3),不适合计算大量数据。

 

我们可以把Floyd算法理解为“如果两点间的路径长度,大于这两点通通过第三点连接的路径长度,那么就修正这两点的最短路径”。

 

下面我们来具体讲解一下算法的思路:

在代码中,i,j表示的是我们当前循环中所求的起点、终点。k则是我们引入的“中转点”。为什么要引入中转点呢?因为当我们寻找i、j之间的最短路径时,要么是i、j间的距离,要么就是经过其他点中转:i→k→。。。→j。

 

为了方便讲解,我们给出一个概念“松弛”:如果dist【i】【j】>dist【i】【k】+dist【k】【j】(e表示两点间的距离),我们把dist【i】【j】更新为dist【i】【k】+dist【k】【j】,达到“经过中转点k后距离缩短,并记录”的目的。

 

在第1轮循环中,我们以1为中转点,把任意两条边的距离松弛一遍,更新数组数据。

在第2轮循环中,我们以2为中转点,再松弛一遍。这时,对第1轮松弛更新过的数据,如果继续更新,相当于中转到1,2后取得当前最短路径。

。。。。。。

最后得到的数组就是任意两点间的最短路径。

 

这个时候再看一遍这句话:“如果两点间的路径长度,大于这两点通通过第三点连接的路长度,那么就修正这两点的最短路径。”是不是就能够理解了?

 

下面放码。

 

  •  
//Floyd算法解最短路径问题 #include <iostream>using namespace std;
const int INF=99999;
int main(){  //读入数据的过程和dfs没什么区别,就不讲解了     int i,j,n,m,k,a,b,c;    int dist[105][105];    cin>>n>>m;    for(i=1;i<=n;i++)        for(j=1;j<=n;j++)            if(i==j)    dist[i][j]=0;                  else    dist[i][j]=INF;               for(i=1;i<=m;i++)            {                cin>>a>>b>>c;                dist[a][b]=c;            }
     //核心代码     for(k=1;k<=n;k++)         for(i=1;i<=n;i++)             for(j=1;j<=n;j++)                if(dist[i][k]+dist[k][j]<dist[i][j])                     dist[i][j]=dist[i][k]+dist[k][j];          for (i=1;i<=n;i++){       for(j=1;j<=n;j++){         cout<<dist[i][j]<<"\t";     }     cout<<endl;   }
        return 0;}

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

04

Dijkstra算法

 

 

Dijkstra 算法主要解决的是单源最短路径问题。它的时间复杂度一般是o(n^2) ,因此相对于Floyd算法速度上有极大的优势,可以处理更多的数据。

 

算法的核心依旧是上文讲到的“松弛”。只不过松弛的方式略有不同:它通过不断选择距离起点最近的顶点作为新的起点,再利用这些新的起点来松弛其他较远的点,最终计算出所有点到起点最短路径。

这样听起来有点绕,我们基于代码,通过例子来讲解。

 

我们把点i到起点1的距离定义为dis【i】(现在知道我上面为什么用dist了吧!),用一个book来标记该点是否已经为最短状况,初始化为0(否)

 

核心代码分为两部分:第一部分判断最小,第二部分进行松弛。

 

以原题为例:

第一次循环,我们先进入第一部分判断较短距离。第一次到起点1只有2号,5号点有最短距离,分别为2,10。

下一步,我们找到2,5号中到起点1距离较短的点u(这里是2号)。

进入第二部分松弛。对点v,如果v到起点1的距离大于u(即2)到1的距离加上2到v的距离,更新v到原点的距离dis【v】。

开始循环。

在下一次循环中,相当于把点2当作新的起点代替点1,进行上述操作。

 

可以看出,Dijkstra是一种基于贪心策略的算法,也是一种以DFS为思路的算法。

 

#贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,贪心算法所做出的是在某种意义上的局部最优解。#

 

为什么下一条次较短路径要这样选择?(贪心准则的正确性)

因为我们算的是到起点的距离,所以所有路径必然要经过与起点最近的2(或不经过任何别的中转点),而相对于2点,5号点距离更远,还有通过2点松弛之后缩短路径的可能性,所以我们直接选择2为新的起点进行下一步松弛。那么,第k次循环就表示松弛了k次,即经过 了k-1个中转点(或k-1条边)才到达起点1,留在dis()数组中的距离就是经过中转点个数<=k-1(可能无需经过这么多个点就达到)的最短路径。

 

Dijkstra算法主要特点是以起始点为中心向外层层扩展,从一个顶点到其余各顶点的最短路径算法,直到扩展到最远点(指经过的中转点最多,)为止。(这里就是类似BFS的地方)

 

选择最短路径顶点的时候依照的是实现定义好的贪心准则,所以该算法也是贪心算法的一种。

还有说法是Dijkstra也属于动态规划。这里我就不发表言论了,因为本小白还不懂(┬_┬)。

 

下面给出代码。

  •  
//Dijkstra算法解最短路径问题 #include<iostream>using namespace std;
const int INF=99999;
int main(){     int dist[105][105] ;   int dis[105]  ;   int book[105] ;   int i,j,n,m,a,b,c,u,v,Min;
     cin>>n>>m;
     //开始了!!!     for(i = 1;i <= n;i++)  //每轮循环计算的是中转点为n-1时的最小点。          for(j = 1;j <= n;j++)              if(i == j)  dist[i][j] = 0;              else        dist[i][j] = INF;
              for(i = 1;i <= m;i++)              {                    cin>>a>>b>>c;                    dist[a][b] = c;              }                        for(i = 1;i <= n;i++)                            dis[i] = dist[1][i];
          for(i = 1;i<=n;i++)   //初始化标记book                    book[i] = 0;                   book[1] = 1;
          for(i = 1;i <= n-1;i++)  //筛出当前没有访问的并且与上一点直接相连的距离最小的点。        {               Min = INF;               for(j = 1;j <= n;j++)               {                     if(book[j] == 0&& dis[j] < Min)                     {                           Min = dis[j];                           u = j;                     }               }

          book[u] = 1;          for(v = 1;v <= n;v++) //松弛          {                if(dist[u][v] < INF)                {                      if(dis[v] > dis[u] + dist[u][v])                           dis[v] = dis[u] + dist[u][v];                }          }        }                for(i  = 1;i <= n;i++)            cout<<dis[i]<<"\t";
    return 0;}

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

05

Bellman-Ford算法

 

 

与Floyd算法一样,Dijkstra也有自己的问题,那就是无法处理“路径长度”为负的情况。(当然,城市间的距离不可能为负,但在一些特殊的问题中,路径的长度也可以为负)

 

为什么呢?以第一次循环为例,我们在第一次判断选择了点2为“新起点”,而没有考虑别的点经过点5达到起点1松弛的可能性。假设,点3到点2的距离为1,点3到点5的距离为-100,那点3经过点5松弛的路径实际上更短,而在Dijkstra中,却被我们忽视了。

 

所以,我们介绍Bellman-Ford算法来解决这种问题。(而且代码的编写也很简单,我很喜欢~~)

  •  
     //Bellman-Ford算法核心部分      for(k = 1;k <= n;k++)         for(i = 1;i <= m;i++)            if(dis[v[i]]>dis[u[i]]+w[i])                dis[v[i]] = dis[u[i]]  + w[i];     for(i = 1;i <= m;i++)            if(dis[v[i]]>dis[u[i]]+w[i])

 

 

我们来讲解一下。

可以从代码中看到Bellman-ford与Dijkstra有相似的地方,都是通过松弛操作来达到最短路径。不同的是,Dijkstra是通过从近到远的顺序来按点的顺序松弛,Bellman-ford则是按输入时对每一条边的顺序来松弛。

 

代码中的数组u(),v(),w()分别存储一行输入的三个数据(i点,j点,i到j的单向距离),这意味着在前文提到的邻接矩阵被我们弃用了,dist()数组不会在这里出现了。

 

最外轮的k循环表示每次通过k个中转点(这里与Dijkstra相同,同样我们可以理解为经过的边的条数),i循环表示枚举m条边。

 

看过前面对Dijkstra的讲解,这里应该不难理解了:对每一条编号为i的边,我们比较边i的起点v[i]到起点1的距离dis[v[i]]与边i的另一点u[i]到起点1的距离+ v[i],u[i]的间距dis[u[i]]  + w[i],更新dis(j)。(好绕。。。)那么,第k次循环就表示松弛了k次,即经过 了k-1个中转点(或k-1条边)才到达起点1,留在dis()数组中的距离就是经过中转点个数<=k-1(可能无需经过这么多个点就达到)的最短路径。(细心的朋友可以发现这句话在前文中出现过)

 

下面回到负值路径的问题上。因为我们是通过边为顺序松弛的,在这个过程中没有放弃对任何一条边(在Dijkstra中,我们放弃了部分数据,比如点5到点3的路径),所以不会有忽视的情况,自然也就能处理负值边了~

 

我们甚至还能判断负权回路(指一个回路的路径总和为负)。

 

等等,我们是不是还没提过为什么松弛n-1次后一定能得到最短路径?

  1. 1.          当没有负权回路时,对于超过n-1条边而到达起点1的路径,一定存在正值回路,肯定可以去掉;

  2. 2.         当有负权回路时,我们可以无限次地在回路里循环,让路径无限小,也就没有“最短路径了”。

 

因此,n-1次的松弛必然得到最短路径。

 

我们就基于2来判断负权回路。在循环n-1次后再对每一条边松弛一次,如果有还能继续松弛的边,则存在负权回路。()

 

我们来看看完整版代码:

  •  
//Bellman-Ford算法解最短路径问题 #include<iostream>using namespace std;
const int INF=99999;
int main(){     int dis[105] , i , k , n , m , u[105] , v[105] , w[105];     bool flag=false;     cin>>n>>m;
     for(i  = 1;i <= m;i++)           cin>>u[i]>>v[i]>>w[i];
     for(i = 1;i <= n;i++)          dis[i] = INF;               dis[1] = 0;
     //Bellman-Ford算法核心部分      for(k = 1;k <= n;k++)         for(i = 1;i <= m;i++)            if(dis[v[i]]>dis[u[i]]+w[i])                dis[v[i]] = dis[u[i]]  + w[i];     for(i = 1;i <= m;i++)            if(dis[v[i]]>dis[u[i]]+w[i])                  flag=true;
      if (!flag)         for(i = 1;i <= n;i++)               cout<<dis[i]<<"\t";      else            cout<<"存在负权回路!!";
}

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

06

SPFA算法

 

 

呼,终于来到最后一个了。。。

 

之前我们在谈到Bellman-ford能处理负值路径是提到,Bellman-ford没有放弃对任何一条边的松弛。这虽然不错,但也会是我们优化的一个方向。(具体的说,大神们优化的方向)

 

我们可以加入一个判断,判断某一条边是否被别的点帮助松弛过,因为只有被松弛过的点才能松弛别的点(被起点松弛也是松弛)。当一个点无法被松弛时,在本次经过k-1条边,它还无法接触到起点1(或者在更早的时候就已经被判断过了),也就没有帮助他人的能力。这是一个递推的过程,需要想明白。如果存在有一个点压根就没能力支援,也就是它本身已经没有存在的价值了,那么我们下次就不用再考虑它了。

 

注意,在这里我们依然我们始终保留了对负权路径、回路的判断。

 

我们可以利用队列来存放可以继续帮助松弛的点,舍弃没有利用价值的点。这和BFS是一个道理,一边要保证有k-1轮大循环来控制,一方面又要舍弃旧点增加新点,队列就可以有这个作用。所以当代码写出来是你会惊讶地发现,它和BFS的形式是那么地相似。

 

也不知道讲明白没,就先放代码吧。

  •  
//SPFA解最短路径问题 #include <iostream>using namespace std;
int main(){  int n,m,i,j,k;  int dis[105]={0},book[105]={0};  //book数组用来记录哪些顶点已经在队列中   int que[1000]={0},head=1,tail=1;//定义一个队列,并初始化队列  int dist[105][105];  int INF = 99999999;  int a,b,c;    cin>>n>>m;  //初始化   for(i=1;i<=n;i++)    dis[i]=INF;  dis[1]=0;     for(i=1;i<=n;i++)    book[i] = 0; //初始化为0,刚开始都不在队列中        //初始化二维矩阵    for(i=1;i<=n;i++)        for(j=1;j<=n;j++)            if(i==j)    dist[i][j]=0;   //到自己的距离为0                else    dist[i][j]=INF;  //距离为无限,默认到不了              //读入城市之间的距离            for(i=1;i<=m;i++)            {                cin>>a>>b>>c;                dist[a][b]=c;            }           //1号顶点入队  que[tail]=1; tail++;  book[1]=1;//标记1号顶点已经入队    while(head<tail){//队列不为空的时候循环      for (i=1;i<=n;i++)        if (dist[que[head]][i]!=INF && i!=que[head])        {          k=i;  // k表示每一条边的对应顶点           if(dis[k]>dist[que[head]][k]+dis[que[head]] ) //判断是否松弛成功         {                 dis[k]=dist[que[head]][k]+dis[que[head]];              //这的book数组用来判断顶点v[k]是否在队列中                /*如果不使用一个数组来标记的话,判断一个顶点是否在队列中每次                都 需要从队列的head到tail扫一遍,很浪费时间*/                      if(book[k]==0)//0表示不在队列中,将顶点v[k]加入队列中                //下面两句为入队操作            {              que[tail] = k;              tail++;              //同时标记顶点v[k]已经入队             book[k] =1;                }        }       }    //出队    book[que[head]] = 0;    head++;   }        for(i=1;i<=n;i++)    cout<<dis[i]<<"\t";    return 0; }

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

 

#网上很多资料提到SPFA都会提到邻接表,这里我为了偷懒就随便讲下啦~~代码中我用的是邻接矩阵存储的,请放心食用。

大致是因为,当图的边数较少时(相对于顶点而言,边数M<顶点数N^2)(我们称为稀疏图,对应稠密图),用这样的方法来存储可以极大地降低时间复杂度。

大致是利用了链表的原理实现的。有兴趣可以自己搜索。#

 

07

算法总结

 

 

     这里直接盗用一张网络上的表来总结:

 

 

Floyd  

Dijkstra

Bellman-ford

SPFA

空间复杂度   

O(N²)

O(M)

O(M)

O(M)

时间复杂度

O(N³)

O((m+n)logN)

O(MN)

最坏也是O(NM)

适用情况

稠密图和顶点关系密切

稠密图和顶点关系密切

稀疏图和边关系密切

稀疏图和边关系密切

负权

可以

不能

可以

可以

有负权边时

可以处理

不能判断

不能处理

不能判断

可以处理

可以判断

可以处理

可以判断

 

是不是感觉清晰些了?

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

那么,本期的内容到这里就全部结束了。

 

这里是新来的工人小舟,

 

正走在努力学习编程的路上。

 

让我们下次再见!

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

#

-The End-

文/怎么学都学不会C++的新手舟

版/怎么赶都赶不完作业的小白舟

码/新来到程序猿声的工人舟

审/这片工地的包工头短短的路走走停停

#

这篇关于【算法学习】最短路径问题的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!