Dijkstra 算法

Dijkstra 算法

前言

  • 为了达到任意两结点的最短路径,我们有几种算法可以实现:Dijkstra 算法、Floyd 算法等等。

  • Floyd 算法虽然可以得到一幅图中任意两点的最小 cost,但是我们在本题重点关注最短路径 Shortest_path,若要采用 Floyd 算法来得到最短路径 Shortest_path 不太方便,所以我们决定采用 Dijkstra 算法。

  • 该算法使用了广度优先搜索解决带权有向图的单源最短路径问题,算法最终得到一个最短路径树。该算法常用于路由算法或者作为其他图算法的一个子模块。Dijkstra 算法无法解决负权重的问题,但所幸在本题中不考虑负权重。

准备工作

  • 如何描述一幅图?

  • 用Python的二维列表(2-D list)描述的图,这是邻接矩阵的经典表示方法,每行代表一个结点,每列代表一个结点,如果对应的值为1,则表示两个结点邻接,如果为 M 则不邻接,对于无向无权图,肯定对称。

      nodes = ['s1', 's2', 's3', 's4']
      M =  float("inf")   # M means a large number
      graph_list = [
      [M, 1, 1, 1],
      [1, M, M, 1],
      [1, M, M, 1],
      [1, 1, 1, M],
      ]
    
  • 用 Python 的列表与元组(tuple)描述的图,这实际上存储的是每条边的信息,每个括号内的内容依次为:(tail,head,cost)。

      graph_edges = [
      (‘s1’, ‘s2’, 1), (‘s1’, ‘s3’, 1), (‘s1’, ‘s4’, 1),
      (‘s2’, ‘s1’, 1), (‘s2’, ‘s4’, 1),
      (‘s3’, ‘s1’, 1), (‘s3’, ‘s4’, 1),
      (‘s4’, ‘s1’, 1), (‘s4’, ‘s2’, 1), (‘s4’, ‘s3’, 1),
      ]
    
  • 用 Python 的字典(dict)描述的图,这种表示方法很灵活,每个key代表一个结点,该结点作为tail,其邻接的head及它们之间的cost存储在value里,可想而知,对于每个 tail,可能有多个 head,所以 value 其实是一个列表,每个列表项是个两元组 (head, cost)。

      graph_dict = {
      ‘s1’:[(‘s2’,1),(‘s3’,1),(‘s4’,1)],
      ‘s2’:[(‘s1’,1), (‘s4’,1)],
      ‘s3’:[(‘s1’,1), (‘s4’,1)],
      ‘s4’:[(‘s1’,1),(‘s2’,1),(‘s3’,1)],
      }
    
  • 在有些Python代码中,也有这样的形式:‘s1’:{‘s2’:1,‘s3’:1,‘s4’:1},这和我们的 ‘s1’:[(‘s2’,1),(‘s3’,1),(‘s4’,1)] 没什么差别,都是我们用来存储数据的数据结构。

  • 这三种表示方法在是可以互相转化,在此我们给出 graph_list -> graph_edges 以及 graph_edges->graph_dict 的转化算法。

      # graph_list -> graph_edges
      graph_edges = []
      for i in nodes:
          for j in nodes:
              if i!=j and graph_list[nodes.index(i)][nodes.index(j)]!=M:
                  graph_edges.append((i,j,graph_list[nodes.index(i)][nodes.index(j)]))
    
      # graph_edges->graph_dict
      graph_dict = defaultdict(list)
      for tail,head,cost in graph_edges:
          graph_dict[tail].append((head,cost))
    

算法描述

  • 将图所有点的集合 S 分为两部分,V 和 U。

  • V 集合是已经得到最短路径的点的集合,在初始情况下 V 中只有源点 s,U 是还未得到最短路径点的集合,初始情况下是除 s 的所有点。因为每次迭代需要指明当前正在迭代的 V 集合中的某点,所以将该点设为中间点。自然,首先应将 s 设为中间点 k,然后开始迭代。

  • 在每一次迭代过程中,取得 U 中距离 k 最短的点 k,将 k 加到 V 集合中,将 k 从 U 集合删除,再将 k 设为中间点 v。重复此过程直到 U 集合为空。

Python 实现 Dijkstra 算法

  • 一般而言,若想寻找给定两点的最短路径,Dijkstra 算法必须传入三个参数,一个是图的描述 graph_dict,一个是源点 from_node,一个是终点 to_node。

  • 核心代码如下:

      def dijkstra(graph_dict, from_node, to_node):
          cost = -1
          ret_path=[]
          q, seen = [(0,from_node,())], set()
          while q:
              (cost,v1,path) = heappop(q)
              if v1 not in seen:
                  seen.add(v1)
                  path = (v1, path)
                  if v1 == to_node: # Find the to_node!!!
                      break;
                  for v2,c in graph_dict.get(v1, ()):
                      if v2 not in seen:
                          heappush(q, (cost+c, v2, path))
    
          # Check the way to quit 'while' loop!!!
          if v1 != to_node:
              print("There is no node: " + str(to_node))
              cost = -1
              ret_path=[]
    
          # IF there is a path from from_node to to_node, THEN format the path!!!
          if len(path)>0:
              left = path[0]
              ret_path.append(left)
              right = path[1]
              while len(right)>0:
                  left = right[0]
                  ret_path.append(left)
                  right = right[1]
              ret_path.reverse()
    
          return cost,ret_path
    

测试

  • 不失一般性,给定一个带权有向图:

      graph_list = [
      [0,30,15,M,M,M],
      [5,0,M,M,20,30],
      [M,10,0,M,M,15],
      [M,M,M,0,M,M],
      [M,M,M,10,0,M],
      [M,M,M,30,10,0]
      ]
    
  • 其表示的图如下:

    Dijkstra 算法_第1张图片
    graph
  • 测试一下 s1 到 s6 的最短路径:

    Dijkstra 算法_第2张图片
    test
  • 可以看到,dijkstra 函数得到了正确的最短路径以及 cost 值。

算法详解

  • 这里用到了堆排序的 heapq 模块,注意它的 heappop(q) 与heappush(q,item) 方法:

    • heapq.heappush(heap, item): 将 item 压入到堆数组 heap 中。如果不进行此步操作,后面的 heappop() 失效

    • heapq.heappop(heap): 从堆数组 heap 中取出最小的值,并返回。

思路:

  1. q, seen = [(0,from_node,())], set()

    • q 记录了中间点 v 与 U 集合中哪些点邻接,这些邻接点为 k1、k2...,并且在 q 中的存储形式为:[(cost1,k1,path1),(cost2,k2,path2)...]

    • seen 就是算法描述部分提到的 V 集合,记录了所有已访问的点

  2. (cost,v1,path) = heappop(q)

    • 这行代码会得到 q 中的最小值,也就是在算法描述部分提到的 k,用算法描述为:cost=min(cost1,cost2...)
  3. seen.add(v1)

    • 这行代码对应算法描述的“ k 加到 V 集合中,将 k 从 U 集合删除”

    • 这个时候的 k 已经成为了中间点 v

  4. 查找 U 集合中所有与中间点 v 邻接的点 k1、k2... :

         for v2,c in graph_dict.get(v1, ()):
             if v2 not in seen:
                 heappush(q, (cost+c, v2, path))
    
    • 把 k1、k2... push 进入 q 中,回到第 2 点

利用 dijkstra 得到图中所有最短路径

  • 我们准备在此基础上加以改进,利用 Dijkstra 算法得到任意两个结点之间的最短路径,为了达到这个目的,我们在算法的最后要有一个数据结构来存储这些最短路径,如果使用 Python,这个数据结构应该是像下面这样的:

      Shortest_path_dict = {
      's1': {'s2': ['s1', 's3', 's2'], 's3': ['s1', 's3'] },
      's2': {'s1': ['s2', 's1'], 's3': ['s2', 's1', 's3'},
      's3': {'s1': ['s3', 's2', 's1'], 's2': ['s3', 's2'] },
      }
    
  • 它存储了下面这幅图的所有最短路径:

    Dijkstra 算法_第3张图片
    graph2
  • 我们要想得到任意两点的最短路径,要用 Shortest_path_dict 来存储所有可能的最短路径,于是再创建一个新的函数 dijkstra_all,该函数仅仅只需要接受一个参数:图的描述 graph_dict,然后返回 Shortest_path_dict,在 dijkstra_all 中需要循环调用 dijkstra 函数。

  • 核心代码如下:

      def dijkstra_all(graph_dict):
          Shortest_path_dict = defaultdict(dict)
          for i in nodes:
              for j in nodes:
                  if i != j:
                      cost,Shortest_path = dijkstra(graph_dict,i,j)
                      Shortest_path_dict[i][j] = Shortest_path
    
          return Shortest_path_dict
    
  • 不失一般性,我们采用带权有向图测试我们的算法,图的描述与前文测试 dijkstra 算法时一致,在此直接调用 dijkstra_all函数,传入 graph_dict,得到的结果截图如下:

    Dijkstra 算法_第4张图片
    test2
  • 看最后的输出,得到了我们想要的 Shortest_path_dict

源码:https://github.com/edisonleolhl/DataStructure-Algorithm/blob/master/Graph/ShortestPath/dijkstra.py

你可能感兴趣的:(Dijkstra 算法)