图是网络结构的抽象模型。图是一组由边连接的节点(或顶点)。学习图是重要的,因为任
何二元关系都可以用图来表示。
任何社交网络,例如Facebook、Twitter和Google plus,都可以用图来表示。
我们还可以使用图来表示道路、航班以及通信状态,如下图所示:
一个图G = (V, E)由以下元素组成。
V:一组顶点
E:一组边,连接V中的顶点
下图表示一个图:
在着手实现算法之前,让我们先了解一下图的一些术语。
由一条边连接在一起的顶点称为相邻顶点。比如,A和B是相邻的,A和D是相邻的,A和C
是相邻的,A和E不是相邻的。
一个顶点的度是其相邻顶点的数量。比如,A和其他三个顶点相连接,因此,A的度为3;E
和其他两个顶点相连,因此,E的度为2。
路径是顶点v1, v2,…,vk的一个连续序列,其中vi和vi+1是相邻的。以上一示意图中的图为例,
其中包含路径A B E I和A C D G。
简单路径要求不包含重复的顶点。举个例子,A D G是一条简单路径。除去最后一个顶点(因
为它和第一个顶点是同一个顶点),环也是一个简单路径,比如A D C A(最后一个顶点重新回到A)。
如果图中不存在环,则称该图是无环的。如果图中每两个顶点间都存在路径,则该图是连
通的。
有向图和无向图
图可以是无向的(边没有方向)或是有向的(有向图)。如下图所示,有向图的边有一个方向:
如果图中每两个顶点间在双向上都存在路径,则该图是强连通的。例如,C和D是强连通的,
而A和B不是强连通的。
图还可以是未加权的(目前为止我们看到的图都是未加权的)或是加权的。如下图所示,加
权图的边被赋予了权值:
从数据结构的角度来说,我们有多种方式来表示图。在所有的表示法中,不存在绝对正确的
方式。图的正确表示法取决于待解决的问题和图的类型。
不是强连通的图(稀疏图)如果用邻接矩阵来表示,则矩阵中将会有很多0,这意味着我们
浪费了计算机存储空间来表示根本不存在的边。例如,找给定顶点的相邻顶点,即使该顶点只有
一个相邻顶点,我们也不得不迭代一整行。邻接矩阵表示法不够好的另一个理由是,图中顶点的
数量可能会改变,而2维数组不太灵活。
我们也可以使用一种叫作邻接表的动态数据结构来表示图。邻接表由图中每个顶点的相邻顶
点列表所组成。存在好几种方式来表示这种数据结构。我们可以用列表(数组)、链表,甚至是
散列表或是字典来表示相邻顶点列表。下面的示意图展示了邻接表数据结构。
尽管邻接表可能对大多数问题来说都是更好的选择,但以上两种表示法都很有用,且它们有
着不同的性质(例如,要找出顶点v和w是否相邻,使用邻接矩阵会比较快)。
我们还可以用关联矩阵来表示图。在关联矩阵中,矩阵的行表示顶点,列表示边。如下图所
示,我们使用二维数组来表示两者之间的连通性,如果顶点v是边e的入射点,则array[v][e] === 1;否则,array[v][e] === 0。
关联矩阵通常用于边的数量比顶点多的情况下,以节省空间和内存。
function Graph(){
var vertices=[] //{1}
var adjList = new Dictionary() //{2}
this.addVertex = function(v){
vertices.push(v) //{3}
adjList.set(v,[]) //{4}
}
this.addEdge = function(v,w){
adjList.get(v).push(w) //{5}
adjList.get(w).push(v) //{6}
}
this.toString = function(){
var s = ''
for(var i=0;i '
var neighbors = adjList.get(vertices[i]) //{11}
for(var j=0;j
我们使用一个数组来存储图中所有顶点的名字(行{1}),以及一个字典(在第6章中已经实
现)来存储邻接表(行{2})。字典将会使用顶点的名字作为键,邻接顶点列表作为值。vertices
数组和adjList字典两者都是我们Graph类的私有属性。
接着,我们将实现两个方法:一个用来向图中添加一个新的顶点(因为图实例化后是空的),另外一个方法用来添加顶点之间的边。我们先实现addVertex方法,这个方法接受顶点v作为参数。我们将该顶点添加到顶点列表中(行{3}),并且在邻接表中,设置顶点v作为键对应的字典值为一个空数组(行{4})。
现在,我们来实现addEdge方法,这个方法接受两个顶点作为参数。首先,通过将w加入到v的邻接表中,我们添加了一条自顶点v到顶点w的边。如果你想实现一个有向图,则行{5}就足够了。由于本章中大多数的例子都是基于无向图的,我们需要添加一条自w向v的边(行{6})。
为了更方便一些,让我们来实现一下Graph类的toString方法,以便于在控制台输出图。我们为邻接表表示法构建了一个字符串。首先,迭代vertices数组列表(行{10}),将顶点的名字加入字符串中。接着,取得该顶点的邻接表(行{11}),同样也迭代该邻接表(行{12}),将相邻顶点加入我们的字符串。邻接表迭代完成后,给我们的字符串添加一个换行符(行{13}),这样就可以在控制台看到一个漂亮的输出了。
和树数据结构类似,我们可以访问图的所有节点。有两种算法可以对图进行遍历:广度优先
搜索(Breadth-First Search,BFS)和深度优先搜索(Depth-First Search,DFS)。图遍历可以用来寻找特定的顶点或寻找两个顶点之间的路径,检查图是否连通,检查图是否含有环等。
在实现算法之前,让我们来更好地理解一下图遍历的思想方法。
图遍历算法的思想是必须追踪每个第一次访问的节点,并且追踪有哪些节点还没有被完全探
索。对于两种图遍历算法,都需要明确指出第一个被访问的顶点。
完全探索一个顶点要求我们查看该顶点的每一条边。对于每一条边所连接的没有被访问过的
顶点,将其标注为被发现的,并将其加进待访问顶点列表中。
为了保证算法的效率,务必访问每个顶点至多两次。连通图中每条边和顶点都会被访问到。
广度优先搜索算法和深度优先搜索算法基本上是相同的,只有一点不同,那就是待访问顶点
列表的数据结构。
当要标注已经访问过的顶点时,我们用三种颜色来反映它们的状态。
白色:表示该顶点还没有被访问。
灰色:表示该顶点被访问过,但并未被探索过。
黑色:表示该顶点被访问过且被完全探索过。
这就是之前提到的务必访问每个顶点最多两次的原因。
广度优先搜索算法会从指定的第一个顶点开始遍历图,先访问其所有的相邻点,就像一次访
问图的一层。换句话说,就是先宽后深地访问顶点,如下图所示:
以下是从顶点v开始的广度优先搜索算法所遵循的步骤。
(1) 创建一个队列Q。
(2) 将v标注为被发现的(灰色),并将v入队列Q。
(3) 如果Q非空,则运行以下步骤:
(a) 将u从Q中出队列;
(b) 将标注u为被发现的(灰色);
(c) 将u所有未被访问过的邻点(白色)入队列;
(d) 将u标注为已被探索的(黑色)。
让我们来实现广度优先搜索算法:
var initializeColor = function(){
var color = []
for(var i=0;i
广度优先搜索和深度优先搜索都需要标注被访问过的顶点。为此,我们将使用一个辅助数组
color。由于当算法开始执行时,所有的顶点颜色都是白色(行{1}),所以我们可以创建一个辅
助函数initializeColor,为这两个算法执行此初始化操作。
让我们深入学习广度优先搜索方法的实现。我们要做的第一件事情是用initializeColor
函数来将color数组初始化为white(行{2})。我们还需要声明和创建一个Queue实例(行{3}),
它将会存储待访问和待探索的顶点。
照着本章开头解释过的步骤,bfs方法接受一个顶点作为算法的起始点。起始顶点是必要的,
我们将此顶点入队列(行{4})。
如果队列非空(行{5}),我们将通过出队列(行{6})操作从队列中移除一个顶点,并取得
一个包含其所有邻点的邻接表(行{7})。该顶点将被标注为grey(行{8}),表示我们发现了它
(但还未完成对其的探索)。
对于u(行{9})的每个邻点,我们取得其值(该顶点的名字——行{10}),如果它还未被访
问过(颜色为white——行{11}),则将其标注为我们已经发现了它(颜色设置为grey——行
{12}),并将这个顶点加入队列中(行{13}),这样当其从队列中出列的时候,我们可以完成对
其的探索。
当完成 探索该顶点 和其相邻顶 点后,我们 将该顶点标 注为已探索 过的(颜色设置为
black——行{14})
到目前为止,我们只展示了BFS算法的工作原理。我们可以用该算法做更多事情,而不只是
输出被访问顶点的顺序。例如,考虑如何来解决下面这个问题。
给定一个图G和源顶点v,找出对每个顶点u,u和v之间最短路径的距离(以边的数量计)。
对于给定顶点v,广度优先算法会访问所有与其距离为1的顶点,接着是距离为2的顶点,
以此类推。所以,可以用广度优先算法来解这个问题。我们可以修改bfs方法以返回给我们一
些信息:
从v到u的距离d[u];
前溯点pred[u],用来推导出从v到其他每个顶点u的最短路径。
让我们来看看改进过的广度优先方法的实现:
this.BFS = function(v){
var color = initializeColor(),
queue=new Queue(),
d=[], //{1}
pred=[]
queue.enqueue(v)
for(var i=0;i
我们还需要声明数组d(行{1})来表示距离,以及pred数组来表示前溯点。下一步则是对
图中的每一个顶点,用0来初始化数组d(行{4}),用null来初始化数组pred。
当我们发现顶点u的邻点w时,则设置w的前溯点值为u(行{7})。我们还通过给d[u]加1来
设置v和w之间的距离(u是w的前溯点,d[u]的值已经有了)。
方法最后返回了一个包含d和pred的对象(行{8})。
通过前溯点数组,我们可以用下面这段代码来构建从顶点A到其他顶点的路径:
var fromVertex = myVertices[0]; //{9}
for (var i=1; i
我们用顶点A作为源顶点(行{9})。对于每个其他顶点(除了顶点A——行{10}),我们会计
算顶点A到它的路径。我们从顶点数组得到toVertex(行{11}),然后会创建一个栈来存储路径
值(行{12})。
接着,我们追溯toVertex到fromVertex的路径(行{13})。变量v被赋值为其前溯点的值,
这样我们能够反向追溯这条路径。将变量v添加到栈中(行{14})。最后,源顶点也会被添加到
栈中,以得到完整路径。
这之后,我们创建了一个s字符串,并将源顶点赋值给它(它是最后一个加入栈中的,所以
它是第一个被弹出的项 ——行{16})。当栈是非空的,我们就从栈中移出一个项并将其拼接到字
符串s的后面(行{18})。最后(行{19})在控制台上输出路径。
执行该代码段,我们会得到如下输出:
本章中的图不是加权图。如果要计算加权图中的最短路径(例如,城市A和城市B之间的最短路径——GPS和Google Maps中用到的算法),广度优先搜索未必合适。
举些例子,Dijkstra算法解决了单源最短路径问题。Bellman-Ford算法解决了边权值为负的
单源最短路径问题。A*搜索算法解决了求仅一对顶点间的最短路径问题,它用经验法则来加速搜
索过程。Floyd-Warshall算法解决了求所有顶点对间的最短路径这一问题。
深度优先搜索算法将会从第一个指定的顶点开始遍历图,沿着路径直到这条路径最后一个顶
点被访问了,接着原路回退并探索下一条路径。换句话说,它是先深度后广度地访问顶点,如下
图所示:
深度优先搜索算法不需要一个源顶点。在深度优先搜索算法中,若图中顶点v未访问,则访
问该顶点v。
要访问顶点v,照如下步骤做。
(1) 标注v为被发现的(灰色)。
(2) 对于v的所有未访问的邻点w,访问顶点w,标注v为已被探索的(黑色)。
如你所见,深度优先搜索的步骤是递归的,这意味着深度优先搜索算法使用栈来存储函数调
用(由递归调用所创建的栈)。
让我们来实现一下深度优先算法:
this.dfs = function(){
var color = initializeColor() //{1}
for(var i=0;i
首先,我们创建颜色数组(行{1}),并用值white为图中的每个顶点对其做初始化,广度优
先搜索也这么做的。接着,对于图实例中每一个未被访问过的顶点(行{2}和{3}),我们调用私
有的递归函数dfsVisit,传递的参数为顶点、颜色数组以及回调函数(行{4})。
当访问u顶点时,我们标注其为被发现的(grey——行{5})。如果有callback函数的话(行
{6}),则执行该函数输出已访问过的顶点。接下来一步是取得包含顶点u所有邻点的列表(行
{7})。对于顶点u的每一个未被访问过(颜色为white——行{10}和行{8})的邻点w(行{9}),
我们将调用dfsVisit函数,传递w和其他参数(行{11}——添加顶点w入栈,这样接下来就能访
问它)。最后,在该顶点和邻点按深度访问之后,我们回退,意思是该顶点已被完全探索,并将
其标注为black(行{12})。
让我们执行下面的代码段来测试一下dfs方法:
到目前为止,我们只是展示了深度优先搜索算法的工作原理。我们可以用该算法做更多的事
情,而不只是输出被访问顶点的顺序。
对于给定的图G,我们希望深度优先搜索算法遍历图G的所有节点,构建“森林”(有根树的
一个集合)以及一组源顶点(根),并输出两个数组:发现时间和完成探索时间。我们可以修改
dfs方法来返回给我们一些信息:
顶点u的发现时间d[u];
当顶点u被标注为黑色时,u的完成探索时间f[u];
顶点u的前溯点p[u]。
让我们来看看改进了的DFS方法的实现:
var time = 0 //{1}
this.DFS = function(){
var color = initializeColor(), //{2}
d = [],
f = [],
p = [];
time = 0;
for (var i=0; i
我们需要一个变量来要追踪发现时间和完成探索时间(行{1})。时间变量不能被作为参数
传递,因为非对象的变量不能作为引用传递给其他JavaScript方法(将变量作为引用传递的意思是
如果该变量在其他方法内部被修改,新值会在原始变量中反映出来)。接下来,我们声明数组d、
f和p(行{2})。我们需要为图的每一个顶点来初始化这些数组(行{3})。在这个方法结尾处返
回这些值(行{4}),之后我们要用到它们。
当一个顶点第一次被发现时,我们追踪其发现时间(行{5})。当它是由引自顶点u的边而被
发现的,我们追踪它的前溯点(行{6})。最后,当这个顶点被完全探索后,我们追踪其完成时
间(行{7})。
深度优先算法背后的思想是什么?边是从最近发现的顶点u处被向外探索的。只有连接到未
发现的顶点的边被探索了。当u所有的边都被探索了,该算法回退到u被发现的地方去探索其他的
边。这个过程持续到我们发现了所有从原始顶点能够触及的顶点。如果还留有任何其他未被发现
的顶点,我们对新源顶点重复这个过程。重复该算法,直到图中所有的顶点都被探索了。
对于改进过的深度优先搜索,有两点需要我们注意:
时间(time)变量值的范围只可能在图顶点数量的一倍到两倍之间;
对于所有的顶点u,d[u]
在这两个假设下,我们有如下的规则:
1 ≤ d [u] < f [u] ≤ 2|V|
如果对同一个图再跑一遍新的深度优先搜索方法,对图中每个顶点,我们会得到如下的发现
/完成时间:
给定下图,假定每个顶点都是一个我们需要去执行的任务:
当我们需要编排一些任务或步骤的执行顺序时,这称为拓扑排序(topological sorting,英文
亦写作topsort或是toposort)。在日常生活中,这个问题在不同情形下都会出现。例如,当我们开
始学习一门计算机科学课程,在学习某些知识之前得按顺序完成一些知识储备(你不可以在上算
法I前先上算法II)。当我们在开发一个项目时,需要按顺序执行一些步骤,例如,首先我们得从
客户那里得到需求,接着开发客户要求的东西,最后交付项目。你不能先交付项目再去收集需求。
拓扑排序只能应用于DAG(有向无环图)。那么,如何使用深度优先搜索来实现拓扑排序呢?让我们在本节开头的示意图上执行一下深度优先搜索。
创建有向图要注意把图结构中添加边的方法的第二行给注释掉
this.addEdge = function(v,w){
adjList.get(v).push(w) //{5}
//adjList.get(w).push(v) //{6}
}
Dijkstra算法是一种计算从单个源到所有其他源的最短路径的贪心算法(你可以在第11章了
解到更多关于贪心算法的内容),这意味着我们可以用它来计算从图的一个顶点到其余各顶点的
最短路径。
考虑下图:
我们来看看如何找到顶点A和其余顶点之间的最短路径。但首先,我们需要声明表示上图的
邻接矩阵,如下所示:
现在,通过下面的代码来看看Dijkstra算法是如何工作的:
var INF = Number.MAX_SAFE_INTEGER
this.graph = [ [0, 2, 4, 0, 0, 0],
[0, 0, 2, 4, 2, 0],
[0, 0, 0, 0, 3, 0],
[0, 0, 0, 0, 0, 2],
[0, 0, 0, 3, 0, 2],
[0, 0, 0, 0, 0, 0] ]
this.dijkstra = function(src) {
var dist = [], visited = [],
length = this.graph.length
for (var i = 0; i < length; i++) { //{1}
dist[i] = INF
visited[i] = false;
}
dist[src] = 0; //{2}
for (var i = 0; i < length-1; i++) { //{3}
var u = minDistance(dist, visited) //{4}
visited[u] = true; //{5}
for (var v = 0; v < length; v++) {
if (!visited[v] &&
this.graph[u][v] != 0 && dist[u] != INF &&
dist[u] + this.graph[u][v] < dist[v]) { //{6}
dist[v] = dist[u] + this.graph[u][v] //{7}
}
}
}
return dist //{8}
}
var minDistance = function(dist, visited) {
var min = INF, minIndex = -1;
for (var v = 0; v < dist.length; v++) {
if (visited[v] == false && dist[v] <= min) {
min = dist[v];
minIndex = v;
}
}
return minIndex;
}
下面是对算法过程的描述。
行{1}:首先,把所有的距离(dist)初始化为无限大(JavaScript最大的数INF = Number.
MAX_SAFE_INTEGER),将visited[]初始化为false。
行{2}:然后,把源顶点到自己的距离设为0。
行{3}:接下来,要找出到其余顶点的最短路径。
行{4}:为此,我们需要从尚未处理的顶点中选出距离最近的顶点。
行{5}:把选出的顶点标为visited,以免重复计算。
行{6}:如果找到更短的路径,则更新最短路径的值(行{7})。
行{8}:处理完所有顶点后,返回从源顶点(src)到图中其他顶点最短路径的结果。
要计算顶点间的minDistance,就要搜索dist数组中的最小值,返回它在数组中的索引
Floyd-Warshall算法是一种计算图中所有最短路径的动态规划算法。通过该算法,我们可以找出从所有源到所有顶点的最短路径。
Floyd-Warshall算法实现如下:
this.floydWarshall = function() {
var dist = [],
length = this.graph.length,
i, j, k
for (i = 0; i < length; i++) { //{1}
dist[i] = []
for (j = 0; j < length; j++) {
if(this.graph[i][j]===0){
dist[i][j]=999
}else{
dist[i][j] = this.graph[i][j]
}
if(i===j){
dist[i][j]=0
}
}
}
for (k = 0; k < length; k++) { //{2}
for (i = 0; i < length; i++) {
for (j = 0; j < length; j++) {
if (dist[i][k] + dist[k][j] < dist[i][j]) { //{3}
dist[i][j] = dist[i][k] + dist[k][j] //{4}
}
}
}
}
return dist;
}
下面是对算法过程的描述。
行{1}:首先,把dist数组初始化为每个顶点之间的权值,因为i到j可能的最短距离就
是这些顶点间的权值。
行{2}:通过k,得到i途径顶点0至k,到达j的最短路径。
行{3}:判断i经过顶点k到达j的路径是否比已有的最短路径更短。
行{4}:如果是更短的路径,则更新最短路径的值。
行{3}是Floyd-Warshall算法的核心。对本节开始的图执行以上算法,会得到如下输出:
其中,999代表顶点i到j的最短路径不存在。