算法图解笔记——Chapter 6 Breadth-First Search
Author: Seven Zou
Email: [email protected]
Language: Python2.7
开始围绕“图”概念展开学习,这里的图,不涉及X轴和Y轴。图算法在实际应用中被广泛使用,广度优先搜索属于图算法的一种,明天将要学到的狄克斯特拉算法也是其中的一种。广度优先搜索可以让你能够找出两样东西之间的最短距离,不过对于最短距离的含义有很多种。这里的广度优先搜索可以完成如以下的最短距离。
假定你居住在旧金山,要从双子峰前往金门大桥。你想乘公交车前往,并希望换乘最少。可选的公交车如下。
显然不能一步到达目的地,可选择“双子峰 -> 44路公交车 -> 28路公交车 -> 金门大桥”路线,当然还有其它可选路线,但它们需要4步。这是最为熟知的是最短路径问题(shortest-path problem)。你经常要找出最短路径,这可能是前往朋友家的最短路径,也可能是国际象棋中把对手将死的最小步数。解决最短路径问题的算法被称为广度优先搜索。
图模拟一组连接,由节点(node)和边(edge)组成。一个节点可能与众多节点直接相连,这些节点被称为邻居。
假设Alex、Rama、Adit和Tom打牌,并要模拟互相的借贷关系。
如图表达出,Alex欠Rama钱,Tom欠Adit钱等,Rama是Alex的邻居,Adit不是Alex的邻居,因为他们不直接相连。但Adit既是Rama的邻居,又是Tom的邻居。
广度优先搜索是一种用于图的查找算法,可帮助回答两类问题。(可类比第一章的二分查找)
首先,需要使用代码来实现图。图由多个节点组成。每个节点都与邻近节点相连,可以利用上个章节学到的散列表来实现。散列表可以将键映射到值。那么就可以让节点映射到所以邻居。“{你} - > { AUCE、BOB、CLAIRE}”,代码如下:
graph = {}
graph["you"] = ["alice", "bob", "claire"]
这里的"you"
被映射到了 graph["you"]
这一数组,其中包含了"you"
的所有邻居。则如表示人际关系网这样更大的图,代码可有。
# -*- coding: utf-8 -*-
graph = dict()
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["thom", "jonny"]
graph["anuj"] = []
# 可以尝试更换以下顺序 看一下效果
# graph["anuj"] = []
# graph["claire"] = ["thom", "jonny"]
graph["peggy"] = []
graph["thom"] = []
graph["jonny"] = []
print graph
Output1: {'thom': [], 'peggy': [], 'claire': ['thom', 'jonny'], 'jonny': [], 'anuj': [], 'you': ['alice', 'bob', 'claire'], 'bob': ['anuj', 'peggy']}
更换顺序:{'thom': [], 'peggy': [], 'claire': ['thom', 'jonny'], 'jonny': [], 'anuj': [], 'you': ['alice', 'bob', 'claire'], 'bob': ['anuj', 'peggy']}
由前一章所学散列表知识可知,散列表是无序的,因此添加"键-值"对的顺序无关紧要。
Anuj、Peggy、Thom和Jonny都没有邻居,这是因为虽然有指向他们的箭头,但没有从他们出发指向其他人的箭头,这被称为有向图(directed graph),其中的关系是单向的。因此,Anuj是Bob的邻居,但Bob不是Anuj的邻居。无向图(undirected graph)没有箭头,直接相连的节点互为邻居。则下图中是等价的。
算法原理为:
更新队列时,使用的“入队”和“出队”还有"压入"和“弹出”。压入大致相当于入队,弹出大致相当于出队。
思路1:
# -*- coding: utf-8 -*-
from collections import deque
search_queue = deque() # deque函数创建一个双端队列
search_queue += graph["you"]
def person_is_seller(name): # 这个函数检查人的姓名是否以m结尾,如果是,他就是芒果销售商。
return name[-1] == 'm'
while search_queue: # 列表不为空
person = search_queue.popleft() # popleft返回队列左边的第一个
if person_is_seller(person): # 进行判断,用定义的函数
print(person + " is a mango seller!")
else:
search_queue += graph[person] # 不是的话继续递归
Output: thom is a mango seller!
思路2:思路1的执行过程为如下,为避免无限循环,更改代码如下。
这个算法将不断执行,直到满足以下条件之一:
# -*- coding: utf-8 -*-
from collections import deque
def person_is_seller(name): # 这个函数检查人的姓名是否以m结尾,如果是,他就是芒果销售商。
return name[-1] == 'm'
def search(name):
search_queue = deque() # 创建一个队列
search_queue += graph[name] # 将你的邻居都加入到这个搜索队列中 graph["you"]是一个数组
searched = [] # 这个数组用于记录检查过的人
while search_queue: # 只要队列不为空
person = search_queue.popleft() # 就取出其中的第一个人
if not person in searched: # 仅当这个人没检查过时才检查
if person_is_seller(person): # 检查这个人是否是芒果销售商
print person + " is a mango seller!" # 是芒果销售商
return True
else:
search_queue += graph[person] # 不是芒果销售商。将这个人的朋友都加入搜索队列
searched.append(person) # 将这个人标记为检查过
return False # 如果到达了这里,就说明队列中没人是芒果销售商
search("you")
Output: thom is a mango seller!
广度优先搜索指出是否有从A到B的路径,如果有,广度优先搜索将找出最短路径;
类似寻找最短路径问题,可尝试使用图来建模,再使用广度优先搜索来解决问题;
有向图中的边为箭头,箭头的方向指定了关系的方向;
无向图中的边不带箭头,其中的关系是双向的;
队列是FIFO,栈是LIFO;
需要按加入顺序检查搜索列表中的人,否则找到的就不是最短路径,因此搜索列表必须是队列;
对于检查过的人,不要再去检查,否则可能陷入无限循环。
[美]Aditya Bhargava/袁国忠, 算法图解, 北京:人民邮电出版社, 2017.3.
附个人Github地址: https://github.com/shiqi0404/Algorithm_Diagram,其中包括笔记、Code还有书本pdf版。