4.1《算法图解》笔记——Chapter 6 Breadth-First Search

算法图解笔记——Chapter 6 Breadth-First Search
Author: Seven Zou
Email: [email protected]
Language: Python2.7


6 广度优先搜索

开始围绕“”概念展开学习,这里的,不涉及X轴和Y轴。图算法在实际应用中被广泛使用,广度优先搜索属于图算法的一种,明天将要学到的狄克斯特拉算法也是其中的一种。广度优先搜索可以让你能够找出两样东西之间的最短距离,不过对于最短距离的含义有很多种。这里的广度优先搜索可以完成如以下的最短距离

  • 编写国际跳棋AI,计算最少走多少步就可获胜;
  • 编写拼写检查器,计算最少编辑多少个地方就可以将错拼的单词改成正确的单词,如将READED改为READER需要编辑一个地方;
  • 根据你的人际关系网络找到关系最近的医生。

假定你居住在旧金山,要从双子峰前往金门大桥。你想乘公交车前往,并希望换乘最少。可选的公交车如下。
4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第1张图片
显然不能一步到达目的地,可选择“双子峰 -> 44路公交车 -> 28路公交车 -> 金门大桥”路线,当然还有其它可选路线,但它们需要4步。这是最为熟知的是最短路径问题(shortest-path problem)。你经常要找出最短路径,这可能是前往朋友家的最短路径,也可能是国际象棋中把对手将死的最小步数。解决最短路径问题的算法被称为广度优先搜索。


6.1 什么是图

图模拟一组连接,由节点(node)和边(edge)组成。一个节点可能与众多节点直接相连,这些节点被称为邻居。
假设Alex、Rama、Adit和Tom打牌,并要模拟互相的借贷关系。
如图表达出,Alex欠Rama钱,Tom欠Adit钱等,Rama是Alex的邻居,Adit不是Alex的邻居,因为他们不直接相连。但Adit既是Rama的邻居,又是Tom的邻居。
4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第2张图片


6.2 广度优先搜索

广度优先搜索是一种用于的查找算法,可帮助回答两类问题。(可类比第一章的二分查找)

  • 问题1:从节点A出发,有前往节点B的路径吗?
  • 问题2:从节点A出发,前往节点B的哪条路径最短?
    前面刚提到的计算最短路径问题,属于第二类问题(哪条路径最短?)。这里不再多叙述,下面来介绍第一类问题。
    假设你经营一个芒果农村,需要寻找芒果销售商,以便将芒果卖给他。在Facebook中,你与芒果销售商有联系吗?为此,你可在朋友中查找。
    4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第3张图片
    解决思路:首先,创建一个朋友名单。然后,依次检查名单中的每个人,查看他是否是芒果销售商。假设你没有朋友是芒果销售商,那么你就必须在朋友的朋友中查找,检查名单中的每个人能时,你都将其朋友加入名单。则会构成如下的人际关系网。
    4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第4张图片
    这样一来,不仅在自己的朋友中查找,还在朋友的朋友中查找。这种算法将搜遍整个人际关系网,直到找到芒果销售商。这就是广度优先搜索。
    那么谁又是关系最近的芒果销售商?这里可定义朋友时一度关系,朋友的朋友时二度关系。
    4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第5张图片
    在常规观念的优先级下,一度关系优于二度关系,二度关系优于三度关系,以此类推。广度优先搜索的逻辑便是如此,在其执行国过程中,搜索范围从起点开始逐渐向外延伸,即先检查一度关系,再检查二度关系。在查找芒果销售商过程中,便也先在一度关系中查找,再再二度关系中查找,因此找到的是关系最近的芒果销售商。广度优先搜索的特点在于不仅能查找从A到B的路径,还能找到的是最短的路径,而这是以按添加顺序查找时才能实现的。这里便引出一种新的数据结构——队列(queue)。
    队列的工作原理和现实生活中的队列完全相同。假设你与其他一起在公交车站排队候车,如果你排在他前面,你将先上车。队列的工作原理与此相同,队列类似于栈,你不能随机访问队列中的元素。队列支持入队出队两种操作。
    4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第6张图片
    如果你将两个元素加入队列,先加入的元素将在后加入的元素之前出队。因此可以使用队列来表示查找名单。这样,先加入的人将先出队并被检查。
    由此可以得出,队列与栈类似但不同,队列是一种先进先出(First In First Out, FIFO)的数据结构,而栈是一种后进先出(Last In First Out, LIFO)的数据结构。
    4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第7张图片

6.3 实现图

首先,需要使用代码来实现图。图由多个节点组成。每个节点都与邻近节点相连,可以利用上个章节学到的散列表来实现。散列表可以将键映射到值。那么就可以让节点映射到所以邻居。“{你} - > { AUCE、BOB、CLAIRE}”,代码如下:

graph = {}
graph["you"] = ["alice", "bob", "claire"]

这里的"you"被映射到了 graph["you"]这一数组,其中包含了"you"的所有邻居。则如表示人际关系网这样更大的图,代码可有。

# -*- coding: utf-8 -*-
graph = dict()
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["thom", "jonny"]
graph["anuj"] = []
# 可以尝试更换以下顺序 看一下效果
# graph["anuj"] = []
# graph["claire"] = ["thom", "jonny"]
graph["peggy"] = []
graph["thom"] = []
graph["jonny"] = []

print graph
Output1: {'thom': [], 'peggy': [], 'claire': ['thom', 'jonny'], 'jonny': [], 'anuj': [], 'you': ['alice', 'bob', 'claire'], 'bob': ['anuj', 'peggy']}
更换顺序:{'thom': [], 'peggy': [], 'claire': ['thom', 'jonny'], 'jonny': [], 'anuj': [], 'you': ['alice', 'bob', 'claire'], 'bob': ['anuj', 'peggy']}

由前一章所学散列表知识可知,散列表是无序的,因此添加"键-值"对的顺序无关紧要。
Anuj、Peggy、Thom和Jonny都没有邻居,这是因为虽然有指向他们的箭头,但没有从他们出发指向其他人的箭头,这被称为有向图(directed graph),其中的关系是单向的。因此,Anuj是Bob的邻居,但Bob不是Anuj的邻居。无向图(undirected graph)没有箭头,直接相连的节点互为邻居。则下图中是等价的。
4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第8张图片


6.4 算法实现

算法原理为:
4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第9张图片
更新队列时,使用的“入队”和“出队”还有"压入"和“弹出”。压入大致相当于入队,弹出大致相当于出队。
思路1:

# -*- coding: utf-8 -*-
from collections import deque
search_queue = deque()          # deque函数创建一个双端队列
search_queue += graph["you"]


def person_is_seller(name):     # 这个函数检查人的姓名是否以m结尾,如果是,他就是芒果销售商。
    return name[-1] == 'm'


while search_queue:             # 列表不为空
    person = search_queue.popleft()     # popleft返回队列左边的第一个
    if person_is_seller(person):        # 进行判断,用定义的函数
        print(person + " is a mango seller!")
    else:
        search_queue += graph[person]   # 不是的话继续递归
Output: thom is a mango seller!

思路2:思路1的执行过程为如下,为避免无限循环,更改代码如下。
4.1《算法图解》笔记——Chapter 6 Breadth-First Search_第10张图片
这个算法将不断执行,直到满足以下条件之一:

  • 找到一位芒果销售商;
  • 队列变成空,这意味着你的人际关系网中没有芒果销售商。
    在语句中需要加入考虑,检查一个人之前,要确认之前没检查过他。否则,就会陷入无限循环。可以使用一个列表来记录检查过的人。
# -*- coding: utf-8 -*-
from collections import deque


def person_is_seller(name):     # 这个函数检查人的姓名是否以m结尾,如果是,他就是芒果销售商。
    return name[-1] == 'm'


def search(name):
    search_queue = deque()          # 创建一个队列
    search_queue += graph[name]     # 将你的邻居都加入到这个搜索队列中 graph["you"]是一个数组
    searched = []                   # 这个数组用于记录检查过的人
    while search_queue:             # 只要队列不为空
        person = search_queue.popleft()                 # 就取出其中的第一个人
        if not person in searched:                      # 仅当这个人没检查过时才检查
            if person_is_seller(person):                # 检查这个人是否是芒果销售商
                print person + " is a mango seller!"    # 是芒果销售商
                return True
            else:
                search_queue += graph[person]   # 不是芒果销售商。将这个人的朋友都加入搜索队列
                searched.append(person)         # 将这个人标记为检查过
    return False                                # 如果到达了这里,就说明队列中没人是芒果销售商


search("you")
Output: thom is a mango seller!

广度优先搜索指出是否有从A到B的路径,如果有,广度优先搜索将找出最短路径;
类似寻找最短路径问题,可尝试使用来建模,再使用广度优先搜索来解决问题;
有向图中的边为箭头,箭头的方向指定了关系的方向;
无向图中的边不带箭头,其中的关系是双向的;
队列是FIFO,栈是LIFO;
需要按加入顺序检查搜索列表中的人,否则找到的就不是最短路径,因此搜索列表必须是队列;
对于检查过的人,不要再去检查,否则可能陷入无限循环。


Reference

[美]Aditya Bhargava/袁国忠, 算法图解, 北京:人民邮电出版社, 2017.3.


附个人Github地址: https://github.com/shiqi0404/Algorithm_Diagram,其中包括笔记、Code还有书本pdf版。

你可能感兴趣的:(算法图解)