算法思想 - 回溯算法

回溯思想

回溯算法的思想非常好理解,之前我们也使用回溯的思想完成了图的深度优先搜索。简单来说,回溯的思想是这样的:假设你在走迷宫,现在你站在一个分岔口,你不知道该向哪里走,所以你随机选择一个路口向前走,当你走到死胡同(或者已经走过的路)的时候,你知道这条路不对,于是你退回到上一个路口,选择另一条路再走。这样往复,直到找到出口。

适合使用回溯的问题

回溯算法适合解决这样一类问题:在一组数据中,我们有一个期望得到的解,在求解的过程中,我们可以有规律的枚举所有的解,过程中通过不断地回溯、剪枝,最终得到一个与条件最接近的解。

你能发现,回溯算法的应用场景和贪婪算法的应用场景很像,但是贪婪算法并不一定能求得最优解,而回溯虽然要枚举的量很大,但是可以找到最接近期待的解。

回溯的例子

八皇后(n皇后)问题

八皇后是回溯算法的招牌案例,它的描述如下:

我们有一个 8x8 的棋盘,希望往里放 8 个棋子(皇后),每个棋子所在的行、列、对角线都不能有另一个棋子。你可以看我画的图,第一幅图是满足条件的一种方法,第二幅图是不满足条件的。八皇后问题就是期望找到所有满足这种要求的放棋子方式。
八皇后.jpg

如何利用回溯思想扎到棋盘上的皇后排列呢?
我们把这个问题划分成 8 个阶段,依次将 8 个棋子放到第一行、第二行...第八行中。在放置的过程中,我们不停地检查当前的放法。如果满足要求,进入下一行的放置;如果不满足要求,就换一种放法,继续尝试。

下面是专栏老师给出的代码:

int[] result = new int[8];//全局或成员变量,下标表示行,值表示queen存储在哪一列
public void cal8queens(int row) { // 调用方式:cal8queens(0);
  if (row == 8) { // 8个棋子都放置好了,打印结果
    printQueens(result);
    return; // 8行棋子都放好了,已经没法再往下递归了,所以就return
  }
  for (int column = 0; column < 8; ++column) { // 每一行都有8中放法
    if (isOk(row, column)) { // 有些放法不满足要求
      result[row] = column; // 第row行的棋子放到了column列
      cal8queens(row+1); // 考察下一行
    }
  }
}

private boolean isOk(int row, int column) {//判断row行column列放置是否合适
  int leftup = column - 1, rightup = column + 1;
  for (int i = row-1; i >= 0; --i) { // 逐行往上考察每一行
    if (result[i] == column) return false; // 第i行的column列有棋子吗?
    if (leftup >= 0) { // 考察左上对角线:第i行leftup列有棋子吗?
      if (result[i] == leftup) return false;
    }
    if (rightup < 8) { // 考察右上对角线:第i行rightup列有棋子吗?
      if (result[i] == rightup) return false;
    }
    --leftup; ++rightup;
  }
  return true;
}

private void printQueens(int[] result) { // 打印出一个二维矩阵
  for (int row = 0; row < 8; ++row) {
    for (int column = 0; column < 8; ++column) {
      if (result[row] == column) System.out.print("Q ");
      else System.out.print("* ");
    }
    System.out.println();
  }
  System.out.println();
}

我自己使用python实现了这个功能,同时我还添加了一个扩展功能:将 八皇后 扩展为 n皇后的求解:

def queens(row, n=8, res=None):
    '''
    进行 n 皇后的求解,之后的注释默认 n = 8
    :param row: 当前所在行
    :param n: 输入 n 可求解 n皇后 问题,如果不输入,默认为 8皇后
    :param res: 当前 n皇后的保存,如果不输入,默认构造 8皇后的数组
    :return: None
    '''

    if res == None:
        res = [None for i in range(n)]  # 如果没有参数,默认构造 res[n] 的数组

    if row == n:  # 求解完成
        print_queens(res, n=n)  # 输出棋盘
        return

    for column in range(n):  # 求解没有完成,进行求解,对每个 row 进行 8 次迭代尝试
        if isOK(row, column, res, n=n):  # 如果放置的棋子符合规则,继续进行尝试,如果不符合规则,回溯(在这里是什么也不做)
            res[row] = column
            queens(row + 1, n=n, res=res)


def print_queens(res, n=8):  # 输出棋盘
    for i in res:
        p = [1 if i == j else 0 for j in range(n)]
        print(p)
    print('---------------------------------------------------')


def isOK(row, column, res, n=8):  # 判断当前棋子是否符合规则
    l = column - 1  # 用于判断左上方有没有棋子
    r = column + 1  # 判断右上方
    i = row - 1  # 判断上方

    while i >= 0:
        if res[i] == column:  # 上方有棋子
            return False
        if l >= 0:
            if res[i] == l:  # 左上方有棋子
                return False
        if r < n:
            if res[i] == r:  # 右上方有棋子
                return False

        l -= 1
        r += 1
        i -= 1

    return True


if __name__ == "__main__":
    r = queens(0, n=5)  # 默认进行 8皇后求解,你可以输入任意一个数 n

如果不理解计算机的工作过程,你很难理解回溯算法在计算机中的执行过程。如果你看不明白这段代码,那你最好自己复制这段代码到 pycharm 中设置程序断点自己看一看程序的函数调用栈。

0-1背包问题

我们有一个背包,背包总的承载重量是 Wkg。现在我们有 n 个物品,每个物品的重量不等,并且不可分割。我们现在期望选择几件物品,装载到背包中。在不超过背包所能装载重量的前提下,如何让背包中物品的总重量最大?

思路:我们可以将这个问题抽象化:总共有 n 个物品,面对每个物品我们有两个选择:放入背包 或者 不放入背包。这样,整个问题的所有可能性就是 2n(也就是这个问题的解空间)。我们尝试将某个物品放入背包:如果背包没有超重,就可以尝试再放一个物品;如果背包超重,就放弃这种操作。(实际上,在放弃这种操作的同时,你一并放弃了在执行这种操作之后的其它各种操作,这种方式叫做剪枝,剪枝是个非常有意思的东西,有机会我会写一下这个操作的含义)

专栏作者给出了如下的代码:

public int maxW = Integer.MIN_VALUE; //存储背包中物品总重量的最大值
// cw表示当前已经装进去的物品的重量和;i表示考察到哪个物品了;
// w背包重量;items表示每个物品的重量;n表示物品个数
// 假设背包可承受重量100,物品个数10,物品重量存储在数组a中,那可以这样调用函数:
// f(0, 0, a, 10, 100)
public void f(int i, int cw, int[] items, int n, int w) {
  if (cw == w || i == n) { // cw==w表示装满了;i==n表示已经考察完所有的物品
    if (cw > maxW) maxW = cw;
    return;
  }
  f(i+1, cw, items, n, w);
  if (cw + items[i] <= w) {// 已经超过可以背包承受的重量的时候,就不要再装了
    f(i+1,cw + items[i], items, n, w);
  }
}

我的python代码:

import random

def bag(cur_index, already_weight, weight, goods, goods_len,res):
    '''

    放物品函数,在这个函数中,会更改 max_w 的值,
    :param cur_index:当前物品的序号
    :param already_weight: 当前背包已经装装载的重量,注意,是已经装载的重量,也就是说不包括下标为 cur_index 的物品
    :param weight: 背包承重
    :param goods:所有物品的重量
    :param goods_len: 物品的数量
    :param res: 记录被放入背包的物品的重量
    :return:
    '''
    global max_w

    if already_weight == weight or cur_index == goods_len:#背包当前重量真好满足条件 或 已经取到了最后一个物品
        if already_weight > max_w :
            max_w = already_weight
            print('背包内有{},重量为{}'.format(res,sum(res)))
        return

    bag(cur_index + 1,already_weight,weight,goods,goods_len,res)#不装当前物品,already_weight不增大

    if already_weight + goods[cur_index] <= weight:#装当前物品,already_weight增加当前物品的重量
        x = res.copy()#记录背包里的物品
        x.append(goods[cur_index])
        bag(cur_index + 1,already_weight+goods[cur_index],weight,goods,goods_len,x)

if __name__ =='__main__':
    goods = [random.randint(0,50) for i in range(10)]
    print('所有物品的重量如下:',goods)
    max_w = max(goods)
    bag(0,0,145,goods,len(goods),[])
    print('背包最多可以装:',max_w)

正则匹配

正则表达式中,最重要的就是通配符,通配符结合在一起,可以表达非常丰富的语义。为了方便讲解,我假设正则表达式中只包含“”和“?”这两种通配符,并且对这两个通配符的语义稍微做些改变,其中,“”匹配任意多个(大于等于 0 个)任意字符,“?”匹配零个或者一个任意字符。基于以上背景假设,我们看下,如何用回溯算法,判断一个给定的文本,能否跟给定的正则表达式匹配?
我们依次考察正则表达式中的每个字符,当是非通配符时,我们就直接跟文本的字符进行匹配,如果相同,则继续往下处理;如果不同,则回溯。
如果遇到特殊字符的时候,我们就有多种处理方式了,也就是所谓的岔路口,比如“*”有多种匹配方案,可以匹配任意个文本串中的字符,我们就先随意的选择一种匹配方案,然后继续考察剩下的字符。如果中途发现无法继续匹配下去了,我们就回到这个岔路口,重新选择一种匹配方案,然后再继续匹配剩下的字符。

专栏作者的代码如下:

public class Pattern {
  private boolean matched = false;
  private char[] pattern; // 正则表达式
  private int plen; // 正则表达式长度

  public Pattern(char[] pattern, int plen) {
    this.pattern = pattern;
    this.plen = plen;
  }

  public boolean match(char[] text, int tlen) { // 文本串及长度
    matched = false;
    rmatch(0, 0, text, tlen);
    return matched;
  }

  private void rmatch(int ti, int pj, char[] text, int tlen) {
    if (matched) return; // 如果已经匹配了,就不要继续递归了
    if (pj == plen) { // 正则表达式到结尾了
      if (ti == tlen) matched = true; // 文本串也到结尾了
      return;
    }
    if (pattern[pj] == '*') { // *匹配任意个字符
      for (int k = 0; k <= tlen-ti; ++k) {
        rmatch(ti+k, pj+1, text, tlen);
      }
    } else if (pattern[pj] == '?') { // ?匹配0个或者1个字符
      rmatch(ti, pj+1, text, tlen);
      rmatch(ti+1, pj+1, text, tlen);
    } else if (ti < tlen && pattern[pj] == text[ti]) { // 纯字符匹配才行
      rmatch(ti+1, pj+1, text, tlen);
    }
  }
}

我的python代码:

class Pattern:
    def __init__(self, pattern):
        '''
        初始化模式串
        :param pattern: 模式串
        '''
        self.pattern = pattern
        self.plen = len(pattern)

    def match(self, text):
        '''
        匹配接口
        :param text: 主串
        :return:
        '''
        print('模式串为:{},等待匹配的字符串为{}'.format(self.pattern,text))
        self.matched = False
        self.rmatch(0, 0, text, len(text))
        return self.matched

    def rmatch(self, cur_text, cur_pattern, text, tlen):
        '''
        进行匹配
        :param cur_text: 当前主串的下标
        :param cur_pattern: 当前模式串的下标
        :param text: 主串
        :param tlen: 主串长度
        :return:
        '''
        # print('匹配中,主串:{},模式串:{}'.format(text[cur_text],self.pattern[cur_pattern]))
        # print(cur_text,cur_pattern,'-----',tlen,self.plen)
        if self.matched == True:#匹配已经完成,跳出函数
            return
        if cur_pattern == self.plen:#模式串匹配结束,注意这段代码需要放在匹配行为之前,因为此时的 cur_pattern 已经溢出了字符串
            if cur_text == tlen:#如果此时主串也匹配结束,匹配成功
                self.matched = True
            return

        if self.pattern[cur_pattern] == '*':#匹配到 * :把之后所有的主串位置都匹配一遍
            for i in range(tlen - cur_text):
                print(cur_text + i,cur_pattern + 1)
                self.rmatch(cur_text + i, cur_pattern + 1, text, tlen)

        elif self.pattern[cur_pattern] == '?':#匹配到 ?:主串移动 一步 或 零步
            self.rmatch(cur_text + 1, cur_pattern+1, text, tlen)
            self.rmatch(cur_text, cur_pattern+1, text, tlen)

        elif self.pattern[cur_pattern] == text[cur_text] and cur_text < tlen:#匹配到非通配符:向后移动
            self.rmatch(cur_text + 1, cur_pattern+1, text, tlen)

if __name__ == '__main__':
    x = Pattern('???b?d')
    r1 = x.match('aaabcd')
    print(r1)
    r2 = x.match('abcd')
    print(r2)

走迷宫问题

下面有一段代码,是我在以前学习中使用栈完成的深度优先走迷宫,由于年代久远,我就不做解释,想要了解的朋友可以自行百度。
注意,这段代码没有使用递归,如果你不理解,直接跳过也无妨。

maze = [
    [1,1,1,1,1,1,1,1,1,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,1,0,0,0,1,0,1],
    [1,0,0,0,0,1,1,0,0,1],
    [1,0,1,1,1,0,0,0,0,1],
    [1,0,0,0,1,0,0,0,0,1],
    [1,0,1,0,0,0,1,0,0,1],
    [1,0,1,1,1,0,1,1,0,1],
    [1,1,0,0,0,0,0,1,0,1],
    [1,1,1,1,1,1,1,1,1,1]
]

dirs = [lambda x, y: (x + 1, y),
        lambda x, y: (x - 1, y),
        lambda x, y: (x, y - 1),
        lambda x, y: (x, y + 1)]

def mpath(x1, y1, x2, y2):
    stack = []
    stack.append((x1, y1))
    while len(stack) > 0:
        curNode = stack[-1]
        if curNode[0] == x2 and curNode[1] == y2:
            #到达终点
            for p in stack:
                print(p)
            return True
        for dir in dirs:
            nextNode = dir(curNode[0], curNode[1])
            if maze[nextNode[0]][nextNode[1]] == 0:
                #找到了下一个
                stack.append(nextNode)
                maze[nextNode[0]][nextNode[1]] = -1  # 标记为已经走过,防止死循环
                break
        else:#四个方向都没找到
            maze[curNode[0]][curNode[1]] = -1  # 死路一条,下次别走了
            stack.pop() #回溯
    print("没有路")
    return False

mpath(1,1,8,8)

总结

回溯算法的思想非常简单,在大部分情况下,可以用来解决广义的搜索问题。即从一组可能的解中,找到一个最免租要求的解。
回溯算法有一个 探索-碰壁-回溯 的过程,所以可以利用栈实现,但是最简版的方法还是使用递归。
在回溯过程中,对解空间进行剪枝操作是一个非常有趣的操作,它可以提高搜索效率。
我们在上面已经举了多个利用回溯完成的代码,你可以细细琢磨一下。


以上就是回溯算法的全部内容

注:本文章的主要内容来自我对极客时间app的《数据结构与算法之美》专栏的总结,我使用了大量的原文、代码和截图,如果想要了解具体内容,可以前往极客时间

你可能感兴趣的:(算法思想 - 回溯算法)