笨牛慢耕

Tic-Tac-Toe：基于Minimax算法的人机对弈程序（python实现）

1. 前言

2. Minimax算法介绍

2.1 博弈树

2.2 估值函数

2.3 基本算法思想

2.4 实例1

2.5 实例2—棋类游戏

2.6 小结

3. Tic-Tac-Toe minimax AI实现

3.1 函数说明

3.2 处理流程

3.3 代码

4. 小结

1. 前言

在上一篇中实现一个简单的Tic-Tac-Toe人机对弈程序。参见：

Tic-Tac-Toe人机对弈程序（python实现）_笨牛慢耕的博客-CSDN博客前面几篇博客（以循序渐进的方式）实现了Tic-Tac-Toe游戏的棋局搜索、遍历以及所有可能棋局数和盘面状态数的计算，参见：本文先实现一个简单的Tic-Tac-Toe人机对弈程序，为下一步实现基于minimax算法的Tic-Tac-Toe人机对弈程序做一个准备。https://blog.csdn.net/chenxy_bwave/article/details/128555550 其中计算机棋手或者说AI棋手除了在下一步能够使自己获胜或者阻止对手取胜外，就只是随机落子了。本文更进一步引入经典的经典的对抗性博弈算法minimax算法来为AI棋手加持。

2. Minimax算法介绍

2.1 博弈树

解决博弈类问题的一般方法是将游戏状态组织成一棵树，树的每一个节点表示一种状态（比如说棋类游戏中的棋盘盘面状态），而父子关系表示由父节点经过一步可以到达子节点。边则用于表示动作。

Minimax也不例外，以棋类游戏为例，树形结构的奇数层（初始状态、即根节点所在层为第1层）表示轮到先手方下棋；偶数层则轮到后手方下棋的状态。Minimax就是针对这个树形结构进行搜索最优解的算法。奇数层称为极大值（己方）层（简称max层，其中的节点则称为max节点），偶数层称为极小值（对方）层（相应地，min层，min节点）。

2.2 估值函数

估值函数用来给每一个局面给出一个估值，用于判断博弈树中当前局面的形势。在传统的棋类游戏智能系统中，估值函数一般是人为指定的，对棋类游戏智能的水平有决定性作用。

估值函数的形式不是固定的，它的输入一般是一个局面的信息，输出是一个表明相应局面好坏程度的数值，比如说胜率之类的。

比如说，在井字棋中估值函数的1个例子：玩家X还存在可能性的行、列、斜线数减去玩家O还存在可能性的行、列、斜线数。如下图所示，玩家X还存在可能性的行、列、斜线数为6，玩家O还存在可能性的行、列、斜线数为3，因此估值函数在图3局面下的输出为3。当然也可以是两个数的比值，或者别的什么函数关系。。。

以上这个例子可以成为井字棋的一种启发式估值函数。估值函数也可以来自蒙特卡洛仿真，即通过大量的随机仿真，统计从某个局面出发所有可能的棋局中的胜负结果，由此来决定该局面的评分（价值估计）。

游戏或者棋局的终局局面的价值估计就相对简单一些，通常可以直接进行启发式的定义。

2.3 基本算法思想

Minimax算法（中文译名为极小化极大算法）常用于棋类等由两方较量的游戏的智能搜索算法。该算法是一个零和（zero-sum）算法，即站在游戏的一方来看，自己要在可选的选项中选择将己方优势最大化的选择；而对手则要选择令己方优势最小化的方法。在两人棋类游戏中，例如五子棋、象棋、国际象棋、井字棋（tic-tac-toe）、围棋，由两个player交替走棋，每次走一步。这些游戏的智能程序的开发就可以用到Minimax算法。

举个例子，两个人下棋。当前该下棋的一方（称为己方或我方，与之相对的玩家称为对手方）的下一手棋有N种选择： $a1,a2,\cdots,a_N$ ，分别导致己方的胜率分别为 $p1,p2,\cdots,p_N$ 。那己方的选择自然应该是：

$\arg\max \limits_{i} p_i$

反之，轮到对手方下棋时自然就是要选择能够使得己方的胜率最小化（由于是零和游戏，己方胜率最小化自然就对应着对手方胜率最大化）的落点或者招法。

Minimax是一种悲观算法，它假设对手具有完美决策能力，对手每一步都会从当前局面将我方引入理论上胜率最小的盘面状态。己方策略则应该是选择那些对方所能达到的让我方最差情况中最好的，也就是让对方在完美决策下所对己方造成的损失最小。具体一点说，假设当前盘面状态下，己方有N种选择： $a1,a2,\cdots,a_N$ ，分别导致 $s_1,s_2,\cdots,s_N$ 的盘面状态。在各状态下，对手方采取最优策略(针对每个都下出使得己方胜率最小—损失最大—的棋)下导致己方的胜率分别为 $p1,p2,\cdots,p_N$ ，则己方应该选择的着法由 $\arg\max \limits_{i} p_i$ 决定.

2.4 实例1

本例取自参考博客[2]。

现在考虑这样一个游戏：有三个盘子A、B和C，每个盘子分别放有三张纸币。A放的是1、20、50；B放的是5、10、100；C放的是1、5、10。游戏参与者为甲、乙两人，三个盘子的信息对于两人都是完全可见的。游戏分三步：

甲从三个盘子中选取一个。
乙从甲选取的盘子中拿出两张纸币交给甲。
甲从乙所给的两张纸币中选取一张。

游戏中，甲的目标是最后拿到的纸币面值尽量大，乙的目标是让甲最终拿到的纸币面值尽量小（注意，这里，乙的目标并不是自己最后拿到的面值最大化！如果游戏目标改为使乙获得的面值最大化或者最小化，或者说使得甲所获得的面值最小化，则成了另外的三个游戏，所得的解是不同的）。

基于minimax算法对以当前节点为根的游戏状态节点树进行搜索来确定下一步的选择的处理步骤如下：

（1）根据游戏规则（甲、乙双方交替动作）构建状态节点树；

（2）确定各底层叶子的价值

（3）从底层叶子开始由底向上根据minimax原则进行节点价值更新

（4）基于根节点的节点价值更新决策（即选择子节点中最大值）决定当前状态下的下一步

这种基于minimax原则构建出来的搜索树可以称为minimax（搜索、博弈决策）树。

本问题中，每个节点的价值定义是显而易见的，可以定义为游戏从该节点所表示的状态出发在最优情况下甲可以得到的面值。在max层要使得节点价值最大化，而min层则要使得节点价值最小化。

下图是上述示例问题的状态树：

站在甲的角度来考虑。其中正方形节点表示轮到我方（甲）操作，而三角形表示轮到对方（乙）操作。经过三轮动作后（我方-对方-我方），到达终局状态（表示终局状态的节点由于是叶子节点，所以不需要做MIN/MAX区分）。黄色叶结点表示所有可能的结局。从甲方看，由于最终的收益可以通过纸币的面值评价，我们自然可以用终局时甲方拿到的纸币面值表示终局状态的价值。

下面考虑倒数第二层节点，这一层是所谓的极大值层，即轮到甲方选择操作，选择的结果应该是使得节点的价值最大化。即每个节点的价值为其各子节点价值的最大值，由此可得该层的价值如下所示：

倒数第三层为极小值层，轮到乙方选择。如前所述，乙方选择的目的是使得节点价值最小化，因此这些节点的价值取决于子节点的最小值。

最后，根节点是max节点，因此价值取决于叶子节点的最大值。最终完整赋值的minimax树如下所示：

由此可见，该游戏的结果是甲可以得到面值为20的纸币。其前提是游戏双方均有完美决策能力。在实际对弈等游戏中，游戏参与者可能没有完美决策能力，有一定概率会做出非最优的选择，这种情况下的游戏就会出现更多更丰富的变化。

在本示例问题可能的状态数非常少，因此可以通过暴力枚举的方式给出完整的状态树。这种情况下可以基于Minimax算法得出全局最优解。在现实世界的问题中，状态树通常非常庞大，即使是计算机也难以或者不可能给出完整的树，这种情况下往往需要限定搜索深度，所得到的解为局部最优解，可能会与全局最优解有所偏差。

2.5 实例2—棋类游戏

本例取自参考博客[3]。

以下以两人对战的棋类游戏为例来说明。

前面说过，基于树的搜索问题的首要关键点是节点价值（函数）的定义。

在以上的例子中是直接以甲可以得到的纸币面值作为各节点的价值。而且，由于只有三个回合（注意，本文中回合对应一手棋，而不是各下一手），所以可以合理地假定游戏双方都可以向前计算三步直到游戏结果（look ahead to the end of game）。这意味着游戏双方一开始就知道完整的minimax树。

在棋类游戏中，棋局的最终结果只有（站在其中一方来看）胜和负两种结果，所以，很自然地，终局状态节点可以考虑用{1,0, -1}来表示{胜，平，负}用作节点的价值函数。但是棋局中间状态的价值估计就要更复杂一些，一般来说可以用胜率（在很难或者无法确认每个节点的胜负情况下，通常与蒙特卡洛方法结合）来定义价值函数，或者别的启发式方法—这是后话，以后再讨论。

除了胜负结果以外，还可以考虑其它的特征用于节点价值的定义。以下假设节点价值估计函数已经定义好了。

进一步，即便以Tic-Tac-Toe（3x3井字棋）这样简单的游戏来说，最长可能需要9个回合。这样所导致搜索树的深度最多为10，再考虑到branching factor，这种规模的树（上一篇我们得出了Tic-Tac-Toe总共有26830种棋局的结果了）已经超出了绝大多数人类的大脑计算能力了（当然对于计算机来说这个仍然是轻而易举的）。所以，对于非完美player（比如说正常的人类棋手）来说，假定计算深度（the steps of looking-ahead）是有限的（小于最大棋局步数）是一个合理的假设。

基于以上假设在棋局对弈过程大抵可以描述如下。

首先，考虑最简单的情况，假设棋手只能向前看一步（计算深度为1，looking ahead by 1 step）。这种情况下：轮到甲方（先手方，即当前为max层）下棋时，棋手基于当前局面确定自己可能走的下一步棋，预测了自己走完这一步的所有可能的局面，然后针对各个局面进行价值评估（这里假定价值评估是可能的，是否合理或者最优是另外一个问题），然后从中选择其中价值最大者（换言之使得先手方胜率最低）所对应的走法。轮到乙方（对手方，后手方）下棋时，乙方也预测了自己走完这一步的所有可能的局面，然后也选择了所有走法中局面看起来最好的（价值函数最小的，换言之使得先手方胜率最低）走法。如此循环往复，直到最后游戏结束。注意，由于假定双方的计算深度只有一步，因此各自决定自己下一手走哪儿时，只考虑了自己可选的落点所导致的局面，并没有考虑对手方针对自己的落点的应手。

考虑对弈双方的计算深度为2，情况会怎么样呢？

轮到甲方（先手方，即当前为max层）下棋时，先手预测了自己走完这一步的所有可能局面{ $s1,s2,\cdots,s_K$ }，进一步预测了对手针对每种局面的所有可能应对方案得到所有可能的局面为{{ $s_{11},s_{12},\cdots,s_{1,M_1}$ }, { $s_{21},s_{22},\cdots,s_{2,M_2}$ }, ..., { $s_{k,1},s_{k,2},\cdots,s_{k,M_k}$ }}。考虑先手方是要使得盘面状态价值最大，而后手方是要使得盘面状态价值最小，因此先手方的决策过程如下图所示，由此得出最优的k_opt如图中所示。

轮到后手方走也是如此，只不过是反过来的，后手方的决策方程为：

通俗一点说，就是：我猜到了我这么走，你会怎么走，所以我选择这么走。

如果双方的计算深度为3的话，情况就更加复杂了：先手预测了自己走完这一步的所有可能局面，并同时预测了对手的所有应对方案，还同时又想到了自己在面对对手的每种应对方案时的所有可能走法，然后从中选择一个最优的。后手也是如此。也就是，我猜到了我这么走你会那么走然后我会那么那么走，所以我选择这么走。。。

我们用正方形来代表max层节点（即轮到先手方行棋，行棋目标是使当前节点价值最大化），圆形来代表min层节点（即轮到后手方行棋，行棋目标是使当前节点价值最小化）。叶子节点代表终局状态，有对应的预设的价值（比如说，用1代表赢棋，-1或者0代表输棋）。

假设对弈棋手计算深度为4，即可以向前看4步，则先手看到的一个部分博弈树（“部分”是因为还没有到达终局）的示例如下所示则我们假设棋局的博弈树如下(往后看4步)。根据这个博弈树（我们假定已知这个博弈树的“叶子”节点的价值估计），先手在当前状态下应该如何选择呢：

首先，先手应该计算后手在第四步的时候所得到的各种局面的价值估计（启发式或者别的什么方式来确定。因为这是部分搜索树的叶子节点，所以不是基于子节点价值进行min/max估计），如下图（最底下一层）：

然后先手再计算自己在第三步时应该如何选择（即从所有子节点中选择最大的），如下图（红色字体）：

然后先手再计算后手在第二步时应该如何选择（即从所有子节点中选择最小的），如下图（红色字体）：

最后先手就可以当前局面下下一步应该怎么走了（即从所有子节点中选择最大的），如下图（根节点）：

所以，如果先后手都进行最优决策的话，棋局的走向则下图所示（红线）：

当然，如果后手不是进行最优决策的话，棋局的走向就不一定是这样的了，先手也可以尝试走有风险但是可能收益更高的局面（类似于“骗招”性质的招法。骗招中的“骗”意味着假定对手不能进行最优决策，这样可以得到比双方都下最优招法能得到更大的便宜。但是一旦对手识破了骗招而下出了最优招法，那下骗招一方反而会招致更大的损失），这就不在我们的讨论范围之内了。以上讨论可以看到，按照MiniMax算法来进行决策的话，需要的计算量是随着计算深度（向前看的步数）的增加而呈指数级增长的。计算深度越大自然棋力就越高，胜率越高。但是，这些状态中其实是包含很多不必要的状态的，所以我们可以通过剪枝操作进行优化。

2.6 小结

总结一下Minimax算法的要点：

确定最大搜索（计算）深度D，经过深度为D的minimax搜索的构建，可能达到终局，也可能只能到达一个中间状态。对于简单问题可以直接从游戏初始状态出发构建出完整的minimax搜索树，但是真实问题一般无法构造出完整的状态树，所以需要确定一个最大深度D，每次最多从当前状态向下计算D层。
基于当前状态（以当前状态节点为根节点）构建深度为D+1的部分搜索树（也称博弈决策树）
针对该部分搜索树的叶子节点进行价值估计（使用预定义的价值估计值，或者。。。。比如说，实际对弈过程中，人类棋手根据经验和棋感对局面进行胜率评估）
自底向上为非叶子节点赋值。其中max节点取子节点最大值，min节点取子节点最小值。根节点赋值完毕后即完成了minimax搜索树的构建

根节点赋值的决策自然就决定当前状态下的下一手，从根结点选择子节点中价值最大的分支，作为行动策略。下图所示为Tic-Tac-Toe游戏中一个可能的minimax搜索树的样子[3]：

Tic-Tac-Toe游戏的一个minimax搜索树例

如果可以从游戏初始状态出发构建出完整的minimax搜索树，则minimax算法可以给出全局最优解。这种情况可以称为complete-minimax。

在搜索深度有限（小于完整的游戏所需要的步数），只能构建出部分minimax搜索树（这个称为partial-minimax），所得到的解可以看作是一个局部最优解。搜索深度越大越可能找到更好的解，但计算耗时会以指数的方式膨胀。在搜索深度有限的条件下，Minimax算法的应用一般是边对弈、边计算局部minimax搜索树，类似于sliding-window的工作方式。

3. Tic-Tac-Toe minimax AI实现

以下代码是基于上一篇（Tic-Tac-Toe人机对弈程序（python实现））中的代码进行改进的。主要是追加了由函数nextMove_complete_minimax()实现的minimax AI agent。以及其它一些相关联的修改，和一些代码优化，详细参见以下代码中的说明。

3.1 函数说明

函数原型：nextMove_complete_minimax (board, isMax, player)

【Input】

board：当前盘面状态。

isMax：当前层是MAX层还是MIN层。注意，是站在当前玩家的角度来看。在递归调用时要注意切换。

player：轮到行棋的当前玩家。

【Ret】

bestMove：对于当前玩家来说的最佳下一手

bestScore：下完bestMove后的局面的评分（价值估计）

3.2 处理流程

3.3 代码

# Tic Tac Toe
# Created by chenxy in 2017-06-23, with only drawBoard() copied from <>
# 2023-01-04 refined,rev0
# 2023-01-07 refined,rev1
#  (1) Add minimax AI agent, nextMove_complete_minimax()
#  (2) askGameStart() updated to support AI agent selection
#  (3) gameRole --> GAME_ROLE, used as global constant
#  (4) askNextMove() renamed to naiveAiNextMove(), in contrast with minimax-AI
#  (5) Main program updated in accordance with the added minimax AI
#  (6) Other miscellaneous editorial refinement
# 2023-01-07 rev2
#  (1) Correct a bug in gameJudge()
#  (2) Add layer parameter for the convenience of debug
#  (3) Refine the debug message print， with DEBUG for switch on/off debug msg print
import random
import sys

GAME_ROLE = ['A','H']; # 'A': AI;  'H': Human;
DEBUG     = 0

def drawBoard(board, initFlag = 0):
    # This function prints out the board that it was passed.

    brd_copy = board.copy()
    if initFlag:
        brd_copy = ['0','1','2','3','4','5','6','7','8','9']

    # "board" is a list of 10 strings representing the board (ignore index 0)
    print('=============')
    # print('   |   |')
    print(' ' + brd_copy[7] + ' | ' + brd_copy[8] + ' | ' + brd_copy[9])
    # print('   |   |')
    print('-----------')
    # print('   |   |')
    print(' ' + brd_copy[4] + ' | ' + brd_copy[5] + ' | ' + brd_copy[6])
    # print('   |   |')
    print('-----------')
    # print('   |   |')
    print(' ' + brd_copy[1] + ' | ' + brd_copy[2] + ' | ' + brd_copy[3])
    # print('   |   |')
    print('=============')
    print()

def askGameStart():
    # Ask human start a game or not;
    # print('Do you want to start a game? Y or y to start; Others to exit');
    # inputWord = input().lower();
    # if inputWord.startswith('y'):
    #     startNewGame = True;
    # else:
    #     startNewGame = False;

    print('Start a new game? Press 1 to start; Others to exit');
    cmd = input()
    if cmd.isdigit():
        inputWord = int(cmd);
        if inputWord == 1:
            startNewGame = True;
        else:
            startNewGame = False;
    else:
        startNewGame = False;
        
    aiAlgo = 0
    if startNewGame:    
        print('Please select the AI agent to fight with: [1] Unbeatable minimax AI; [0] naive AI(default);');
        cmd = input()
        if not cmd.isdigit():
            aiAlgo = 0
        else:        
            if int(cmd)==1:
                aiAlgo = 1

    return startNewGame, aiAlgo

# Decide whether the number human input for the next move has been already used or not.
# It can be decided by whether the corrsponding element is empty or not.
def isValidInput(board, humanNextMove):
    isValid = 1;
    if humanNextMove == 0:
        print('Please input 1~9, 0 is not an valid input for the next move!');
        isValid = 0;
    elif board[humanNextMove] != ' ':
        print('The space has already been used! Please select an empty space for the next move');
        isValid = 0;    
    return(isValid);    

# Ask the human player for the next move.
def askHumanNextMove(board):
    while True:
        print('Please input the next move!');
        c = input()
        if not c.isdigit():
            print('Invalid input! Please input [1-9]!');
            continue
        nextMove = int(c);
        if board[nextMove] == ' ':
            break;
        else:
            print('Stone already in this grid! Please input again!');
            continue;
    isValid = isValidInput(board, nextMove)
    return isValid,nextMove
        
def gameRsltDisplay(winner):    
    if   'A' == winner:
        print('AI win!');
    elif 'H' == winner:
        print('Human win!');
    else:    
        print('A tie game!');        

# Decide AI's next move.
# Decide whether the three input are all the same
def isTripleGoalReachedNext(board, idx1, idx2, idx3, role):
    in1 = board[idx1];
    in2 = board[idx2];
    in3 = board[idx3];
    
    if   in1 == ' ' and in2 == in3 and in2 == role:
        return idx1;
    elif in2 == ' ' and in1 == in3 and in3 == role:
        return idx2;
    elif in3 == ' ' and in1 == in2 and in1 == role:
        return idx3;
    else:
        return 0;   # Invalid space index.

def isGoalReachedNext(board, player):

    nextMove        = 0;
        
    nextMove  = isTripleGoalReachedNext(board, 1, 4, 7, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 1, 2, 3, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 1, 5, 9, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 2, 5, 8, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 3, 5, 7, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 3, 6, 9, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 4, 5, 6, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove
    nextMove  = isTripleGoalReachedNext(board, 7, 8, 9, GAME_ROLE[player]);
    if nextMove > 0:
        return True, nextMove

    return False, nextMove;
    
def naiveAiNextMove(board):

    # Temporarily, select the first empty space.
    # 1. First, check whether AI will reach the goal in the next step.
    #    GAME_ROLE[0] represents AI's role.
    goalReachedNext, nextMove = isGoalReachedNext(board, 0);
    
    if goalReachedNext == True:
        return nextMove;

    # 2. Secondly, check whether Human will reach the goal in the next step.
    #    GAME_ROLE[1] represents Human's role.
    #    Of course, AI should take the next move to blocking Human player to reach the goal.
    goalReachedNext, nextMove = isGoalReachedNext(board, 1);
    
    if goalReachedNext == True:
        return nextMove;
        
    # Randomly selected from the left spaces for the next move.
    spaces = []
    for k in range(1,10):    
        if board[k] == ' ':
            spaces.append(k)
        else:
            continue;
    nextMove = random.choice(spaces)
    
    return(nextMove);

def nextMove_complete_minimax(board, isMax, player, layer):
    '''
    Minimax algorithm for tic-tac-toe
    Decide the next move according to complete minimax algorithm for the current player
    board: Current board status, char array of 10 elements, ignoring [0]
    isMax: Is this eithe MAX of MIN layer for the current player
        True:  MAX layer
        False: MIN lafyer
    player: int
        0: Player represented by GAME_ROLE[0]
        1: Player represented by GAME_ROLE[1]
    '''
    if DEBUG:
        print('{0}Enter minimax(): board={1}, isMax={2}, player={3}'.format(layer*'+',board,isMax,player))
    
    bestScore = -1000 if isMax else 1000
    nextPlayer = 1 if player==0 else 0
    bestMove = 0
    
    # game over judge
    gameOver, winner = gameJudge(board)    
    if gameOver:
        if winner == ' ': # DRAW or TIE game           
            bestScore = 0
            if DEBUG:
                print('{0}GameOver: winner={1}, bestMove={2}, bestScore={3}'.format(layer*'+',winner,bestMove,bestScore))     
            return bestMove,bestScore
        else:
            # If it is the end of game, then it must be the win of the opponent.
            bestScore = (-1 if isMax else 1)
            if DEBUG:
                print('{0}GameOver: winner={1}, bestMove={2}, bestScore={3}'.format(layer*'+',winner,bestMove,bestScore))      
            return bestMove,bestScore

    for k in range(1,10):    
        if board[k] == ' ':
            board[k] = GAME_ROLE[player]
            move, score = nextMove_complete_minimax(board, (not isMax), nextPlayer, layer+1)
            board[k] = ' ' # Recover board status
            if isMax:
                if score > bestScore:
                    bestScore = score
                    bestMove  = k            
            else:
                if score < bestScore:
                    bestScore = score        
                    bestMove  = k              
    if DEBUG:                
        print('{0}Exit minimax(): bestMove={1}, bestScore={2}'.format(layer*'+',bestMove,bestScore))                    
    return bestMove, bestScore

# Decide whether the three input are all the same
def isTripleSame(in1, in2, in3):
    if in1 == ' ' or in2 == ' ' or in3 == ' ':
        return False
    elif in1 == in2 and in1 == in3:
        return True
    else:
        return False

def gameJudge(board):
    if   isTripleSame(board[1],board[4],board[7]):
        gameOver = True;        winner   = board[1];
    elif isTripleSame(board[1],board[2],board[3]):    
        gameOver = True;        winner   = board[1];
    elif isTripleSame(board[1],board[5],board[9]):        
        gameOver = True;        winner   = board[1];
    elif isTripleSame(board[2],board[5],board[8]):        
        gameOver = True;        winner   = board[2];
    elif isTripleSame(board[3],board[5],board[7]):        
        gameOver = True;        winner   = board[3];
    elif isTripleSame(board[3],board[6],board[9]):        
        gameOver = True;        winner   = board[3];
    elif isTripleSame(board[4],board[5],board[6]):        
        gameOver = True;        winner   = board[4];
    elif isTripleSame(board[7],board[8],board[9]):        
        gameOver = True;        winner   = board[7];
    elif ' ' in board[1:10]:     
        gameOver = False;       winner   = ' ';
    else:
        gameOver = True;        winner   = ' ';
            
    return gameOver, winner
    
whoseTurn = 0;         #  0 : AI's turn;   1:  Human's turn.
board     = [' ']*10;  #  Note: '*' for string means concatenation.

drawBoard(board,1); # Draw the initial board with numbering

while True:
    startNewGame, aiAlgo = askGameStart()
    if not startNewGame:
        print('Bye-Bye! See you next time!');
        sys.exit();
    else:
        ai_agent_msg = \
            'Naive AI, try to win it' \
            if aiAlgo==0 else \
            'Unbeatable minimax-AI, believe it or not, you cannot win absolutely!'
        print('You will fight with: ', ai_agent_msg);
    
    # Initialization.
    gameOver = 0;
    board    = [' ',' ',' ',' ',' ',' ',' ',' ',' ',' '];
    # Decide who, either human or AI, play first.
    # 0: AI; 1: human.
    print('Who play first? [0: AI; 1: human; 2: guess first]');
    cmd = input()
    if not cmd.isdigit():
        whoseTurn = random.randint(0,1);
    else:
        if int(cmd)==0:
            whoseTurn = 0
        else:
            whoseTurn = 1    

    while(not gameOver):    
        if whoseTurn == 0:
            print('AI\'s turn')
            if aiAlgo == 0:
                nextMove = naiveAiNextMove(board);
            else:
                layer = 9 - board.count(' ')
                nextMove, score = nextMove_complete_minimax(board,True,0,layer)
                print('nextMove = {0}, score = {1}'.format(nextMove, score))
            board[nextMove] = GAME_ROLE[0];
            whoseTurn = 1;
        else:
            print('Human\'s turn')
            isValid  = 0;
            while(not isValid):
                isValid, nextMove = askHumanNextMove(board);
            board[nextMove] = GAME_ROLE[1];
            whoseTurn = 0;

        drawBoard(board);               
        gameOver,winner = gameJudge(board);     
    
    gameRsltDisplay(winner);

4. 小结

以上实现的是一个完全minimax的算法，即每一步都执行minimax搜索到棋局结束，这样得到的全局最优解。这样的得到minimax-AI在Tic-Toe-Tac是不可战胜（unbeatable），无论是先手还是后手。但是由于Tic-Toe-Tac非常简单，如果对弈双方都是完美决策，则肯定会得到平局。所以，两个这样的AI对战总是会得到平局。

对于复杂一点的游戏，完全minimax搜索是不可行的。这时必须实现有限深度的搜索。接下来考虑面向有限深度minimax搜索的改造，以及进一步采用alpha-beta剪枝的方式来降低搜索复杂度以对付更为复杂的两人对战的游戏（零和对抗性博弈问题）。

2023-01-07 20:11 Correct a bug in gameJudge().

[Reference]

[1] 人工智能算法图解，清华大学出版社

[2] Minimax算法_PG-aholic的博客

[3] 最清晰易懂的MinMax算法和Alpha-Beta剪枝详解

[4] 极小化极大（Minimax）算法原理

你可能感兴趣的:(人工智能,算法,Minimax,Tic-Tac-Toe,python)

cryptography，一个神奇的 Python 库！ Sitin涛哥 Python python 开发语言
更多资料获取个人网站：ipengtao.com大家好，今天为大家分享一个神奇的Python库-cryptography。Github地址：https://github.com/pyca/cryptography在当今数字化时代，信息安全越来越受到重视。数据加密是保护数据安全的重要手段之一，而Python的cryptography库提供了丰富的功能来支持各种加密算法和协议。本文将深入探讨crypto
深度讨论Python for循环观智能 python 开发语言
作者的其他文章推荐：强化学习再受关注！for循环使用于遍历可迭代对象的Python语句，工作原理如下：#for循环foriteminiterable:print(item)#等价于iterator=iter(iterable)#获取迭代器whileTrue:try:item=next(iterator)#获取下一个元素print(item)exceptStopIteration:break#迭代结
Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Python第六章07：元组的定义和操作苹果.Python.八宝粥 python 前端开发语言
#tuple元组的定义和操作#tuple元组定义用小括号：(1,2,3,4,5),可以是不同类型元素#给变量定义元组时，写括号不写tuple：a=(1,2,3,4,5)#变量=（）变量=tuple（）空元组变量#tuple元组定义完成后，不可以修改，但是，如果元组中嵌套了一个列表时，元组中列表的内容可以修改#封装数据后，不希望被篡改数据，就使用元组tuple#1.定义一个元组t1=("halibo
Leetcode-100 贪心算法 LuckyAnJo leetcode leetcode 贪心算法算法
贪心算法简介贪心算法（GreedyAlgorithm）是一种常见的优化算法，用于解决最优化问题。该算法的核心思想是每次选择当前情况下的最优解，并期望通过这些局部最优解得到全局最优解。贪心算法通常用于那些可以分解为若干个子问题，且每个子问题的最优解可以合成全局最优解的问题。贪心算法之所以有用，是因为它可以快速地做出决策，并能在某些问题上实现较高的效率，避免了回溯与暴力解法的复杂度。贪心算法思想贪心算
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
字节跳动算法高频题：动态规划最优模板知识产权13937636601 计算机算法动态规划
本文系统梳理字节跳动近三年算法面试中的动态规划（DP）高频题型，提炼出适用于80%场景的通用解题模板。通过背包问题、字符串处理、状态压缩等六大核心模块解析，结合跳槽、股票交易、编辑距离等15道真题案例，揭示动态规划的状态转移方程构建规律与维度优化技巧，助您在面试中实现时间复杂度与空间复杂度的双重最优解。第一章动态规划基础框架1.1动态规划三大特征特征判定标准真题案例重叠子问题递归树中存在重复计算节
macOS 使用 enca 识别文件编码类型（比 file 命令准确）知识搬运bot 软件工具/使用技巧 macos enca file iconv 文件编码
文章目录macOS上安装enca基本使用起因-iconv关于enca安装Encaenca&enconv其它用法macOS上安装encabrewinstallenca基本使用encafilepath.txt示例$enca动态规划算法.txt[0]SimplifiedChineseNationalStandard;GB2312CRLFlineterminators起因-iconv在macOS上打开一些
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
Python中Requests的Cookies的简单使用北条苒茗殇 python 开发语言 Requests
概述Python的Requests库中有一个cookies，是用于管理HTTPCookie的工具，可以像字典一样操作Cookie，支持自动处理作用域（域名、路径）和持久化，cookies是一个RequestsCookieJar的类型。一、概念1.作用自动存储服务器返回的Cookie根据请求域名和路径进行自动发送匹配的Cookie支持手动添加、修改、删除Cookie2.RequestsCookieJ
Pytest基础使用北条苒茗殇 pytest
概述Pytest是Python里的一个强大的测试框架，灵活易用，可以进行功能，自动化测试使用，可以与Requests，Selenium等进行结合使用，同时可以生成Html的报告。一、Pytest的基本使用在未指定Pytest的配置文件时，会对以下文件进行执行：test_*.py，如：test_1.py*_test.py，如：1_test.py会对以下的类和函数进行执行：类：以Test_开头的类，如
Visual Studio Code官网下载地址及使用技巧（含常用的拓展插件推荐） ITCTCSDN vscode ide 编辑器
VisualStudioCode（简称“VSCode”）是Microsoft于2015年4月发布的可运行于MacOS、Windows和Linux之上的跨平台源代码编辑器，它具有对JavaScript，TypeScript和Node.js的内置支持，并具有丰富的其他语言（例如C++，C＃，Java，Python，PHP，Go）和运行时（例如.NET和Unity）扩展的生态系统。VisualStudi
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
python中rmdir和rmtree的用法 Gin387 python
shutil.rmtree()是Python中shutil模块提供的一个函数，用于递归删除整个目录树（包括子目录和所有文件）。os.rmdir()（只能删除空目录）不同，shutil.rmtree()可以强制删除非空目录importshutil#删除指定目录及其所有内容shutil.rmtree('path/to/directory')
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
股票市场的量化交易策略如何应对市场情绪变化？云策量化程序化炒股量化软件量化交易量化炒股 QMT 股票交易 PTrade 量化交易股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》股票市场的量化交易策略如何应对市场情绪变化？在股票市场中，量化交易策略是一种基于数学模型和算法的交易方式，它通过分析历史数据来预测未来价格走势，并据此制定交易决策。然而，市场情绪的变化对股票价格有着不可忽视的影响。本文将探讨量化交易策略如何应对市场情绪的变化，并提供一些具体的代码示例。一、市场情绪的重要性市场情绪是指投资者对市
31天Python入门——第11天:挑战一口气把闭包·装饰器讲明白安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录1.闭包扩展知识:闭包的自由变量是如何存储的2.装饰器装饰器的应用场景3.补充练习1.闭包闭包是指在一个函数内部定义的函数，并且这个内部函数可以访问外部函数的变量、参数.换句话说，闭包是一个包含了函数及其相关引用环境的组合体.在Python中，当一个函数返回了内部函数的引用时，这个内部函数可以访问并操作外部函数的局部变量，它就创建了一个闭包,即使外部函数已经执行完毕，它
算法笔记——前缀树、贪心算法（更新ing....... 不吃香菜的码农左神算法笔记算法数据结构贪心算法 leetcode 堆栈
前缀树、贪心算法一、前缀树1.什么是前缀树2.如何生成前缀树二、贪心算法1.拼接字符串2.金条问题3.项目会议时间问题4.项目收益最大化4.随时获得数据流的中位数一、前缀树1.什么是前缀树前缀树一般指字典树这是指一种结构而不是一类题（注意信息是在树的路上）典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查
opencv python rgb转yuv_OpenCV之色彩空间与色彩空间转换 xiao fei opencv python rgb转yuv
python代码：importcv2ascvsrc=cv.imread("test.jpg")cv.namedWindow("rgb",cv.WINDOW_AUTOSIZE)cv.imshow("rgb",src)#RGBtoHSVhsv=cv.cvtColor(src,cv.COLOR_BGR2HSV)cv.imshow("hsv",hsv)#RGBtoYUVyuv=cv.cvtColor(sr
【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理 qzw1210 gpt 人工智能深度学习
搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。本指南将详细介绍如何在本地环境中搭建GPT-NeoX，并解决过程中可能遇到的常见问题。1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)CUDA:11.2或更高版本Python
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
python 列表倒序输出小琳爱分享 python python
python列表倒序输出#使用reverseli1=[1,6,4,3,7,9]li2=['a','m','s','g']li1.reverse()li2.reverse()print(li1,li2)#利用list切片li1=[1,6,4,3,7,9]li2=['a','m','s','g']print(li1[::-1])print(li2[::-1])#利用算法进行转换，这里需要用到深层cop
基于WebAssembly的浏览器密码套件闲人编程 wasm 服务器易于集成跨平台性密码套件浏览器 WebAssembly
目录一、前言二、WebAssembly与浏览器密码套件2.1WebAssembly技术概述2.2浏览器密码套件的需求三、系统设计思路与架构3.1核心模块3.2系统整体架构图四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2SHA-256哈希函数五、异步任务调度与GPU加速设计5.1异步任务调度5.2GPU加速六、GUI设计与功能模块七、完整代码实现九、代码自查与总结十、总结与展望一、前
python怎么输出倒序 hakesashou python基础知识 python java 服务器
python怎么输出倒序？下面给大家介绍四种方法：创建测试列表>>> lst = [1,2,3,4,5,6]方法1：>>> lst.reverse() #reverse()反转>>> lst[6, 5, 4, 3, 2, 1]方法2：>>> lst1 = [i for i in reversed(lst)] #reversed只适用于与序列(列表、元组、字符串)>>> lst1[6, 5, 4,
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
自定义mavlink 生成wireshark wlua插件错误（已解决） JasonComing 问题收集 wireshark wlua mavlink
进入正题python3-mpymavlink.tools.mavgen--lang=WLua--wire-protocol=2.0--output=output/developmessage_definitions/v1.0/development.xml编译WLUA的时候遇到一些问题1.ERROR:SCHEMASV:SCHEMAV_CVC_ENUMERATION_VALID3765:0:ERRO
吐血整理 python最全习题100道（含答案）持续更新题目，建议收藏！ Bejpse 面试学习路线阿里巴巴 python 开发语言 pycharm redis java-ee
最近为了提升python水平，在网上找到了python习题，然后根据自己对于python的掌握，整理出来了答案，如果小伙伴们有更好的实现方式，可以下面留言大家一起讨论哦~已知一个字符串为“hello_world_yoyo”,如何得到一个队列[“hello”,”world”,”yoyo”]test=‘hello_world_yoyo’使用split函数，分割字符串，并且将数据转换成列表类型print
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

Tic-Tac-Toe：基于Minimax算法的人机对弈程序（python实现）

1. 前言

2. Minimax算法介绍

2.1 博弈树

2.2 估值函数

​​​​​​​2.3 基本算法思想

​​​​​​​2.4 实例1

​​​​​​​2.5 实例2—棋类游戏

2.6 小结

3. Tic-Tac-Toe minimax AI实现

3.1 函数说明

3.2 处理流程

3.3 代码

4. 小结

你可能感兴趣的:(人工智能,算法,Minimax,Tic-Tac-Toe,python)

2.3 基本算法思想

2.4 实例1

2.5 实例2—棋类游戏