weixin_39795268

alpha-beta剪枝算法_组合游戏系列5: 井字棋、五子棋AlphaGo Zero 算法实战

来源 | MyEncyclopedia 上一篇我们从原理层面解析了AlphaGo Zero如何改进MCTS算法，通过不断自我对弈，最终实现从零棋力开始训练直至能够打败任何高手。在本篇中，我们在已有的N子棋OpenAI Gym 环境中用Pytorch实现一个简化版的AlphaGo Zero算法。本篇所有代码在 github.com/MyEncyclopedia/ConnectNGym 中，其中部分参考了SongXiaoJun 的 github.com junxiaosong/AlphaZero_Gomoku。

第一篇: Leetcode中的Minimax 和 Alpha Beta剪枝
第二篇: 井字棋Leetcode系列题解和Minimax最佳策略实现
第三篇: 井字棋、五子棋的OpenAI Gym GUI环境
第四篇: AlphaGo Zero 强化学习算法原理深度分析
第五篇: 井字棋、五子棋AlphaGo Zero 算法实战

AlphaGo Zero MCTS 树节点

上一篇中，我们知道AlphaGo Zero 的MCTS树搜索是基于传统MCTS 的UCT (UCB for Tree)的改进版PUCT(Polynomial Upper Confidence Trees)。局面节点的PUCT值由两部分组成，分别是代表Exploitation的action value Q值，和代表Exploration的U值。

U值计算由这些参数决定：系数，节点先验概率P(s, a) ，父节点访问次数，本节点的访问次数。具体公式如下

因此在实现过程中，对于一个树节点来说，需要保存其Q值、节点访问次数 visit_num和先验概率 prior。其中，prior在节点初始化后不变，Q值和 visit_num 随着游戏MCTS模拟进程而改变。此外，节点保存了 parent和 children变量，用于维护父子关系。c_puct为class variable，作为全局参数。

class TreeNode:    """    MCTS Tree Node    """    c_puct: ClassVar[int] = 5  # class-wise global param c_puct, exploration weight factor.    _parent: TreeNode    _children: Dict[int, TreeNode]  # map from action to TreeNode    _visit_num: int    _Q: float   # Q value of the node, which is the mean action value.    _prior: float

和上面的计算公式相对应，下列代码根据节点状态计算PUCT(s, a)。

class TreeNode:    def get_puct(self) -> float:        """        Computes AlphaGo Zero PUCT (polynomial upper confidence trees) of the node.        :return: Node PUCT value.        """        U = (TreeNode.c_puct * self._prior * np.sqrt(self._parent._visit_num) / (1 + self._visit_num))        return self._Q + U

AlphaGo Zero MCTS在playout时遇到已经被展开的节点，会根据selection规则选择子节点，该规则本质上是在所有子节点中选择最大的PUCT值的节点。

class TreeNode:    def select(self) -> Tuple[Pos, TreeNode]:        """        Selects an action(Pos) having max UCB value.        :return: Action and corresponding node        """        return max(self._children.items(), key=lambda act_node: act_node[1].get_puct())

新的叶节点一旦在playout时产生，关联的 v 值会一路向上更新至根节点，具体新节点的v值将在下一节中解释。

class TreeNode:    def propagate_to_root(self, leaf_value: float):        """        Updates current node with observed leaf_value and propagates to root node.        :param leaf_value:        :return:        """        if self._parent:            self._parent.propagate_to_root(-leaf_value)        self._update(leaf_value)    def _update(self, leaf_value: float):        """        Updates the node by newly observed leaf_value.        :param leaf_value:        :return:        """        self._visit_num += 1        # new Q is updated towards deviation from existing Q        self._Q += 0.5 * (leaf_value - self._Q)

AlphaGo Zero MCTS Player 实现

AlphaGo Zero MCTS 在训练阶段分为如下几个步骤。游戏初始局面下，整个局面树的建立由子节点的不断被探索而丰富起来。AlphaGo Zero对弈一次即产生了一次完整的游戏开始到结束的动作系列。在对弈过程中的某一游戏局面，需要采样海量的playout，又称MCTS模拟，以此来决定此局面的下一步动作。一次playout可视为在真实游戏状态树的一种特定采样，playout可能会产生游戏结局，生成真实的v值；也可能explore 到新的叶子节点，此时v值依赖策略价值网络的输出，目的是利用训练的神经网络来产生高质量的游戏对战局面。每次playout会从当前给定局面递归向下，向下的过程中会遇到下面三种节点情况。

若局面节点是游戏结局(叶子节点)，可以得到游戏的真实价值 z。从底部节点带着z向上更新沿途节点的Q值，直至根节点(初始局面)。
若局面节点从未被扩展过(叶子节点)，此时会将局面编码输入到策略价值双头网络，输出结果为网络预估的action分布和v值。Action分布作为节点先验概率P(s, a)来初始化子节点，预估的v值和上面真实游戏价值z一样，从叶子节点向上沿途更新到根节点。
若局面节点已经被扩展过，则根据PUCT的select规则继续选择下一节点。

海量的playout模拟后，建立了游戏状态树的节点信息。但至此，AI玩家只是收集了信息，还仍未给定局面落子，而落子的决定由Play规则产生。下图展示了给定局面(Current节点)下，MCST模拟进行的多次playout探索后生成的局面树，play规则根据这些节点信息，产生Current 节点的动作分布，确定下一步落子。

MCTS Playout和Play关系

Play 给定局面 对于当前需要做落子决定的某游戏局面，根据如下play公式生成落子分布，子局面的落子概率正比于其访问次数的某次方。其中，某次方的倒数称为温度参数(Temperature)。

class MCTSAlphaGoZeroPlayer(BaseAgent):    def _next_step_play_act_probs(self, game: ConnectNGame) -> Tuple[List[Pos], ActionProbs]:        """        For the given game status, run playouts number of times specified by self._playout_num.        Returns the action distribution according to AlphaGo Zero MCTS play formula.        :param game:        :return: actions and their probability        """        for n in range(self._playout_num):            self._playout(copy.deepcopy(game))        act_visits = [(act, node._visit_num) for act, node in self._current_root._children.items()]        acts, visits = zip(*act_visits)        act_probs = softmax(1.0 / MCTSAlphaGoZeroPlayer.temperature * np.log(np.array(visits) + 1e-10))        return acts, act_probs

在训练模式时，考虑到偏向exploration的目的，在落子分布的基础上增加了 Dirichlet 分布。

class MCTSAlphaGoZeroPlayer(BaseAgent):    def get_action(self, board: PyGameBoard) -> Pos:        """        Method defined in BaseAgent.        :param board:        :return: next move for the given game board.        """        return self._get_action(copy.deepcopy(board.connect_n_game))[0]    def _get_action(self, game: ConnectNGame) -> Tuple[MoveWithProb]:        epsilon = 0.25        avail_pos = game.get_avail_pos()        move_probs: ActionProbs = np.zeros(game.board_size * game.board_size)        assert len(avail_pos) > 0        # the pi defined in AlphaGo Zero paper        acts, act_probs = self._next_step_play_act_probs(game)        move_probs[list(acts)] = act_probs        if self._is_training:            # add Dirichlet Noise when training in favour of exploration            p_ = (1-epsilon) * act_probs + epsilon * np.random.dirichlet(0.3 * np.ones(len(act_probs)))            move = np.random.choice(acts, p=p_)            assert move in game.get_avail_pos()        else:            move = np.random.choice(acts, p=act_probs)        self.reset()        return move, move_probs

一次完整的对弈

一次完整的AI对弈就是从初始局面迭代play直至游戏结束，对弈生成的数据是一系列的。

如下图 s0 到 s5 是某次井字棋的对弈。最终结局是先手黑棋玩家赢，即对于黑棋玩家 z = +1。需要注意的是：z = +1 是对于所有黑棋面临的局面，即s0, s2, s4，而对应的其余白棋玩家来说 z = -1。

一局完整对弈

以下代码展示如何在AI对弈时收集数据

class MCTSAlphaGoZeroPlayer(BaseAgent):    def self_play_one_game(self, game: ConnectNGame) \            -> List[Tuple[NetGameState, ActionProbs, NDArray[(Any), np.float]]]:        """        :param game:        :return:            Sequence of (s, pi, z) of a complete game play. The number of list is the game play length.        """        states: List[NetGameState] = []        probs: List[ActionProbs] = []        current_players: List[np.float] = []        while not game.game_over:            move, move_probs = self._get_action(game)            states.append(convert_game_state(game))            probs.append(move_probs)            current_players.append(game.current_player)            game.move(move)        current_player_z = np.zeros(len(current_players))        current_player_z[np.array(current_players) == game.game_result] = 1.0        current_player_z[np.array(current_players) == -game.game_result] = -1.0        self.reset()        return list(zip(states, probs, current_player_z))

Playout 代码实现

一次playout会从当前局面根据PUCT selection规则下沉到叶子节点，如果此叶子节点非游戏终结点，则会扩展当前节点生成下一层新节点，其先验分布由策略价值网络输出的action分布决定。一次playout最终会得到叶子节点的 v 值，并沿着MCTS树向上更新沿途的所有父节点 Q值。从上一篇文章已知，游戏节点的数量随着参数而指数级增长，举例来说，井字棋(k=3，m=n=3)的状态数量是5478，k=3，m=n=4时是6035992 ，k=m=n=4时是9722011 。如果我们将初始局面节点作为根节点，同时保存海量playout探索得到的局面节点，实现时会发现我们无法将所有探索到的局面节点都保存在内存中。这里的一种解决方法是在一次self play中每轮playout之后，将根节点重置成落子的节点，从而有效控制整颗局面树中的节点数量。

class MCTSAlphaGoZeroPlayer(BaseAgent):    def _playout(self, game: ConnectNGame):        """        From current game status, run a sequence down to a leaf node, either because game ends or unexplored node.        Get the leaf value of the leaf node, either the actual reward of game or action value returned by policy net.        And propagate upwards to root node.        :param game:        """        player_id = game.current_player        node = self._current_root        while True:            if node.is_leaf():                break            act, node = node.select()            game.move(act)        # now game state is a leaf node in the tree, either a terminal node or an unexplored node        act_and_probs: Iterator[MoveWithProb]        act_and_probs, leaf_value = self._policy_value_net.policy_value_fn(game)        if not game.game_over:            # case where encountering an unexplored leaf node, update leaf_value estimated by policy net to root            for act, prob in act_and_probs:                game.move(act)                child_node = node.expand(act, prob)                game.undo()        else:            # case where game ends, update actual leaf_value to root            if game.game_result == ConnectNGame.RESULT_TIE:                leaf_value = ConnectNGame.RESULT_TIE            else:                leaf_value = 1 if game.game_result == player_id else -1            leaf_value = float(leaf_value)        # Update leaf_value and propagate up to root node        node.propagate_to_root(-leaf_value)

编码游戏局面 为了将信息有效的传递给策略神经网络，必须从当前玩家的角度编码游戏局面。局面不仅要反映棋盘上黑白棋子的位置，也需要考虑最后一个落子的位置以及是否为当前玩家棋局。因此，我们将某局面按照当前玩家来编码，返回类型为4个棋盘大小组成的ndarray，即shape [4, board_size, board_size]，其中

第一个数组编码当前玩家的棋子位置
第二个数组编码对手玩家棋子位置
第三个表示最后落子位置
第四个全1表示此局面为先手(黑棋)局面，全0表示白棋局面

例如之前游戏对弈中的前四步：

s1->s2 后局面s2的编码：当前玩家为黑棋玩家，编码局面s2 返回如下ndarray，数组[0] 为s2黑子位置，[1]为白子位置，[2]表示最后一个落子(1, 1) ，[3] 全1表示当前是黑棋落子的局面。

编码黑棋玩家局面 s2 s2->s3 后局面s3的编码：当前玩家为白棋玩家，编码返回如下，数组[0] 为s3白子位置，[1]为黑子位置，[2]表示最后一个落子(1, 0) ，[3] 全0表示当前是白棋落子的局面。

编码白棋玩家局面 s3 具体代码实现如下。

NetGameState = NDArray[(4, Any, Any), np.int]def convert_game_state(game: ConnectNGame) -> NetGameState:    """    Converts game state to type NetGameState as ndarray.    :param game:    :return:        Of shape 4 * board_size * board_size.        [0] is current player positions.        [1] is opponent positions.        [2] is last move location.        [3] all 1 meaning move by black player, all 0 meaning move by white.    """    state_matrix = np.zeros((4, game.board_size, game.board_size))    if game.action_stack:        actions = np.array(game.action_stack)        move_curr = actions[::2]        move_oppo = actions[1::2]        for move in move_curr:            state_matrix[0][move] = 1.0        for move in move_oppo:            state_matrix[1][move] = 1.0        # indicate the last move location        state_matrix[2][actions[-1]] = 1.0    if len(game.action_stack) % 2 == 0:        state_matrix[3][:, :] = 1.0  # indicate the colour to play    return state_matrix[:, ::-1, :]

策略价值网络训练 策略价值网络是一个共享参数的双头网络，给定上面的游戏局面编码会产生预估的p和v。

alpha-beta剪枝算法_组合游戏系列5: 井字棋、五子棋AlphaGo Zero 算法实战_第7张图片

结合真实游戏对弈后产生三元组数据，按照论文中的loss 来训练神经网络。下面代码为Pytorch backward部分。

  def backward_step(self, state_batch: List[NetGameState], probs_batch: List[ActionProbs],                   value_batch: List[NDArray[(Any), np.float]], lr) -> Tuple[float, float]:        if self.use_gpu:            state_batch = Variable(torch.FloatTensor(state_batch).cuda())            probs_batch = Variable(torch.FloatTensor(probs_batch).cuda())            value_batch = Variable(torch.FloatTensor(value_batch).cuda())        else:            state_batch = Variable(torch.FloatTensor(state_batch))            probs_batch = Variable(torch.FloatTensor(probs_batch))            value_batch = Variable(torch.FloatTensor(value_batch))        self.optimizer.zero_grad()        for param_group in self.optimizer.param_groups:            param_group['lr'] = lr        log_act_probs, value = self.policy_value_net(state_batch)        # loss = (z - v)^2 - pi*T * log(p) + c||theta||^2        value_loss = F.mse_loss(value.view(-1), value_batch)        policy_loss = -torch.mean(torch.sum(probs_batch * log_act_probs, 1))        loss = value_loss + policy_loss        loss.backward()        self.optimizer.step()        entropy = -torch.mean(torch.sum(torch.exp(log_act_probs) * log_act_probs, 1))        return loss.item(), entropy.item()

参考资料

Youtube, Deepmind AlphaZero - Mastering Games Without Human Knowledge, David Silver
Mastering the game of Go with deep neural networks and tree search
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
AlphaGo Zero论文解析
AlphaZero实战：从零学下五子棋(附代码)

更多精彩推荐

激发企业大“智慧” | 深度赋能AI全场景揭秘你不知道的移动云
首次在手机端不牺牲准确率实现BERT实时推理，比TensorFlow-Lite快近8倍，每帧只需45ms
美国 AI 博士一针见血：Python 这样学最容易成为高手！
从程序媛到微软全球 AKS 女掌门人，技术女神驾到！
常程跳槽小米，联想：已付竞业协议股权对价 500 万，须偿还

C++内存管理秘籍：深入解析与实战代码示例萱萱199504 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
手机租赁系统开发核心技术解析红点租赁系统开发其他
内容概要如果把手机租赁系统比作一台精密运转的智能管家，那它的骨架可不是用代码随便搭的乐高积木。这玩意儿得同时搞定三件事：让用户像刷短视频一样流畅下单，让风控系统比小区门禁还难糊弄，还得让物流信息比外卖小哥的定位更透明。想象一下，当你在APP里滑动挑选最新款折叠屏手机时，后台其实正在上演三重加密的信用评分大战——你的芝麻信用分、电商平台消费记录甚至社交账号活跃度，都被塞进算法熔炉里炼成租赁权限的通行
蓝桥杯Python赛道备赛——Day6：算术（二）（数学问题） SKY YEAM 蓝桥杯备赛蓝桥杯 python 职场和发展
本期博客是蓝桥杯备赛中算术（数学问题）的第二期，包括：快速幂算法、逆元（模意义下的倒数）、组合数计算和排列数计算。每一种数学问题都在给出定义的同时，给出了其求解方法的示例代码，以供低年级师弟师妹们学习和练习。前序知识：（1）Python基础语法算术（二）（数学问题）一、快速幂算法二、逆元（模意义下的倒数）三、组合数计算四、排列数计算一、快速幂算法1.定义：快速计算大指数幂的算法。2.算法原理：二进
蓝桥杯Python赛道备赛——Day1：基础算法 SKY YEAM 蓝桥杯备赛蓝桥杯 python 算法
本博客就蓝桥杯中的基础算法（这一部分说是算法，但更是一些简单的操作）进行罗列，包括：枚举、模拟、前缀和、差分、二分查找、进制转换、贪心、位运算和双指针。每一个算法都在给出概念解释的同时，给出了示例代码，以供低年级师弟师妹们学习和练习。前序知识：（1）Python基础语法（2）PythonOOP（面向对象编程）基础算法（操作）一、枚举二、模拟三、前缀和四、差分五、二分查找六、进制转换七、贪心八、位运
[RA-L 2023] Coco-LIC：基于非均匀 B 样条的连续时间紧密耦合 LiDAR-惯性-相机里程计十年一梦实验室 c++
这段代码是一个基于C++的均匀B样条（UniformB-spline）实现，专门用于表示SE(3)变换（即三维空间中的刚体变换，包括旋转和平移）。以下是对代码的总结：1.许可证和版权使用BSD3-ClauseLicense，允许在满足条件的情况下自由分发和修改。版权归VladyslavUsenko和NikolausDemmel所有，属于Basalt项目的一部分。2.功能概述文件定义了一个模板类Se
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
C++ Map 查询时的两个小细节：`map[id]` 与 `map.value(id, nullptr)` 的区别誰能久伴不乏 c++java 开发语言
文章目录C++Map查询时的两个小细节：`map[id]`与`map.value(id,nullptr)`的区别1.`map[id]`—直接访问和自动插入新元素示例代码：关键点：适用场景：2.`map.value(id,nullptr)`—安全查询并避免插入新元素示例代码：关键点：适用场景：3.对比：`map[id]`与`map.value(id,nullptr)`的区别4.总结：选择合适的方式5
Android第四次面试总结（基础算法篇）每次的天空 android 面试算法
一、反转链表//定义链表节点类classListNode{//节点存储的值intval;//指向下一个节点的引用ListNodenext;//构造函数，用于初始化节点的值ListNode(intx){val=x;}}classSolution{//反转链表的方法publicListNodereverseList(ListNodehead){//初始化前一个节点为nullListNodeprev=n
芒格的“清晰思考“方法在量子计算商业模式设计中的应用 AGI大模型与大数据研究院 DeepSeek 量子计算网络运维 ai
芒格的"清晰思考"方法在量子计算商业模式设计中的应用关键词：芒格、清晰思考方法、量子计算、商业模式设计、应用策略摘要：本文聚焦于将芒格的“清晰思考”方法应用于量子计算商业模式设计。首先介绍了背景信息，包括目的范围、预期读者等。接着阐述了核心概念，如“清晰思考”方法和量子计算商业模式的原理及联系，并给出相应示意图和流程图。详细讲解了核心算法原理及操作步骤，结合数学模型和公式进行说明。通过项目实战案例
Python与C ++开发匿名捐赠1对1管理APP Geeker-2025 python c++
开发一款用于**匿名捐赠1对1管理**的App，结合Python和C++的优势，可以实现高效的后端数据处理、实时的捐赠监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python）-**编程语言**：Python-**Web框架**：Django或Flask-**数据库**：PostgreSQL或MySQL-**实时通信**：W
【数据结构之树】武帝为此数据结构数据结构
文章目录一、前言二、树的基本概念1.什么是树？2.树的常见分类（1）普通树（2）二叉树（BinaryTree）（3）满二叉树（FullBinaryTree）（4）完全二叉树（CompleteBinaryTree）（5）二叉搜索树（BinarySearchTree,BST）（6）平衡二叉树（AVL树）（7）红黑树（Red-BlackTree）三、树的基本操作及代码示例1.二叉树的基本实现（C++）运
分块查找算法 1haooo 算法 java 算法开发语言数据结构
分块的原则前一块的最大数据，小于后一窥啊中所有的数据（块内无序，块间有序）块数数量一般等于数字的个数开根号。比如：16个数字一般分为4块左右。publicclassblockSearch{publicstaticvoidmain(String[]args){int[]arr={16,5,9,12,21,18,32,23,37,26,45,34,50,48,61,52,73,66};//共18个元素
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
C/C++高效编译工具ccache 工头阿乐 C/C++c语言 c++java
C/C++文章目录C/C++前言一、引入ccache二、ccache基本原理三、安装前言在处理一些规模相对较大的工程时，编译花费的时间可能会很长。有时候我们会经常一遍一遍地编译相同的程序，此时，有了ccache情况就好多了。它将在第一遍编译时多花几秒钟，但接下来就会使编译成倍（5-10倍）的提速。ccache的基本原理是通过将头文件高速缓存到源文件之中而改进了构建性能，因而通过减少每一步编译时添加
通俗的方式解释“零钱兑换”问题程序员龙一 C++C/C++每日一问 leetcode c++零钱兑换
“零钱兑换”是一道经典的算法题目，其主要问题是：给定不同面额的硬币和一个总金额，求出凑成总金额所需的最少硬币个数。如果没有任何一种硬币组合能组成总金额，返回-1。解题思路动态规划：使用动态规划是解决零钱兑换问题的常用方法。定义一个数组dp，其中dp[i]表示凑成金额i所需的最少硬币个数。状态转移方程：对于每个金额i，遍历所有硬币面额coin，如果i>=coin，则dp[i]=min(dp[i],d
【加密】常用加密算法 llzcxdb java 开发语言
非对称加密非对称加密是一种加密技术，也称为公钥加密。它使用一对密钥：公钥和私钥。公钥可以向任何人公开，用于加密信息，而私钥则是保密的，用于解密信息。这种加密方法确保了数据的安全传输，因为只有拥有对应私钥的人才能解密通过公钥加密的信息。非对称加密的一个主要特点是，即使公钥被他人获取，他们也无法解密密文，因为缺乏与之配对的私钥。常见的非对称加密算法包括RSA、椭圆曲线加密（ECC）和数字签名算法（DS
C++高频面试问题 HJ_sky C++
C++常见面试问题汇总一、指针和引用的区别1.指针有自己的一块空间，而引用只是一个别名；2.使用sizeof看一个指针的大小是4，而引用则是被引用对象的大小；3.指针可以被初始化为NULL，而引用必须被初始化且必须是一个已有对象的引用；4.作为参数传递时，指针需要被解引用才可以对对象进行操作，而直接对引用的修改都会改变引用所指向的对象；5.可以有const指针，但是没有const引用；6.指针在使
【华为OD-E卷 -123 判断一组不等式是否满足约束并输出最大差 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java javascript c++
【华为OD-E卷-判断一组不等式是否满足约束并输出最大差100分（python、java、c++、js、c）】题目给定一组不等式，判断是否成立并输出不等式的最大差(输出浮点数的整数部分)要求:不等式系数为double类型，是一个二维数组不等式的变量为int类型，是一维数组;不等式的目标值为double类型，是一维数组不等式约束为字符串数组，只能是:“>”,“>=”,“<”,“<=”,“=”，例如，
【华为OD-E卷 -122 字符统计及重排 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 python 华为od java c++javascript
【华为OD-E卷-字符统计及重排100分（python、java、c++、js、c）】题目给出一个仅包含字母的字符串，不包含空格，统计字符串中各个字母（区分大小写）出现的次数，并按照字母出现次数从大到小的顺序。输出各个字母及其出现次数。如果次数相同，按照自然顺序进行排序，且小写字母在大写字母之前输入描述输入一行，为一个仅包含字母的字符串输出描述按照字母出现次数从大到小的顺序输出各个字母和字母次数，
【华为OD-E卷-02 最多提取子串数目100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-最多提取子串数目100分（python、java、c++、js、c）】题目给定[a-z]，26个英文字母小写字符串组成的字符串A和B，其中A可能存在重复字母，B不会存在重复字母，现从字符串A中按规则挑选一些字母，可以组成字符串B。挑选规则如下：同一个位置的字母只能挑选一次被挑选字母的相对先后顺序不能被改变求最多可以同时从A中挑选多少组能组成B的字符串。输入描述输入为2行，第1行输
C++高频（二） HUZ_小Z c++课程设计笔记经验分享
C++面试高频（二）1.知道动态链接与静态链接吗？两者有什么区别动态链接和静态链接的区别：动态链接：在程序运行时进行链接，加载共享库文件。节省空间，可多个程序共享库文件。灵活性高，可以动态加载不同版本的库文件。维护方便，只需更新库文件本身。静态链接：在编译时进行链接，将库函数复制到可执行文件中。独立的可执行文件，不依赖外部库文件。可执行文件较大，可能会有冗余代码。维护复杂，更新库函数需重新编译和分
【华为OD-E卷 - 高频题目全览（关注、收藏）通过率100%以上题目可达95%（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享纯小白编程入门教程（新手必看）计算机相关操作技巧（新手必看）华为od c++c语言 java python js javascript
注意：如果发现代码有用例覆盖不到的情况，欢迎反馈！会在第一时间修正，更新。解题不易，如对您有帮助，欢迎点赞/收藏E卷题目全览一键跳转详情题目详情跳转01补种未成活胡杨点此跳转详情02最多提取子串数目点此跳转详情03ai面板识别点此跳转详情04流浪地球
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
【C++经典例题】反转字符串中单词的字符顺序：两种实现方法详解倔强的石头_ C++经典例题 c++java 算法
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：C++经典例题期待您的关注目录问题描述基于快慢指针的解法基于索引的解法两种方法的比较问题描述在处理字符串相关的问题时，反转字符串中每个单词的字符顺序是一个常见的任务，同时要保证空格和单词的初始顺序不变。给定一个字符串s，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。s包含可打印的ASCI
第十六届蓝桥杯模拟赛（第一期）-c++/c shix . 算法竞赛 c++蓝桥杯 c语言
c++/c蓝桥杯模拟赛题解，非常详细质因数1、填空题【问题描述】如果一个数p是个质数，同时又是整数a的约数，则p称为a的一个质因数。请问2024有多少个质因数。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分.写一个判断质数和约数的函数判断即可约数判断可以直接使用c++的__gcd（最大公因数）函数，当然也可以
Unreal Engine开发：Unreal Engine基础入门_蓝图基础 chenlz2007 游戏开发2 虚幻游戏引擎 java 前端网络
蓝图基础蓝图概述什么是蓝图？蓝图（Blueprint）是UnrealEngine中的一个可视化脚本系统，允许开发者通过拖拽和连接节点来创建游戏逻辑、关卡脚本和自定义行为。蓝图使得非程序员也能轻松地进行游戏开发，同时也为程序员提供了一个快速迭代和调试的工具。蓝图系统基于C++的底层架构，因此可以实现与使用C++相同的功能，但更加直观和易于理解。蓝图的类型UnrealEngine中的蓝图主要有以下几种
动态规划-第4篇藤椒味的火腿肠真不错动态规划算法
19.最⼤⼦数组和（medium）1.题⽬链接：53.最大子数组和-力扣（LeetCode）2..解法（动态规划）：算法思路：1.状态表⽰：对于线性dp，我们可以⽤「经验+题⽬要求」来定义状态表⽰：i.以某个位置为结尾，巴拉巴拉；ii.以某个位置为起点，巴拉巴拉。这⾥我们选择⽐较常⽤的⽅式，以「某个位置为结尾」，结合「题⽬要求」，定义⼀个状态表⽰：dp[i]表⽰：以i位置元素为结尾的「所有⼦数组」
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

alpha-beta剪枝算法_组合游戏系列5: 井字棋、五子棋AlphaGo Zero 算法实战

AlphaGo Zero MCTS 树节点

AlphaGo Zero MCTS Player 实现

激发企业大“智慧” | 深度赋能AI全场景 揭秘你不知道的移动云

你可能感兴趣的:(alpha-beta剪枝算法,c++五子棋)

激发企业大“智慧” | 深度赋能AI全场景揭秘你不知道的移动云