《人机博弈》摘录(七)估值核心

1、终点估值,end-point evaluation,以末端节点的估值为准。

2、棋子价值表算法,增量计算局面的评分,可提升估值速度。

3、博弈性能公式如下

Performance(性能)= Speed(速度)X Knowledge(知识)

选取合适的估值方法,保持速度和知识的平衡,对博弈性能尤为重要。

4、如何制定估值函数?

(1)手工调整,费时,低效。

(2)爬山法,Hill Climbing,每次微调参数,统计获胜几率,若提高,则继续向这个方向调整,否则则放弃这个调整方向。此方法较慢,不能保证找到最佳值。

(3)模拟退火,Simulated annealing,使用多种初始参数值在不同位置“爬山”,更慢,但提高了找到最优解的概率。

(4)遗传算法,Genetic algorithms,维护多组较好的参数,模仿生物遗传机制,通过交叉、变异和淘汰,减少局部震荡的干扰,更稳定。很大程度依赖实施者的经验。

(5)寻优算法非完全自动化,需要大量的人工干预。若要完全自动寻优,则涉及机器学习,属于人工智能范畴。

你可能感兴趣的:(《人机博弈》摘录(七)估值核心)