博弈论学习(一)——基础

初步开始学习博弈论的相关知识,参考教材《博弈论基础与应用》吴广某 吕周洋

 

博弈论三要素

参与者、策略集、效用函数

  • 参与者:相互依赖、能够做出决策的个体。ps:博弈过程中最少两个参与者;

  • 策略集:参与者能够采取行动的合集,每个参与者都有一个策略集。ps:策略集并不是简单的行动罗列,它用于描述在某一刻,参与者采取的行动   和  其他参与者采取的行动 之间的依赖;

  • 效用函数:对策略进行评估,计算行动收益;
  • 信息:参与人在特定的行动点所知道的其他参与人的特征、选择的行动等有关知识;
  • 公共知识:参与人都知道的只是,且任何人都没有因为掌握这一知识而具有优势,公共知识又称无穷极共同知识;
  • 战略:参与人选择行动的规则。参与人同时进行一次博弈就结束的问题中,战略=行动,然而在行动有先后顺序的多次博弈中,即“如果....就.....;如果.....就.....”称为战略;
  • 战略组合:所有参与人在博弈中所选择战略的集合;
  • 均衡:是指博弈模型的解,由于博弈是各参与人战略之间的较量,当一个战略组合被称为均衡是指在特定意义下达到了最优。此时的行动序列被称为均衡结果,在动态博弈中,不同的均衡会有相同的均衡结果;
  • 纳什均衡:应用最多的均衡,指某一个参与人单方面改变战略将不会得到更多的收益;                                                                                                                                                                                                                

博弈论的分类

按参与人行动的先后顺序,分为静态博弈、动态博弈:

  • 动态博弈:参与人行动有先后顺序,且后参与者的能获知前参与者的选择信息;
  • 静态博弈:参与者可以同时/非同时做出选择,但互相不知道对方信息;

按参与人对其它参与人的了解成都,分为完全信息博弈、不完全信息博弈:

  • 完全信息博弈:参与者对其他参与人的特征、策略空间以及收益函数都有准确的信息;
  • 不完全信息博弈:参与者对其他参与人的特征、策略空间以及收益函数了解得不够准确或不是对所有人都掌握;

按参与人是否合作,分为合作博弈、非合作博弈:

  • 合作博弈:所有参与者关心整体利益,而非个人利益。强调集体理性,需要考虑所有参与者的信息。主要研究的问题:1) 如何合作 2) 如何分配合作后的收益;

  • 非合作博弈:所有参与者只追求个人利益最大化,不关心其他参与者性能。强调竞争性。主要研究的核心是纳什均衡问题。非合作博弈的进一步分类

大多数应用非合作博弈,所以这本书主要也在介绍非合作博弈。根据上述分类,非合作博弈可以分为以下四种:

 

其它的一些概念

纯策略:最基本的策略,参与者在某种状态只能采用一种行动选择;

混合策略:参与者在某种状态以概率分布的形式随机选择策略集中的行动;

帕累托优于:指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。帕累托优于又称帕累托改进,是达到帕累托最优的路径和方法;

你可能感兴趣的:(算法,博弈论,基础)