《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)

1. 对策问题

对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。

1.1 对策的基本要素

(i)局中人
在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用 I 表示局中人的集合.如果有n 个局中人,则 I = {1,2,…,n}。
(ii)策略集
一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i ,i ∈ I ,都有自己的策略集 Si 。
(iii)赢得函数(支付函数)
在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若 s i s_i si是第i个局中人的一个策略,则n 个局中人的策略组 s = ( s 1 , s 2 , . . . s n ) s=(s_1,s_2,...s_n) s=(s1,s2,...sn)就是一个局势。对任一局势, s∈S ,局中人i 可以得到一个赢得 H i ( s ) H_i(s) Hi(s)。显然, H i ( s ) H_i(s) Hi(s)是局势s的函数,称之为第i 个局中人的赢得函数。

1.2 零和对策(矩阵对策)

在零和对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。设局中人Ⅰ、Ⅱ的策略集分别为 S 1 = { α 1 , . . . , α m } , S 2 = { β 1 , . . . , β n } S_1 = \{α_1,..., α_m \}, S_2 = \{β_1,..., β_n\} S1={α1,...,αm},S2={β1,...,βn}。可见局势共有mn 个。对任一局势(αi,βj),记局中人Ⅰ的赢得值为aij,并称《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第1张图片为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是 − A。

当局中人Ⅰ、Ⅱ和策略集 S 1 , S 2 S_1,S_2 S1,S2及局中人Ⅰ的赢得矩阵 A 确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成 G = { A ; S 1 ; S 2 } G=\{A;S_1;S_2\} G={A;S1;S2}
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第2张图片
给定一个对策G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面的极大极小原理。
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第3张图片
上述定理给出了对策问题有稳定解(简称为解)的充要条件。当对策问题有解时,
其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质:
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第4张图片

2. 零和对策的混合策略

具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是 μ +ν ≠ 0的情况。由于赢得矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解。下面我们引进零和对策的混合策略。
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第5张图片
在这里插入图片描述
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第6张图片

3. 零和对策的线性规划解法

《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第7张图片
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第8张图片
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第9张图片

4. 二人非常数和对策

所谓常数和对策是指局中人I和局中人II所赢得的值之和为一常数。显然,二人零和对策是二人常数和对策的特例,即常数为零。对于二人常数和对策,有纯策略对策和混合策略对策,其求解方法与二人零和对策是相同的。二人非常数和对策也称为双矩阵对策。也有纯策略对策和混合策略对策两种策略。

4.1 纯策略问题

《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第10张图片

4.2 混合对策问题

(1)混合对策问题的基本概念
《数学建模算法与应用》——学习笔记chapter7. 对策论(博弈论)_第11张图片
(2)混合对策问题的求解方法
由定义6可知,求解混合对策就是求非合作对策的平衡点,进一步由定理8得到,求解非合作对策的平衡点,就是求解满足不等式约束(5)的可行点。因此,混合对策问题的求解问题就转化为求不等式约束(5)的可行点,而LINGO软件可以很容易做到这一点。

你可能感兴趣的:(《数学建模算法与应用笔记》,数学建模,算法,博弈论)