【数学建模】“一口价”的战略(博弈模型)

问题背景

商店推出一种销售策略:双方同时报价,若顾客的出价大于商家卖价则成交,价格为双方出价的均值,否则不成交。在此情况下,双方应如何报价?

模型假设

1.商家知道商品对自己的真实价值 v s v_s vs,也就是可以卖出的最低价格;顾客知道商品对自己的真实价值 v b v_b vb,也就是可以支付的最高价格。
2.商家不知道商品对顾客的真实价值 v b v_b vb,但知道其概率分布;顾客不知道商品对商家的真实价值 v s v_s vs,但也知道其概率分布。
3.不妨假设 v s , v b v_s,v_b vs,vb都服从[0,1]上的均匀分布。
4.对一组给定的 ( v s , v b ) (v_s,v_b) (vs,vb)如果以价格 p p p成交,该交易对商家和顾客的效用分别为 p − v s p-v_s pvs v b − p v_b-p vbp;如果不成交,双方的效用均为0.商家和顾客都希望最大化自己的期望效用。
5.以上信息为双方所共有。

模型建立

记商家的战略为 p s ( v s ) p_s(v_s) ps(vs),即当商家认为商品的价值为 v s v_s vs时,他给出卖价 p s ( v s ) p_s(v_s) ps(vs);记顾客的战略为 p b ( v b ) p_b(v_b) pb(vb),即当顾客认为商品的价值为 v b v_b vb时,他给出报价 p b ( v b ) p_b(v_b) pb(vb)。自然地, p b ( v b ) p_b(v_b) pb(vb) p s ( v s ) p_s(v_s) ps(vs)都应该是定义在[0,1]区间上、取值也在[0,1]区间上的非减函数。

对于任意给定的 v s ∈ [ 0 , 1 ] v_s \in [0,1] vs[0,1],商家的报价 p s ( v s ) p_s(v_s) ps(vs)应该使其期望利润最大。因为只有 p b ( v b ) ≥ p s ( v s ) p_b(v_b) \ge p_s(v_s) pb(vb)ps(vs)时才能成交,成交后商家的利润为 ( p s ( v s ) + p b ( v b ) ) / 2 − v s (p_s(v_s)+p_b(v_b))/2-v_s (ps(vs)+pb(vb))/2vs,而不成交时利润为0,所以 p s ( v s ) p_s(v_s) ps(vs)应满足
max ⁡ p s { p s + E [ p b ( v b ) ∣ p b ( v b ) ≥ p s ] 2 − v s } P { p b ( v b ) ≥ p s } ( 1 ) \max _{p_s}{\left\{\frac{p_s+E[p_b(v_b)|p_b(v_b)\ge p_s]}{2}-v_s \right\}}P{\left\{p_b(v_b)\ge p_s\right\}}(1) psmax{2ps+E[pb(vb)pb(vb)ps]vs}P{pb(vb)ps}1
类似地,对于任意给定的 v b ∈ [ 0 , 1 ] v_b \in [0,1] vb[0,1],顾客的报价 p b ( v b ) p_b(v_b) pb(vb) 应该使其期望赢得最大,成交后顾客的赢得为 v b − ( p s ( v s ) + p b ( v b ) ) / 2 v_b-(p_s(v_s)+p_b(v_b))/2 vb(ps(vs)+pb(vb))/2,不成交时赢得为0,所以 p b ( v b ) p_b(v_b) pb(vb)应满足
max ⁡ p b { v b − p b + E [ p s ( v s ) ∣ p b ≥ p s ( v s ) ] 2 } P { p b ≥ p s ( v s ) } ( 2 ) \max _{p_b}{\left\{v_b-\frac{p_b+E[p_s(v_s)|p_b\ge p_s(v_s)]}{2}\right\}}P{\left\{p_b \ge p_s(v_s)\right\}} (2) pbmax{vb2pb+E[ps(vs)pbps(vs)]}P{pbps(vs)}2

如果战略组合 ( p s ( v s ) , p b ( v b ) ) (p_s(v_s),p_b(v_b)) (ps(vs),pb(vb))满足(1)和(2),则是双方的一个均衡,对于这个博弈问题存在很多均衡,下面介绍其中两个比较简单的均衡。

单一价格均衡

设定(0,1)区间上一个数x,商家如果认为商品的价值 v s ≤ x v_s\le x vsx,则报价x,否则报价为1;顾客如果认为商品的价值 v b ≥ x v_b \ge x vbx,则报价x,否则报价为0.这种价格战略可表示为
p s ( v s ) = { x , v s ≤ x 1 , v s > x ( 3 ) p_s(v_s)= \begin{cases} x, & v_s \le x \\ 1, & v_s > x \\ \end{cases}(3) ps(vs)={x,1,vsxvs>x(3)
p b ( v b ) = { x , v b ≥ x 0 , v b < x ( 4 ) p_b(v_b)= \begin{cases} x, & v_b \ge x \\ 0, & v_b < x \\ \end{cases}(4) pb(vb)={x,0,vbxvb<x(4)

观察可得,战略组合 ( p s ( v s ) , p b ( v b ) ) 是同时满足( 1 )和( 2 ) (p_s(v_s),p_b(v_b))是同时满足(1)和(2) (ps(vs),pb(vb))是同时满足(1)和(2

首先,可以注意到成交价格只能发生在x。
此外,从商家的角度看,如果顾客坚持战略(4),则商家在 v s ≤ x v_s \le x vsx时报价x是他的最优反应。因为报价低于x显然使自己的利润降低(假设能成交);而报价高于x则不能成交,自己本来可以从成交中获得的利润不能实现。如果 v s > x v_s>x vs>x,则成交会使商家利润为负,商家当然不希望成交,而报价为1可以保证不成交。因此战略(3)是商家对顾客的战略(4)的最优反应。
同理,如果商家坚持战略(3),战略(4)是顾客的最优反应。因此,(3)和(4)是一个均衡,称为单一价格均衡。

对一组给定的 ( v b , v s ) (v_b,v_s) (vb,vs),当 v b < v s v_bvb<vs时称为交易时有利的,因为此时一定存在 p ∈ ( v s , v b ) p \in (v_s,v_b) p(vs,vb),当双方以价格 p p p交易时,对双方都是有利的(由模型假设4),交易给双方带来的效用之和(即 v b − v s v_b-v_s vbvs)称为交易价值。在给定的战略组合下,能够实际发生的交易的期望与有利的全部交易的期望价值的比值称为该战略的交易效率

下面分析单一价格战略的交易效率,显然,当且仅当 v s ≤ x ≤ v b v_s\le x\le v_b vsxvb时,交易实际上才能发生。若 v s , v b v_s,v_b vs,vb都服从[0,1]上的均匀分布,图1中对角线上的三角形时交易有利的区域,而蓝色矩形区域才是交易实际发生的区域,所以交易效率为:
η = ∫ x 1 d v b ∫ 0 x ( v b − v s ) d v s ∫ 0 1 d v b ∫ 0 v b ( v b − v s ) d v s \eta = \frac{\int_{x}^{1}\mathrm{d}v_b\int_{0}^{x}(v_b-v_s)\mathrm{d}v_s }{\int_{0}^{1}\mathrm{d}v_b\int_{0}^{v_b}(v_b-v_s)\mathrm{d}v_s } η=01dvb0vb(vbvs)dvsx1dvb0x(vbvs)dvs
【数学建模】“一口价”的战略(博弈模型)_第1张图片
显然,当 x = 0.5 x=0.5 x=0.5时交易效率最大,但最大效率也只有3/4。

线性价格均衡

假设商家和顾客的报价分别是商品对二者价值的线性函数,表示为
p s ( v s ) = a s + c s v s ( 6 ) p b ( v b ) = a b + c b v b ( 7 ) p_s(v_s)=a_s+c_sv_s(6)\\ p_b(v_b)=a_b+c_bv_b(7) ps(vs)=as+csvs(6)pb(vb)=ab+cbvb(7)
我们需要确定其中的系数(不妨假设均为正数) a s , c s , a b , c b a_s,c_s,a_b,c_b as,cs,ab,cb,使这个战略组合 ( p s ( v s ) , p b ( v b ) ) (p_s(v_s),p_b(v_b)) (ps(vs),pb(vb))同时满足(1)和(2),即构成一个均衡。

假设商家的战略为(6),由假设3知 p s p_s ps服从 [ a s , a s + c s ] [a_s,a_s+c_s] [as,as+cs]上的均匀分布,此时对于给定的 v b v_b vb,顾客的最优反应就是寻找满足(2)式的 p b p_b pb。当 p b ∈ [ a s , a s + c s ] p_b \in [a_s,a_s+c_s] pb[as,as+cs]时, P { p b ≥ p s ( v s ) } = ( p b − a s ) / c s , E [ p s ∣ p b ≥ p s ] = ( a s + p b ) / 2 P\left\{p_b\ge p_s(v_s)\right\}=(p_b-a_s)/c_s,E[p_s|p_b\ge p_s]=(a_s+p_b)/2 P{pbps(vs)}=(pbas)/cs,E[pspbps]=(as+pb)/2,于是(2)式为
max ⁡ p b { v b − p b + ( a s + p b ) / 2 2 ⋅ p b − a c c s } \max_{p_b}{\left\{v_b-\frac{p_b+(a_s+p_b)/2}{2}\cdot \frac{p_b-a_c}{c_s} \right\}} pbmax{vb2pb+(as+pb)/2cspbac}
这是一个二次函数的优化,其最优解为
p b = 2 3 v b + 1 3 a s p_b=\frac{2}{3}v_b+\frac{1}{3}a_s pb=32vb+31as
类似的,求解过程如下图:
【数学建模】“一口价”的战略(博弈模型)_第2张图片

评注

这里讨论的模型一般称为双向拍卖,是一个同时出价的博弈(静态博弈),而且是信息不完全(双方的真实价值是各自的私有信息,对方只知道其分布),所以是一个不完全信息静态博弈。可以看出,这个问题不仅是对某个具体交易(给定的 v s , v b v_s,v_b vs,vb)提供报价决策,而是要对所有可能的 v s , v b v_s,v_b vs,vb提供一个报价方案 ( p s ( v s ) , p b ( v b ) ) (p_s(v_s),p_b(v_b)) (ps(vs),pb(vb)),这才是一个均衡(战略组合)。对不完全信息静态博弈,这样的均衡一般称为贝叶斯均衡或贝叶斯-纳什均衡

你可能感兴趣的:(算法)