沙普利值 课程分享11 2022-06-08

罗伊德·沙普利

沙普利值  课程分享11

       这是通识选修课《经济研究中的计算方法》第四讲课例之一。旨在说明一种合作博弈中的算法,属于解决多个局中人在合作过程中因利益分配而产生矛盾的问题。

一、沙普利公平三原则

       1953年,美国经济学家罗伊德·沙普利(Shapley)给出了一个关于报酬分配问题的计算方法,即沙普利值算法。此算法的基础是所谓的沙普利公平三原则。

       先看一个例子。

例1.有一个资本家(厂主)、一个工程师及二个工人。资本家有工厂,工程师有技术。若资本家与工程师合作,没有工人,则二人大才小用,做些工人的工作,每月可赚三万元,若加一个工人,因工人有体力有技术,效率大增,三人合作每月可赚6万元,若再加一工人,则一月可赚9万元。

       注意这里的前提是,没有厂主,就没工厂,工程师及工人当然不能赚钱;但若没有工程师,只有厂主与工人,工厂亦不能开工;可如果没有工人,厂主和工程师可以赚3万元。

       一个月下来,资本家给了两位工人各1.5万元,自己和工程师各3万元。工人知道自己来了工厂就多了3万元利润,于是认为他拿到的1.5万元少了,不给3万,怎么也给2万吧?

       现在问这9万元的利润要如何分配方为公平合理?

       沙普利首先给出了公平分配的三个原则:

原则1:报酬与名字无关,只与各人的贡献有关。

原则2:利润属于工作者,对所有工作人均成立。

原则3:若有二件工作由一人完成,则可得二分酬劳。

       有趣的是(在沙普利原论文中,他亦称奇),只要这三个原则,即可求出每人应得酬劳。。

沙普利值法解析

(一)符号定义

(1)n、N:假设合作博弈系统内有n个成员,由N={1, 2, …, n}表示;

(2)S:不同成员组成不同的联盟,记为S,S是N的子集;

(3)v(S):定义在N上的一实函数v为特征函数,即联盟S的收益记为v(S)。特征函数v(S)具有超可加性,若联盟A和B没有交集,则A与B构成新联盟的利益大于等于联盟A与B的收益之和,即当A,B符合A∩B=ϕ条件时:v(A∪B)≥v(A)+v(B);

(4)φ_i(v):表示联盟中成员 i 获得的利益。

(二)沙普利值法的公理

           沙普利值分配策略是满足以下四个公理(其实就是公平三原则的数学形式)的唯一解。

(1)对称性

       设π是N={1, 2, …, n}的一个排列,对于N的任意子集S={i_1, i_2,… ,i_m},有πS={πi_1, πi_2,… , πi_m}。若在定义特征函数w(S)=v(πS),则对于每个成员 i 属于N都有φ_i(w)= φ_πi(v)

       这表明了利益相关者的先后顺序或者记号标记并不会对利益分配结果造成影响。

(2)有效性

∑iϵN (φ_i(v))=v(N)

       这表明利益相关者联盟的总价值就是各沙普利值之和,即特征函数值。

 (3)冗员性

       若对于包含成员i的所有子集S都有v(S{i})=v(S),则φ_i(v)=0。其中S{i}为集合S去掉元素 i 后的集合。

       这说明如果一个成员对于任何他参与的合作联盟都没有贡献,则他不应当从全体合作中获利。

(4)加法性

       若在N上有两个特征函数v, w,则有 

       φ(v+w)=φ(v)+φ(w)

       这表明有多种合作时,每种合作的利益分配方式与其他合作结果无关,总分配是两项的和。

(三)沙普利值法

       成员i在参与S联盟时有(|S|-1)!种排序,|S|表示联盟S所包含的成员数,而剩余(n-|S|)个成员的排序有(n-|S|)!种,所有成员i参与的不同的排序组合除以n个成员的随机排序组合就是成员i对于联盟整体所应分得利益得权重,记为 [(|S|-1)!(n-|S|)!]/(n!)。成员i参与不同联盟S为自身参与联盟创造得 边际贡献 记为 [v(S)-v(S\{i})] ,那么成员i从总体利益v(N)所分得的利益为:

       φ_i(v)=∑sϵN {[(|S|-1)!(n-|S|)!]/(n!)}×[v(S)-v(S\{i})]

注:S\{i}表示从集合S中删除元素i后的集合。

三、实例解析

       回到前面的例1,按照沙普利值的算法,两位工人应各得1万元,资本家和工程师各得3.5万元。也就是说,原来资本家给每个工人1.5万元是给多了。这是因为沙普利值考虑了资本、技术与劳动力的稀缺性比较因素,所以工人的工资会有所减少。

       其实这个例子中的答案,可以更简单地推导出来:

厂主+工程师赚的3万与工人无关,由他们两分,每人1.5万;

厂主+工程师+工人甲赚的3万与工人乙无关,由他们三人分,那么工人甲获1万,老板和工程师加前面的各获2.5万;

厂主+工程师+工人乙赚的3万与工人甲无关,由他们三人分,那么工人乙获1万,老板和工程师加前面的各获3.5万。

       但如果实例中的人较多,情况更复杂,这种简单推理不行,就需要上述沙普利值的算法了。比如下例。

例2.共有三家公司,公司1,2,3单独投资可盈利v(1)=100,v(2)=200,v(3)=300,如果公司1和公司2联合,可获利v(1&2)=500;公司2和公司3联合,可获利v(2&3)=600;公司1和公司3联合,可获利v(1&3)=700;公司1、公司2和公司3联合,可获利v(1&2&3)=1000;那么三个公司一起合作,每个公司应各获利多少?

共有3个成员,n=3

(1)成员1 获利:

成员1 可以组成的联盟有4种情况:{1}、{1、2}、{1、3}、{1、2、3}。

由上表可知,成员1(公司1)的获利为850/3。Shapley值法的核心思想在于按照成员对联盟的边际贡献率将利益进行分配。

(2)成员2 获利:

成员2(公司2)的获利为850/3。

(3)成员3 获利:

因此成员3(公司3)的获利为1300/3。

(4)三者获利和总为(850/3+850/3+1300/3)=1000,符合题目。 

四、罗伊德·沙普利简介劳埃德·斯托维尔·沙普利(Lloyd Stowell Shapley)(1923-2016)

       罗伊德·沙普利(Lloyd S. Shapley),1923年6月2日出生在马萨诸塞州剑桥市,其父是杰出的天文学家哈罗·沙普利(Harlow Shapley, 1885-1972)。罗伊德·沙普利早年就读哈佛大学,1943年在中国成都的陆军航空队当中士,因破译苏联的天气代码获得了铜星勋章。战争结束后,他回到哈佛,1948年获数学学士学位。在兰德公司工作一年后,他去了普林斯顿大学,在那里他获得了博士学位。1953年,他的论文和博士后研究工作延续了弗朗西斯·伊西德罗·埃奇沃思(Francis Ysidro Edgeworth,1845-1926)的思想,引入了沙普利值和博弈论的核心解决方案。毕业后,他留在普林斯顿大学一段时间,1954年至1981年在兰德公司工作。自1981年以来,他一直在加州大学洛杉矶分校担任数学和经济学教授。

你可能感兴趣的:(沙普利值 课程分享11 2022-06-08)