《网络、群体与市场》——揭示高度互联世界的行为原理与效应机制
清华大学出版社
本笔记按照老师讲课顺序整理,并不按课本上章节的顺序
应用数学和计算机的基础知识,讨论社会学和经济学的基本问题
涉及的主要内容
首先明确几个概念
图 = 事物 + 联系
图的同构:画法不同,但本质上结构相同
图在计算机中的表示:使用邻接矩阵或关联矩阵
两点间的路径,最短路径
两点间的距离
图的直径:任意两点的最大距离
图的广度优先搜索(BFS)的过程,要求掌握
使用BFS算法求最短路的方法
A*算法
深度优先搜索DFS算法
弗洛伊德算法
贝尔曼——福特算法
迪杰斯特拉算法
连通的概念,连通分量,割点,割边
有向图的入度和出度
强连通图,强连通分量
欧拉回路
二分图(二部图),二分图的判断(染色法)
匈牙利算法
总的来说,第一章图论部分的重点不多,主要是要熟悉图这种类型,掌握基本概念,因为之后的内容很多和图有关,需要用到这一部分的知识
1.三元闭包:如果两个互不认识的人有了一个共同的朋友,则他们将来称为朋友的可能性提升
拓展:两个人拥有的共同朋友越多,则两个人成为朋友的可能性越高
2.节点聚集系数
节点聚集系数是社交网络的关系的简单测度
节点A的节点聚集系数定义为A的任意两个朋友彼此之间也是朋友的概率
节点A的节点聚集系数 = 与A相邻的节点之间边的实际数与A相邻节点对的个数之比
比如对于这张图,节点A的聚集系数为1/6
A的边上总共有6个节点对,而只有CD有关联
3.桥
一个图中,已知A和B相连,若去掉连接A和B的边会导致A和B分属不同的连通分量,则将该边称为桥
4.捷径
若边A-B的端点A和B没有共同的朋友,则称边A-B为捷径
若删除该边,A和B的距离增加至2以上,则该边为捷径
捷径的跨度为改变两端点在没有该边情况下的实际距离
5.强三元闭包性质
关系强度越大表示友谊越亲密,互动越频繁
可以将社交网中的所有关系归为两大类:强联系和弱联系
定义:若节点A与节点B和C的关系均为强联系,且B和C之间无任何连接,则称节点A违反了强三元闭包性质。否则,称节点A满足强三元闭包性质
6.捷径与弱联系
断言:在社交网络中,若节点A满足强三元闭包性质,并至少两个强联系边与之相连,则与其相连的任何捷径均为弱联系
反证法:已知一社交网络及一节点A,满足强三元闭包性质并至少涉及两个强联系边,假设A和B直接有一捷径相连,且该捷径为强联系。由于A、B之间为捷径,则没有共同朋友,但根据强三元闭包原则,又必须有共同朋友,因此矛盾,因此预期相连的捷径均为弱联系
7.社会网络结构的统计特征
介数
介数描述的是网络中节点承载最短路径数的能力
节点或边的介数 = 网络中所有最短路径中经过该节点或边的概率之和
定义一条边A-B的邻里重叠度如下式
邻里重叠度 = 与A、B均为邻居的节点数 / 与A、B中至少一个为邻居的节点数
影响社交网络结构最基本的概念之一是同质性,即我们和自己的朋友间往往会有相同的特点
社交网路中互相连接的人倾向于相似
每个人的特质可分为两种
量化同质性
社交网络中同质性判断的一个测度
我们如何判断在一个社交网络中,同质性的程度?
对于这个图,从直观上,看到相同颜色的点的聚集程度,即可判别同质性
定量把握:如果两端点颜色相同的边太多,则同质性迹象明显
假设红色节点概率为p,白色节点概率为1-p,如果它们随机分布在社交网络中,则两端点颜色不同的概率为2pq(2pq = 1 - p^p - q^q)
同质性对社会演化网络的影响
通常情况下,人们倾向于和他们相似的人之间形成友谊,这通常被称为选择性,即人们根据相似的特征选择朋友
但于此同时,另一个过程也在发挥作用,人们会因为需要和朋友们保持一致而改变自己的行为。这个过程被称为社会化和社会影响。
由于网络中存在的社会联系影响力节点个体的特征。社会影响可以看作是和选择相反的观念:在选择中,个体的特征主导网络连接的形成。社会影响可以看成是与选择相反的观念。在选择中,个体的特征主导网络连接的形成,但在社会影响中,已存在的社会网络连接将会改变人们(可变)的特征
了解并知晓三元闭包,会员闭包,社团闭包的形成,区分这三种闭包
1.谢林模型
同质性影响结果:固有特质相同->可变特质趋同
正关系和负关系的基本模型。假设一群人构成一个社会网络,其中每个人都互相了解,于是每对节点间都有一条边。
这样的网络叫做完全图。
用+和-标识每条边,+表示两个端点是朋友,-表示两个端点是敌人
而既有边的正负属性可以影响未知或未来的关系
社会网络中三角关系的稳定性
将一个或三个+形成的三角关系称为平衡关系
将零个或两个+形成的三角关系称为不平衡关系
称一个图是平衡的,则它其中的每一个三角形都是平衡的
平衡定理
如果一个标记的完全图是平衡的,则要么它的所有节点两两都是朋友,要么它的节点可以被分为两个组X和Y,其中X组内的节点两两都是朋友,Y组内的节点两两也是朋友,而X组中的每个节点都是Y组中每个节点的敌人
1.弱平衡网络的特性
弱平衡结构性质:任意三个节点,均不存在两个正关系边和一个负关系边的连接模式
仅不允许出现两正一负的情况
弱平衡网络的特性:如果一个标记的完全图是弱平衡的,则它的节点可分成不同的组,并且满足同一组中任意两个节点互为朋友,不同组之间任意两个节点互为敌人
2.非完全网络中的平衡
允许一些边的缺失,考虑了非完全图的情况
当面对非完全图时,如何考虑它的平衡性?
在之前的平衡定理中提到,结构平衡可以从以下两个角度看
判断非完全图平衡的两种方式
但是使用上面的定义有不足之处,这个不足之处是,由于情况多变,有时我们很难判断一个标注图是否平衡,会出现判断困难
一个简单判别的方法
一个标注图是平衡的,当且仅当它不包含有奇数个负关系的边的圈
(由于每经过一个负关系的边,就要改变一次集合,因此如果一个圈有奇数个负关系,那么起始点的集合就会出现紊乱,则该图绝对不平衡)
如果每个方格都平衡,那么整体一定平衡
要求解法和思路完全掌握
六度分隔的意思是,在人类社会网络中,任何两个人之间的最短路径长度都不会超过6
社会网络中的三元闭包效应限制了人们可以通过短路径达到的人数
Watts-Strongatz模型
社会网络的两个基本特征
该模型为网络中每个节点创建两种连接,一种是纯粹的同质性连接,一种是弱关系连接。
同质连接是某个节点到那些相距r网格步以内的节点的连接,r是常数
对于另一个常数k,每个节点也形成到网络中k个其它节点的连接,这些节点被均匀分布地选择
在这样的网络图上,可以证明:任何两个节点之间存在短路径的概率很高
考虑小世界实验中的第二个观点:人们实际上能够找到到指定目标的短路径
一个分散搜索模型
1.扩展的网络模型
为模型引入一个衡量远距离弱连接跨越距离的“尺度”。网络中的节点像以前一样,每个节点在r个网络步内与其它节点相互连接
定义聚集系数q,对于两个节点v和w,设d(v,w)表示它们之间的网格步数(即一个节点沿着到相邻节点的边到另一个节点的步数)
要产生一条由v发出的随机边,用与1/d(v,m)^q的正比的概率产生由v连接到w的随机边
当q=2时,分散搜索最有效
2.朋友关系排名
假设从一个节点v的角度按亲近程度对所有其它节点进行排名:节点w的排名记为rank(w)
rank(w)等于其它比w更接近v的节点数(包括v本身)
比如:对于下面这个图,节点w的rank=7
具体的不用掌握了,课件上也没有
当向搜索引擎中查询一个词时,是什么决定了网页的排名?
1.由链入链接投票选择
链接是影响网页排名的第一个重要因素:利用链接评估一个主题相关网页的权威性,是针对一个主题其它网页通过链接到一个网页而赋予这个网页的认可程度
即,一个网页的链入数越高,说明排名应该越靠前
2.一种发现列表网页的技术
无标记的圆表示与查询词“报纸”相关的网页样本,右边是对应网页得到的票数(认可度)
3.反复改进规则
如果我们确信,得分较高的列表网页更清楚哪些是更好的结果,就应该加重它们对所链接网页的表决权。
对网页的投票用其列表值加权,如下图所示
4.中枢网页和权威网页
针对一个查询得到的那些认可度较高的突出网页称为该查询的权威网页
对于每个网页p,可以使用网页权威值(auth(p))和网页中枢值(hub(p))来估算网页本身的价值
设两者初值均为1
权威更新规则:对于每个网页p,以所有指向该网页的网页中枢值之和更新这个网页的权威值
中枢更新规则:对于每个网页p,以所有该网页指向的网页权威值之和更新这个网页的中枢值
计算权威值和中枢值的算法
当k值趋近于无限大时,经过归一化处理后的中枢和权威值也收敛于稳定的极限值。
ppt上有个小练习,考前试一试
1.网页排名的基本定义
网页排名可以看成一种通过网络流通的“流体”,沿着边从一个节点流到另一个节点,汇集到一些最重要的节点上
网页排名的具体计算方法如下
课堂练习,考试前练一练
2.网页排名的均衡值、
当更新步数k趋于无穷大时,所有节点的网页排名值收敛于相应的极限值
3.按比例缩放网页排名
PageRank算法有时会导致一种不好的情况,即慢泄漏
可以发现,这个问题遵循网络排名“流动性”的说法。受地球水循环这一自然现象的启发,我们使用如下方法解决这一问题
选择一个缩放因子s,严格限定在0~1之间
缩放网页排名的更新规则
首先运行基本网页排名更新规则。然后用缩放因子s缩小所有网页排名值。这意味着网络排名值的总和由1缩小到s。将剩余的网页排名值1-s平均地分给所有的节点,每个节点得到(1-s)/ n
随机游走:一种网页排名的等价定义
一个人从一篇随机选择的网页开始,随机选择其中的链接浏览到下一篇网页,并不断如此进行,称为“随机游走”
考虑一篇网页X:经过k步随机游走到达X的概率是多少?
可以证明:到达X的概率等于运行PageRank算法k步得到的值
在之前的部分里,研究了,任何人的行为结果至少潜在地依赖于其它人之联合行为
从这一部分开始,我们将用博弈论研究行为层次地关联性
博弈论研究的是这样一种情境,即人们的决策结果不仅取决于他们如何在不同的备选项之间进行选择,而且取决于与他们互动的其它人做出的选择
一个案例
中国古代的博弈:田忌赛马
博弈的基本要素
博弈特点
一旦给出了参与人,策略集和回报,就严格描述了一个博弈
考试-报告博弈中的行为推理
两个人只能选择考试或写报告两种方式
考试成绩可以预期
报告分数是你和你的搭档共享的
考试和报告各占50%
收益矩阵
严格占优策略:无论其它人选择何种行为策略时,都会存在一个决策是最佳选择,则定义这个策略为严格占优策略
在上面这个策略中,两个人最优的策略都是复习考试。所以,预期结果是两个88分的情况
囚徒困境
有的时候,并不是两者都有严格最优策略,可能只有一个参与人有严格占优策略,那么另一个参与人可以知道,这个参与人大概率会选择这个严格占优策略,而在这个严格占优策略当中,另一个参与人可以选择它最优的策略
严格与不严格的区别,看是>还是≥
区分严格占优策略,占优策略,最佳应对和严格最佳应对
当参与人在双人博弈中都无占优策略时,则需要通过其它方式来预测什么行为倾向于在实际中发生
1.案例:三客户博弈
具体的说明间书p104
基本认识:即使不存在占优策略,我们也可以通过参与人彼此策略的最佳应对来预测参与人的策略选择问题。
假定参与人1选择策略S,同时参与人2选择策略T。若S是T的最佳应对,同时T是S的最佳应对,则称策略组(S,T)是一个纳什均衡
上面的“三客户博弈”问题,公司1选择策略A,公司2也选择策略A,两者互为最佳应对,所以策略组(A,A)就形成了一个纳什均衡。且这是该博弈中唯一的一个纳什均衡
对于一些自然博弈,存在一个以上的纳什均衡,不能推断哪个均衡会出现
一般来说,纳什均衡的概念能有助于缩小预测范围,但它不一定能给出唯一的预测
有一些根本不存在纳什均衡的博弈,对于这样的博弈,人们引入随机性来扩大参与人的策略集,进而对参与人的行为进行预测
在博弈的框架中,一旦考虑了参与人策略选择的随机性,博弈总会出现平衡
揭示该现象的一类博弈被称为攻防博弈,在这种博弈中,一名参与人作为攻击方,另一参与人作为防守方
1.硬币配对
2.混合策略
引入随机行为最简单的方式,是说明实际上每个参与人都不是直接选择H或T,而有概率
在该模型中,设参与人1选择H的概率为p,选择T的概率为1-p
设参与人2选择H的概率为q,选择T的概率为1-q
对于传统的博弈来说,包含参与人、各自的策略集以及对应的收益三个部分,但这里我们放开了随机化条件,实际上已经改变了博弈类型
对于这种新的模型,依然有两个参与人,但每个参与人不再只有两个策略。他们的策略现在表示为概率区间[0,1]中的数。我们把这种称为混合策略
这组混合策略仍包括初始的两个选项H和T,分别对应概率1或0,称为这种博弈中的两个纯策略
3.混合策略收益
对于新的策略集合,定义收益的微妙之处在于此时的收益是随机量。每个人以一定的概率拿到+1收益,以剩余的概率拿到-1的收益
参与人1采取纯策略H的收益期望是(-1) * q + 1 * (1-q) = 1-2q,如果采取纯策略T,其收益期望是1*q + (-1) * (1-q) = 2q-1
如果1-2q ≠ 2q-1,那么纯策略H和T之一就会是参与人1针对参与人2采取策略q的唯一最佳应对
但之前已经说明了在硬币配对博弈中纯策略不会是任何纳什均衡的一部分
因此在硬币配对博弈的混合策略版本中,任何纳什均衡都必有:1-2q = 2q-1,即q = 1/2
因此p=1/2和q=1/2这一对策略就是纳什均衡存在的唯一可能,而这对策略互为最佳应对
在本章中,我们将利用博弈论的思想构建网络流量模型。在这个过程中,会发生一个非常意外的结果——布雷斯悖论的观点表明:增加网络容量有时反而会减慢网络流通的速度
考虑下面这个运输网络,A-D边和C-B边不受交通状况影响,不论有多少辆车行驶在其中,都需要45分钟穿越
而A-C边和D-B边受拥堵的影响较大:当有x辆车行驶在同一条路线时,穿越该路线所需要的时间为x/100分钟
均衡状态的流量
假设有4000辆车,如果同时走A-C或A-D,那么所需的时间都是85分钟,但如果它们均分两路,则所需时间为65分钟。
上述的流量模型其实就是一场博弈,参与者相当于司机,每个参与者的策略是选择由A到B的可能路线
如果司机能像上面那样选择,就会达到纳什均衡,这是形成纳什均衡的唯一条件
对上面的图做一个小小的修改
在这个新的运输网络上存在唯一的纳什均衡,但它导致大家花费更多的时间
均衡状态下,每个司机都是用从C到D的路线,结果每个司机需要的行驶时间为80 > 65
多修一条路,情况反而变得更糟了
对布雷斯悖论的一些思考
布雷斯悖论本身并没有自相矛盾
在很多设置环境中,给博弈增加一个新策略会使情况变得更糟
另外的提高效率的方法
博弈论的第二个应用:拍卖中买方和卖方的行为
增价拍卖——英式拍卖
增加拍卖,卖方不断提高售价,竞拍者不断退出,直到剩下最后一位买家,这个卖家最终赢得商品
降价拍卖——荷兰式拍卖
卖方从最高价起逐步降价,直到第一个竞拍者接受并支付当前价格。
首价密封拍卖
竞拍者同时向卖方提交密封报价。出价最高者以其出价赢得商品
次价密封拍卖
同样密封报价。出价最高者赢得商品,但以第二高出价购买商品
1.已知估值
假设一个卖方希望出售他认为价值为x的商品,所有潜在的买家对这个商品的最高估值为一个更大的数值y。在这种情况下,销售这个商品将产生一个y-x的盈余
在次价密封拍卖钟,竞标者提交独立的私密的竞标价,此时提交真是估值是一个占优的策略,即对竞标者来说,最好的选择是竞标价格恰好是他认为商品所值的价值
换句话说,次价拍卖鼓励人们说真话
1.从博弈论视角看次价拍卖
设vi为竞拍者i对商品的真实估值。竞拍者i的策略是以bi为竞标价,其中bi为真实估值vi的函数
在一个次价拍卖中,竞拍者i的回报定义如下:
2.在次价拍卖中真实出价
断言:在一个密封次价拍卖中,每个竞拍者i的占优策略是选择一个竞拍价bi=vi
证明这个断言:
假设你按真实价bi出价后,可能有两种情况
综合这两种情况,再次价拍卖中真实出价,可以获得最大的利益
1.二部图
二部图,具有一种很重要的性质。二部图中的节点被分成两组(两类),每条边连接的必须是不同组别中的节点。比如下面图中的两组分别是学生和房间
下面这张图表示的是大学分宿舍时,不同学生对不同房间的偏好情况
2.完美匹配
当二部图两边有数目相同的节点,一个完美匹配就是左右节点的配对。
下面用黄线标记的就是一组完美匹配
如何证明一个二部图中没有完美匹配呢?
使用受限组进行判断
匹配定理:如果一个两边相等的二部图无法形成完美匹配,那么它一定包含一个受限组
受限组的定义:首先,取二部图右边任何一组节点S,将左边通过边与其相连的节点称为S的邻居,用N(S)表示所有S邻居的集合,如果S比N(S)的数量大,即S比N(S)包含更多的节点,那么右边的S就受到限制
更深入地讨论二部图市场问题。允许每个人再表达偏好时不适用二元方式的“接受”或“不接受”,而是以数值来表示它们对每个对象的喜爱程度
一个合理分配房间的方法就是寻求尽可能高的分配方案质量。我们称之为最优分配,因为这种方案使每个人的满意程度最高
二部图匹配是最优分配的一个特例,即将最优分配中的数值变为1和0
之前的最优分配是通过一个“管理员”对每个人提供的数据进行计算,得到最优分配。
但在更标准的市场情景中,没有这样的中央协调机制,每个人只是根据商品的价格和他对其的估值的基础上来做出决定
以市场定价策略替代“中央管理员”,让个体根据他们对商品的评估寻求最佳的个人利益,这样也能产生最优分配
1.价格和回报
假设卖家i以pi的价格出售自己的房子,pi≥0,如果买家j从卖家i处以该价格买到此房屋,我们就说买家的就是它对房屋的估值减去它需要付的钱,即vij - pi
买家会选择vij - pi值最大的那个卖家i购买
具体解释如下图
注意,对于每位买家,他们偏好卖家的组合如何根据价格变化而变动
2.市场清仓价格
市场清仓价格:如图b,每间房屋都有了不同的买家。
最后每个买家都会得到一套不同的房子
图d显示了市场清仓价格这一概念的微妙之处,每个买家都可以得到不同的房子,但仍需要协调。在某些情况下,这种“平局”是难以避免的,如果所有买家对全部商品的估值一样,那么没有任何价格组合能消除他们之间的对称性
如果一组价格形成的偏好卖家图有完美匹配,那么它就是一组市场清仓价格
3.市场清仓价格的属性
市场清仓价格的存在性:对于任何买家估值的组合,总存在一组市场清仓价格
市场清仓价格的最优性:对于任何一组市场清仓价格,偏好卖家图中的一个完美匹配使估值总和在所有买家与卖家的配对中达到最高
找到清仓价格的步骤(考试时直接按这个步骤来就可以了)
如何证明拍卖会结束?
这一部分不是重点,书上和课件上也有
人们发现,可以针对用户的查询,将搜索结果与广告结合起来
1.按每次点击支付
点击价格模型:只有当用户点击广告中的链接时,你才需要向搜索引擎公司支付广告费。
2.通过竞拍指定广告费
有多个可以显示的广告位,这些广告位对应的价值也不相同。搜索引擎如何指定广告价格呢?
1.点击率和点击收入
点击率
对于点击率,做出以下三点假设
点击收入
不同广告位的点击收入不同
以第10章的框架研究广告市场
用ri表示广告位i的点击率,vj表示广告商j的点击收入。那么,广告商j从广告位i中所获得的收入为ri*vj,即点击次数与每次点击收入的乘积
广告商j对广告位i的估价为vij,即从广告位i获取的价值。如果把广告位视为卖方,广告商视为买方,那么买方的估价为vij = ri*vj
广告位充当卖方的角色,广告商充当买方的角色
3.获得市场清仓价格
直接采用第十章的框架就可获得
在搜索产业初期,采用首价拍卖:广告商以投标的形式报告其点击收入,然后按这些出价递减的顺序一次将这些广告位分配给相应的广告商,每点击广告费与报价完全相同
但如果按这种方式,那么竞拍者就会降低报价,同样的情况也会发生在这里
因此,可以是用一种类似次价拍卖的方式解决这种问题
1.VCG机制
在次价拍卖中,我们能发现以下两点
对第2点的理解?
假设竞拍者对商品的估价按递减顺序为v1,v2…,vn,如果竞拍者1不出现,你们竞拍者2以估价v2中标,其它竞拍者仍然不会中标。因此,由于竞拍者1的出现,使竞拍者2~n共同损失了价值v2。 其中竞拍者2损失了总值v2,竞拍者3~n没有收到影响。而v2正是竞拍者1应该支付的价格。同样地,其它竞拍者应该支付的费用也等于他们对其它竞拍者所造成的损失,此时这些损失为0。
2.将VCG机制运用到匹配市场中
匹配市场包含一组相同的买方和卖方,买方j对卖方i所卖的商品的估价为vij
每个买方拥有独立私密的估价(只知道自己的估价,不知道别人的估价,估价之间不互相影响)
VCG机制的运作如下
这个损失是在买方j没有出现的情况下,所有其它买方所能提高的估价总和
一个小例子
确定广告位的市场清仓价格
总共提高的价值为10+3 = 13
假设y不存在,得到的清仓价格为
假设z不存在,最优匹配方案是买方x和y分别获得与z出现时同样的商品,z并没有给其它买方造成损失,因此z的VCG价格为0
VCG价格的一般公式
这种机制的工作过程如下
这里定义的VCG价格与之前第10章中的市场清仓价格有着本质的区别,VCG价格属于个性价格,它取决于商品本身和购买这些商品的买方
断言:如果按照VCG机制分配商品并计算价格,报告真实估价是每个买方的占优策略,并且在所有的商品和买方形成的完美匹配中,这种分配结果使得估值总能够和最高
证明
假设买方j真实地宣布其估价,在匹配中得到商品j,那么j得回报是vij - pij
假如买方j虚假报价,可能有以下两种情况
获得商品h得回报为vhj-phj
如果要说明买方j没有说假话的动机,即证明以下式子成立
vij - pij ≥ vhj - phj
不等式左边表达的是一个最优匹配中i和j的配对,加上剩余部分的最优匹配
换句话说,在所有可能的完美匹配中,这种匹配达到了最高估值总和,因此左边可以写成
不等式的右边是将j与某个不等于i的h匹配,以及剩余部分的最优匹配,这种匹配得到的是当j与h匹配时,达到最高估值的匹配,因此有:
所以不等式成立,因此VCG鼓励人们说真话
主要的搜索引擎都采用一种被称为广义次价拍卖的机制出售其广告空间。GSP在某种程度上像VCG一样都是单项次价拍卖的推广形式。不过我们将看到,GSP只是表名意义上的推广,因为它并不能保持次价拍卖和VCG的优质特点
GSP机制
在GSP机制中,每个广告商j宣布一个出价bj,表示愿意支付的每次点击的价格
GSP机制将每个广告位i分配给出价排在第i位的广告商,所支付的点击价格是它下面显示的广告所报的出价
GSP规则是,用b1,b2…,bn以递减顺序表示广告商对每次点击的报价,广告位i的收费价格为ri*bi+1
也就是说出价排在第i位的广告商得到广告位i,支付的费用是第i+1个广告商的点击报价bi+1再乘以广告位i的点击率ri
GSP的不足
GSP并不鼓励说真话
因此买家会倾向于选择vi - pi 较大的方案,因此有时候,会说假话,降低报价以获得更“值”的广告位
比如对于下面这这个例子
如果按估值报价,x将以价格6支付广告位a,预期回报为7 * 10-6 * 10 = 10
如果说假话,x报价5,将得到广告位b(此时心理估值为7),则回报为7 * 4 - 1 * 4 = 24
因此GSP的缺点是不鼓励说真话
权力是社会学的一个中心概念,人们对它的研究体现在多种形式。
一个基本的问题是,一个个体在网络上所表现出来的权力,在多大程度上是其自身特性所决定的,而又在多大程度上圆与网络结构的性质(如某人是因为在网络结构中占据关键位置才显得特别有权力)
网络中权力的一个例子
5个朋友之间的社会网络,其中的边代表较强的友谊关系。从直觉上看,节点B实在网络中有一个有权利的位置,特别是对其三个邻居中的A和C而言,B显得比较有权力
权力有以下几个特点
给定一个图,“结果”是其中的一个匹配(一个节点无冲突的边子集),以及每个节点在[0,1]区间的一个赋值,满足以下两个条件
稳定结果:不存在不稳定因素的结果
当不在结果中的一条边,它的两端点价值之和小于1时,这两个节点就有达成协议的趋势,因此该结果不稳定
比如下面这个例子中,B与C是不稳定因素
1.纳什议价解
如图,A,B两人谈判分配1$,但A有一个外部选项x,B有一个外部选项y
注意:如果x+y > 1 在A和B之间就不可能达成协议,因为不可能两人从1$中得到的分别都不少于x和y。于是,在考虑这种情形时,假设x+y ≤ 1
在给定的条件下,A至少会得到x,B至少会得到y。因此,谈判实际上就是在说如何分配剩余s = 1-x-y。如果A和B两人有相等的谈判权力,那么他们将同意均分这剩余,即A得到x+1/2s,B得到y+1/2s
纳什议价解:当A和B就如何划分1$进行谈判时,若A有外部选项x,B有外部选项y,且x+y ≤ 1,则纳什议价结果为:
对A来说是x + 1/2s = (x+1-y)/2
对B来说是y + 1/2s = (y+1-x)/2
最后通牒涉及两个人要分配一美元的问题
如果B是完全理性人,那么不管A提出怎样的分配方案,B都会接受,因为接受比不接受得到的钱多。但实验结果证明,金钱至上并不是人类的典型行为
1.结果
在12.3节已经介绍过了,这里不再赘述
2.稳定结果
稳定性:不存在节点X,使它可以对节点Y提出一种划分价值的建议,使X和Y都获得更多的价值,从而将节点Y从一个已有的协议中“偷过来”
不稳定性:给定一种由匹配的和节点价值构成的结果,一个不稳定性指的是不在该结果匹配中的一条边,其两个端点X和Y的价值之和小于1
可以将网络交换看成一种“议价”,其中“外部选项”通过网络中的其它节点提供
1.定义平衡结果
平衡结果:给定网络其余部分为每个节点提供的最好外部选项,一个交换结果称为平衡的条件是,对匹配的每条边来说,价值的划分体现了两个节点的纳什议价结果
平衡结果一定是稳定结果
人们可以在很多方面受他人影响,我们要超越这些现象,思考为什么人们会受到他人的影响?
当人们放弃了自己的想法去参与别人的事时,我们认为发生了群集或信息级联
判断蓝多罐或红多罐的实验
我们需要一种概率,利用已有信息来定义一个事件发生的概率
1.条件概率和贝氏规则
对于任意一个事件A,用Pr[A]表示它的概率
Pr[A|B]:在B的前提下,A发生的概率
这个等式被称为贝叶斯规则
在之前的红多蓝多罐中演示贝叶斯定理
每个学生为了最大限度赢得猜中的机会,如果以下表达式成立,就应该猜多数蓝色
在实验前,小罐是蓝色或红色的概率分别为1/2
在蓝多的情况下抽到蓝球和在红多的情况下抽到红球的概率一样
假设第一个学生抽到了蓝球,他需要确定概率
这个概率可以用贝叶斯公式计算
值为2/3,而2/3大于1/2,因此这个学生应该猜测多数蓝色
进一步延申
假设前两个学生都猜蓝色,而第三个学生拿到一个红色球,那么他需要根据以下表达式的值进行猜测
利用贝叶斯规则,有
最后算出的概率为
因此这个学生应该猜测多数蓝色
我们将构建一个适应于一般情况的模型,并将证明,贝氏规则能够预测该模型将形成级联(即参加人数趋于无穷大时,形成级联的概率趋于1)
1.构建模型
考虑一组人(1,2,3…),依次做出决定
模型的第一个要素:状态,在一切开始前,任何人都没有做决定,所考虑的状态可以随机地进入两种状态,一种状态是该选项是个好主意,另一种状态是该选项不是个好主意
G表示好状态,B表示坏状态
设Pr[G] = p,Pr[B] = 1-p
模型的第二个要素:回报,根据每个人决定或接受一个选项,他将获得一份回报。如果一个人拒绝一个选项,他得到的回报为0。如果接受的是好主意,得到的回报是一个正数vg>0,否则得到的回报就是一个负数vb<0
假设没有任何信息,接受一个选项的期望回报为0。即vg * P+vb * (1-p) = 0。接受和拒绝的回报一样
第三个要素:信号,在做任何决定之前,每个人都有一个私有信号,能够提供一些判断接受是否是一个好主意的信息
私有信号可能有两种:高信号,记为H(好主意)和低信号,记为L(坏主意)
如果接受的选项是个好主意,那么高信号比低信号更可能出现,即Pr[H|G] = q > 1/2
假设一个人得到一个高信号,那么回报值从之前的
同理,如果得到的是低信号,则应该拒绝这个选项
3.多重信号
每个个体都会得到一个独立生成的信号序列S,包含a个高信号和b个低信号
每个人都可以观察到前面人的决策行为,但并不清楚他们都知道些什么。当某个人决定接受或者拒绝一个选项时,会使用自己的私有信号,以及观察到所有先前人做出的决定。
推理过程
如果后面的个体知道3号的决定没有传递任何关于私有信号的信息,这些人将全部与3号处在同一起点上。在这种情况下,级联效应便开始了
对于N个的同理,在书上有
总结:只要接受数和拒绝数相差不超过一个,序列中的每个人就会简单地根据自己的私有信号做决定。一旦接受数和拒绝数相差达到两个以上,便形成级联效应,每个人就会一直简单地遵循多个人的决定。
当个体的数量趋于无穷大时,发生级联的概率为1。因此在极限情况下,可以确定这个模型中级联一定会发生
利用网络方法研究流行度相关的一些基本概念。流行度时一种极端不平衡的现象:绝大部分人一生只在他们直接相关的社会圈子里被认知,少数人有更广泛的知名度,而极少数人拥有全球范围的知名度
如何量化这些不平衡?为什么会产生这种不平衡?
人们发现,拥有k个链入数的网页占比近似地与1/k^2成正比
ppt上的练习要求掌握
创新事物的传播
一种新的行为、做法、意见、约定或技术是如何在朋友的影响下,从一个人到另一个人在社会网络中传播。
侧重点:由信息效应产生的人与人之间的影响,当人们观察到他们网络邻居的决定时,便得到一些间接信息,促使人们也尝试一些新事物。
我们以基本的个体决策模型为基础构建一个新行为得传播模型:当个体根据邻居得选择而做出决定时,一个特定的行为模式就开始穿过网络连接进行传播。
1.一个网络协调博弈
在一个基本的社会网络中,每个节点有两种可能的选择,标记为A和B。如果节点v和w由一个边连接,那么对它们来说存在一个行为相匹配的动机。
相应的回报定义如下
对应的协调矩阵如下
如果有多个邻居,一些邻居选择A,另一些邻居选择B,那么v应该选择哪个选项使他的回报达到最大呢?
回报值对应为a,b。假设v的邻居中,比例为p的邻居选择A,比例为(1-p)的邻居选择B。如果有d个邻居,则pd个采用A,(1-p)*d个采用B
如果v选择A,得到回报为pda,选择B,得到的回报为(1-p)*db
如果pda ≥ (1-p)*db
则选择A更好,即p ≥ b / (a + b)
2.级联行为
新事物的传播与扩散的过程,节点设定门槛值,只有当大于门槛值时,这个节点才采用这个新事物
同质性往往可能成为扩散的障碍,使得创新事物难以从外部进入密集连接的社区
节点集为密度为p的聚簇:若其中每个节点至少有比例为p的网络邻居也属于这个节点集合
1.聚簇与级联的关系
断言:对于一个行为A的初用节点集,剩余网络中的节点采用行为A的门槛值为q
(1)如果剩余网络中包含一个密度大于1-q的聚簇,则这个初用节点集不能产生一个完全级联
(2)如果一个初用节点集不能产生一个完全级联,并且门槛值为q,则剩余网络一定包含一个密度大于1-q的聚簇
异值门槛值
掌握老师ppt上的这个例子即可
1.集体行动与多元无知
例子:一次示威游行,如果大量的人参与,那么政府会让步,如果只有少数人参与,那么所有示威者将会被逮捕
这是一个集体行动问题的例子,一项活动只有足够多的人参与,才会产生利益
多元无知现象:人们普遍地错误估计某些看法在民众地广泛性
比如在示威游行时,明明有足够多的人,但是这些人大多觉得自己只是一个小团体
沉默的螺旋:如果人们觉得自己的观点是公众中的少数派,他们将不愿意传播自己的看法。而如果他们觉得自己的看法与大多数人一致,他们会勇敢地说出来
2.集体行动的知识效应模型
门槛值k的意思是,如果能确定至少有k个人参加(包括我自己),那么我将参与这项活动
将上面的示威游行模型缩减为3~4个人的规模。假设每个节点代表一家公司的高级副总裁之一,每个人必须决定在第二天的董事会上是否要参加对抗不受欢迎的总裁
制度:一组规则,一些惯例等等
这里我们研究市场这个制度
人们参与市场活动时会带有一些信念和期望,而市场可以将这类信念合成为一个总体结果,这种总体结果的形式通常就是市场价格,表示对背后各种信息和信念的一种综合
外生预期:给定选择的好坏是固有的,与个体如何做决定无关
内生预期:一个预期是否成真取决于人们基于它的实际决定
可以将市场划分为两类
外生事件市场:符合外生预期
内生事件市场:符合内生预期
预测市场是外生市场的一个典型。
在预测市场中,参与者对某个事件的结果下注,相当于自己对事件的认识与一定的钱数之间形成交易,而钱的多少与事件的结果有关
由两匹马A和B比赛,A和B的赔付率为oA和oB,钱数w下注,下注A的比例为a,下注B的比例为1-a
预期回报 = 返回钱数的期望
如果a * oA > b * oB,则r = 1,否则r = 0
效用函数
刻画“好的感受”随财富量的增加而下降
取U(w) = ln(w),由于ln(w)是递增得越来越慢的函数
于是效用期望为
计算赛马场的赔付率
假设有n个顾客,按各自的信念下注,分别为w1~wn
an,bn = 1 - an
总赌注w = w1 + w2 + w3 + … + wn
假设一个有买家和卖家的市场。假设人们认为拿出来卖的二手车质量低。那么就没人会出高价来买二手车,结果就是,没人会出售质量好的二手车(因为市场价格低于其价值),这样,市场上就真的只有低质量的二手车了。另一方面,如果人们相信二手车也有不错质量的,那么他们可能就会愿意付出足够高的价格,使得有高低质量二手车的卖家都可能将车拿到市场上来。
不对称信息
卖家知道他所卖的车的质量,但是卖家不知道
称二手车特别差的为柠檬
假设有两种类型的二手车:好车和破车
卖家估值:10,4
买家估值:12,6
所有买家对好车占比的预估比例值为h
真实情况是:有g的比例为好车,1-g的比例为坏车
买家愿意支付的价格的期望为:12h+6 * (1 - h) = 6 + 6h
若预估h = 0,则出价为6。此时,坏车统统被卖掉了,而好车则没有一个卖出
所以看似结果是只有坏车,没有好车
若预估h = g,则要根据g的情况判定是否符合预期
若6 + 6g ≥ 10,即g ≥ 2/3,好车的卖家就会卖它的车,坏车也会卖掉,结果符合预期(预期自我实现)
若g < 2/3,那么好车一台也卖不出去,坏车全部卖出,不符合预期
4.彻底的市场失效
一个例子:有三种车,好车、破车和柠檬
假设如下
(a)假设卖家预期所有车都会出现在市场上
则一辆车对他的价值为(12+6+0)/ 3 = 6,好车卖不出去,不符合预期
(b)假设买家预期破车和柠檬,出现在市场上
则预期价格为(6+0)/2 = 3,坏车卖不出,只有柠檬,不符合预期
(c)预期只有柠檬出现在市场上
符合预期,市场上全是柠檬
注意:在这个柠檬市场中,因为有一些坏车和柠檬,好车在市场上没法生存。即使没有好车,因为有一些柠檬,破车在市场上就无法生存。劣币驱逐良币现象
疾病通过一种接触网络传播,每个节点代表一个人,两个点之间的边表示他们有所接触,从而疾病就可能从一个节点传到另一个
与行为和思想传播的联系
流行性疾病与新思想和新事物在社会网络中传播有着清晰的联系。它们都是通过接触网络在人们之间传播,从这个角度看,它们表现出非常相似的结构机制——某种程度上思想的传播也是一种“社会传染”
一个最简单的传染病模型——分支过程
工作原理如下
基本再生数和二分法
基本再生数记为R0,是一个单一个体引发新病例数的期望值。在模型中,每个人会遇到k个人,每个人受感染的概率为p,因此基本再生数R0 = pk。疾病在分支过程中的传播结果取决于基本再生数是小于1还是大于1
断言:如果R0 < 1,则疾病将在有限的疫情波后以概率1消失。如果R0 > 1,则疾病持续在每一波以大于0的概率至少传染一个人。
刀刃特性:假设在一个分支过程中,R0略小于1,略微增加传染率p,结果可能使R0大于1,造成一个疾病的突然爆发。同样的啥效果可以以相反的过程发生,略微减少疾病的传染性将导致R0减少到1以下,可以消除疾病大范围流行的风险
流行病在传播时分为三个阶段:
在之前的SIR模型中,每个人最多只会感染一次疾病。而SIS模型允许节点多次感染
1.SIRS流行病模型
个体对疾病只具有暂时免疫性,而不具有长期免疫性
2.小世界接触模型
远程连接使得一个地区发生的事情迅速影响到其它地方,设这个远程连接的概率是c
有些疾病需要长时间在人群中传播
对于短暂接触,要对边加上时段的标注。只掌握关系图是不够的,了解关系的时序信息也是十分重要的
1.短暂接触的影响
如果节点u在时刻1患有疾病,就可能传染给通向节点y的所有节点,包括中间节点v和w
改变伙伴关系的时间参数可以改变疾病传播的路径
2.并发性
不同的接触时机不只是潜在地影响到谁会将疾病传染给谁,这种时序模式还可以影响到流行病整体的严重性。
并行伙伴关系是指一个人与两个或多个人有伙伴关系,并且有时间重叠
1.线粒体夏娃
我们可能都源自10万~20万年前的一个单一女子,可能在非洲,是我们所有人的母系祖先
2.一个单亲祖先模型
线粒体DNA的遗传是一个简单的单亲遗传过程
考虑一个群体受资源的约束,每一代的人口数量维持为固定的N。新的一代是由当前一代N个个体产生总共N个后代。新一代的每个后代由一个单亲产生,这个单亲实在当代中随机独立地选择