今天想跟你讨论的话题是 “大数据会颠覆公共利益吗?”
这个问题是受到了一本书的启发,来自诺贝尔经济学奖得主梯若尔(Jean Tirole)的新书《公共利益经济学》(Economics for the Common Good)。
梯若尔的学术贡献跨越合同理论、产业组织、竞争市场,在今天越来越专业分工的经济学研究当中,他已经是一个少见的多面手。但所有这些,都集中于一个主题,就是公共利益。
他这本书《公共利益经济学》可以说学界期待已久。
“无知之幕”与公共利益
什么是公共利益?
梯若尔没有下定义,只给出一个Siri式的回答:它是我们对社会的共同期望(our collective aspiration for society)。
显然,它取决于价值判断,期望因人而异,怎么找到共同期望这一交集?
梯若尔有办法。他说:
“假如不知道自己是男人还是女人,健康还是生病,富有还是贫穷,受过教育还是文盲,有无信仰,生于城市还是乡村,追求事业成功还是生活自由,不知道所有这些,那么你希望自己生活在什么样的社会里?”
这个问题起源于“无知之幕”,著名哲学家罗尔斯的思想实验:假设人们站在无知之幕后面,不知道自己走出幕后有何地位、处境、身份,以此为前提讨论公共政策。如果公共政策是不公平正义的,那么主张它的人同样可能成为被损害的对象。
在无知之幕后产生的公共决策,能保护社会中最弱势的那些人,因为那些人可能就是每个人自己。
选择从无知之幕来看公共利益,梯若尔将自己置于一个伟大的智识传统之中,它起于霍布斯、洛克,经由康德、卢梭,通过罗尔斯,来到今天。
梯若尔说, 只要个人利益之间存在冲突,个人利益与公共利益就会分叉,但在无知之幕后面至少能部分地汇合。这里是追寻公共利益的起点。
《公共利益经济学》范围极广,而用博弈论和信息经济学贯通。梯若尔说随便从哪章读起都好。我最有启发的是大数据时代的公共利益这部分。大数据是把双刃剑,带来更高效率,更多方便,也使我们处于几乎永不间断的连续曝光之中。
效率和公平之间的永恒挑战,在大数据社会到来之际,横亘于个人、互联网公司、政府之间。这正是规制问题的最新边界,梯若尔最擅长的领地。
从保险行业看大数据利弊
从保险说起。
不要以为保险乏味,它是历史最悠久的金融现象,也是今天许多最深奥金融衍生品的本质内涵。它应对一个历久弥新的问题:如何分担风险?
风险的本质是未知,跟赌场一样,保险公司无法挑选客户,至少是无法充分挑选客户:你没法知道每个人的健康状况,这只有他自己最清楚;但每个年龄段人群的健康状况、平均预期寿命、得各种常见大病的概率,这些是可以知道的,正是保险公司的老本行。
自现代寿险公司出现以来,就是根据你在哪个年龄段,收你相应水平的保费。它不必知道每个人的健康状况,生意的保障是大数定律。
问题是有人的地方就有人钻空子。可想而知,投保之后,有些人烟会抽得会更凶,有些人车会开得更彪悍,反正有保险兜底。 这就叫道德风险(moral hazard),其实它与道德关系不大,主要是激励错配,保险反而激励了原来不想激励的行为。
羊毛出在羊身上,买保险所获得的保障来自保费。道德风险使不负责任的那些人占用了较多的保障,结果要么是提高保费,要么是别人的保障减少。没人想当冤大头。规矩人就会退出保险,结果是逆向选择(adverse selection)。投保人中规矩的越来越少,不规矩的越来越多,只好保费越提越高,直到有一天高到没人投保,除了就是想来骗保的。生意到此就算做砸了。
为了对付道德风险和逆向选择,保险公司得打各种补丁。比如说,健康保险不负责投保前已经得的病;又比如说,每次看病你要先付一部分钱,超过的再做赔付。补丁有点用,不精确。
今天,大数据时代到来,游戏发生180度反转。个人的健康数据、行为数据、信用数据能见度越来越高,道德风险、逆向选择这两大武器现在站到了保险公司一边。
以前,保险公司了解你的信息颗粒度只到你在哪个年龄组,现在则可以精确到个人:你的病史、家族病史、买药记录等等,无所循形。别以为你不想占保险公司的便宜就可以,现在是保险公司想占你的便宜。他们可以精挑细选,挑出那些健康客户,那些不太健康的客户只能付出更高的价格,至于那些特别不健康的客户,直接拒之门外。
保险的本质是社会发明的风险分担,把接近但不尽相同的风险放在一个池子里,标准化定价。今天,无所不在的传感器、移动互联、人工智能技术,使获得和分析每个人的风险数据变得极方便,成本极低,像手术刀一样精准地把每个人从风险池里剖出来,一人一价。这还是保险吗?
不要以为传统保险公司掌握新技能比较慢,这一天到来就很远。他们不行有人行。腾讯和阿里系都有了保险公司。不要以为尽量不让网站收集信息,你就能免于被精准定位。 网络实名制下,你在所有网站上发生的所有行为,直接与你的身份关联,无法从无缝的数据收集网中逃离。
这并非对所有人都是坏事。比如说,你不抽烟不喝酒小心开车,保费多半会下降,因为不用补贴那些抽烟喝烟乱开车的人。他们乱来是自己的事,只要是自己负责就行。这点没争议,也是大数据为保险注入的正能量。
但是,把极度充分掌握信息带来的精准差别定价推到极处,各担各的风险,各付各的保费,风险分担不复存在,保险的基础也就没了。社会准备好了吗?
举个相似的例子,今天上电商网站买东西,已经出现不同用户看到不同价格,电商网站根据你的网上、网下行为给你画好像,据此最大限度地差别定价。本来在某个价格成交意味着卖家和买家都有所得,对应着所谓的生产者剩余和消费者剩余。
精准的差别定价意味着卖家最大限度把消费者剩余拿走。你愿意吗?
回到保险,如果不作任何约束,可以想象得到的终极情形是这样的:基因健康的人买低价保单,基因没那么健康的人买高价保单。这公平吗?
没有简单答案。有人认为公平,有人认为不公平。只是提醒一点,基因跟抽烟喝酒开车违章不同,我们可以控制自己的行为,但完全无法控制自己的基因。 如果发展到根据每个人的基因区别定价的地步,那么不仅保险的本质也就是风险共担被摧毁了,同时被摧毁的还有社会最基本的互助机制。
充分、透明、不受约束的数据使用,就有这样大的破坏潜能。
梯若尔的数据公共利益原则
靠自己小心,没用;靠互联网公司自律,看起来是南辕北辙。出路只能靠规制,这正是梯若尔的长项。但即使是他今天也无法给出答案,而是回到无知之幕后面,给出了两条原则:
第一条原则有关数据:数据属于谁?互联网公司占有和使用数据应该受何约束?
梯若尔说,关于数据,互联网公司与用户之间现在是个不完全合约,且对用户极为不利。
首先,为个人数据保密越来越应该像医患保密关系一样重要,但现实差距太大。前不久美国最大征信公司之一艾可飞(Equifax)被黑客入侵,才发现这些本应该固若金汤的公司其实只是皇帝新衣。
一位国内资深互联网安全专家说,其实对一家公司来说,数据泄露只是概率问题、时间问题。
其次,互联网公司普遍滥用用户数据,甚至转售第三方。你在某某宝上购物,过一阵你在某某微博上就收到定向广告推送。有人觉得方便,有人觉得添堵。更何况,互联网公司给用户的用户协议是畸形的。如果有耐心细看中国网站的用户协议,会发现里面说了,你在上面所写的一切内容都属其所有。
数据属于谁?如果数据变成未来最主要的价值源泉,那么用户还能不能控制自己的数据?还是说它们会控制在互联网公司的手中,而用户无能为力?
梯若尔认为正确原则应该是这样: 如果是互联网公司通过巨大投资和创新方法才创造出的用户数据,那么它可以从拥有和使用数据中获利;但如果获得数据很容易、成本很低,且由用户主动提供,那数据就应当属于用户自己。
第二条原则有关风险分担。
梯若尔说,个人能控制的风险应当由其自己承担,在其控制以外、对之无能为力的风险,应由公众一起分担。每个人应当为其抽烟喝酒的行为负责,但不应为有高致病风险的基因承担责任。站在无知之幕后面,你不希望自己活在一个因为基因有缺陷就活该倒霉的社会里。
今天我们站在大数据社会的门槛上,互联网公司一马当先,消费者喜忧交加,政府规制远未跟上。如何实现大数据时代的公共利益,应该从思考梯若尔的两原则开始。
本讲小结
总结一下, 我们今天的思维训练讨论的是大数据和公共利益的问题,大数据对个人信息精准的获取,首先颠覆了我们了解和分担风险的方式,继而也会影响我们对利益的分配方式。
在大数据面前,企业能不能使用公共利益,能使用到什么程度?这是一个尚且没有社会共识的问题,感兴趣的你可以看看梯诺尔德这本书《大数据与公共利益》。