共创模型

一个显而易见的事实是,进入互联网时代以来,数据量每年都在呈现指数级增长。

01 共创模型.png

在这样的背景下,基于数据的各种各样的算法模型就在慢慢慢慢影响着我们每一个人的生活,这是时代发展趋势所致,我们避无可避。随着算法模型逐渐深入人们生活的方方面面,算法在给人们的生活带来便利的同时,在带来了诸如群体歧视等问题,甚至在冲击人类民主制度。

02 共创模型.jpg

关于算法歧视,感兴趣的朋友可以上 Netflix 观看一部写实纪录片,名字为《CODE BIAS》(代码偏见),在这部纪录片中,就描述了我们现在大行其道的算法是如何区别对待男人、女人、白人以及黑人的。

有了这个背景知识的输入,我们再来看《去中心化社会:寻找 Web3 的灵魂》第七部分(多元的意义建构)内容。

这部分首先指出了现在的预测模型的局限性,利用 AI 进行预测时所使用的数据由垄断机构四处搜集而来,然后将这些收集来的数据拟合来进行预测,但是这些垄断机构使用这些数据既没有征得数据生产者的同意,更没有给数据生产者任何利益。这种行为在国内外普遍存在,区别在于在中国是公开进行的。

预测市场采取了相反的方法,人们押注结果以期获得财务收益,完全依赖金融投机的经济激励(“fructus”收益权),不需对投注者的看法作合成处理并产生组合模型。

预测市场这段话,我还理解了蛮久,感觉理解地也不是很透彻。看到后面有用合约在阐释这个问题,我想从合约着手去理解可能是一个比较好的方向。

Google 了一下,加密货币合约是一种期货合约(Futures Contract),顾名思义,这是一种「未来/Future」合约,即买未来的价格是或者 。因为我自认不属于聪明的那拨人,从不碰合约,对合约是比较陌生的。

从合约的形式上来看,有点像赌博买大小。每个人基于自己对市场的分析用钱来投票,我想参与合约交易的人们内心都有一颗以小博大之心。

合约如若具有赌博性质,那么从合约的角度去理解这里的预测市场,看上去指的更多的是个人对于市场的预测。因为盈亏自负,在这种场景下,自然就不需要利用看法去训练模型了;至少,抽佣的中心化平台永远有钱赚,它们并没有动力去做这样的事情。

预测市场到预测多元性

这部分内容貌似是将对象指向了一些分析机构,这些分析机构可以利用市场上的一些公开或未公开的数据训练模型,从而预测市场走势。那么,当这些分析机构参与合约交易时可能会比个人更有优势,我理解分析机构和个人就对应着论文中提及地 “聪明人” 和 “愚蠢人” ,当这两种对象在一起参与类似合约的零和游戏时,就会导致严重的财富倾斜问题。更为重要的是,风险厌恶型选手(比如我)会本能地拒绝参加这类游戏。也就是说,这种机制下的规则不具有普适性。

如果换一种思路提取看法呢?

我们不是机械性的预测市场,而是利用二次方模型将团队议事转变为可全员参与的概率估计加权。这样不仅每个人都可以利用自身的专业特长参与到市场中,而且能够将零和游戏变为正和游戏。在这样的游戏规则之下,每个人都有可能收获市场成长带来的红利。

巧了,SBT 在这方面可以发挥巨大作用。因为 SBT 被设计为基于个人的社交图谱而被创建,那么利用 SBT 去构建模型必然会让模型具有全新的特性,这里的特性最直接的就是平等对待,以及基于平等对待的对于个人看法的恰到好处的加权。于是,我们能够更有效率地发现真正的专家并且能够让更大概率是准确的看法和优质信息获得更多曝光机会。

人工智能到多元智能

这个部分就比较好理解了。很多国家机器收集我们的个人数据时是不关注我们的社会背景信息的,比如环绕在我们的身边的无处不在的摄像头以及监视器,利用这些工具收集而来的数据构建的模型大多用于公共基础设施,可无论公共基础设施做的再好,我们每个人作为 “原料供应商” 并没有得到直接的激励。还有一种情形就是那些大型互联网巨头,他们利用自身生态系统肆无忌惮地收集着我们的数据(这些数据虽然有一定的社会背景链接,但是不可能完整,因为没有任何一家互联网巨头拥有用户完整的社交图谱,这也意味着说这些数据是相互割裂的)训练自己的模型,用来优化自己的服务。如果说公共基础设施还让我们间接受益,那么这些互联网巨头则是在没有出让半点利益的情况下就拿到了我们个人数据的所有权、使用权以及收益权。

同样的,SBT 能够在改变这种令人无奈的现状方面发挥巨大作用。同样是因为 SBT 被设计为基于个人的社交图谱而被创建,我们就可以利用 SBT 来为人们创造各种经济激励机制,而且我们作为数据生产者,我们将拥有数据的追索治理权。

怎么理解呢?

我们提到真正的 web3 时代到来需要基于人们共享自己的个人社交图谱,一开始至少是部分共享。那么我们在 web3 的世界中,天然就可以利用这些已经公开的数据创建模型,请注意,创建模型这事儿从这时候起就不是某一个或某几个中心化机构才能去做的了,而是理论上每个人都可以去做这样的事情,因为数据全部都是公开的。

与此同时,我们所身处的每个社区拥有这个社区数据的治理权,数据使用者可以和社区协商取得数据的更多权限,当然社区也会从基于数据构建的模型产生的经济效益中获益,进而由社区分配给社区中的每个成员。

又由于每个人都可以构建模型,未来的算法模型必然会呈现爆发性增长,整个世界会因为算法模型的多元化而走向多元化。可以想象,在这个进程中,纪录片 《CODE BIAS》(代码偏见)中的歧视现象也就不复存在了。

可编程的多元隐私

这个部分也不难理解,只是需要一些背景知识输入,在我看来,可能有两个背景知识需要知晓一下。

第一个就是剑桥分析数据丑闻,Facebook-剑桥分析数据丑闻是指英国咨询公司剑桥分析公司在未经Facebook用户同意的情况下获取数百万Facebook用户的个人数据,这些数据主要用于政治广告[1]。Facebook的用户数据是被一款名为 "这是你的数字生活 "(This Is Your Digital Life)的应用收集[2],该应用由数据科学家亚历山大·科根(英语:Aleksandr Kogan)及其公司Global Science Research于2013年开发。该应用是一款问答应用,通过提问来收集用户的回答,并能通过Facebook的Open Graph平台收集用户的Facebook好友的个人数据。该应用获取了多达8700万份Facebook个人用户资料。剑桥分析公司获得这些数据后对此展开分析并根据分析的结果为2016年泰德·克鲁兹和唐纳·川普的总统竞选活动提供帮助[3][4]。

2018年,剑桥分析公司前员工克里斯托弗·怀利在接受《卫报》和《纽约时报》采访时向他们透露了有关Facebook数据被滥用的内幕[5]。消息曝光后,Facebook为非法收据数据事件而道歉,此外Facebook的CEO马克·扎克伯格还不得不前往美国国会作证。2019年7月,联邦贸易委员会宣布Facebook因违反隐私规定,必须缴纳50亿美元的罚款[6]。2019年10月,Facebook同意向英国信息专员办公室(英语:Information Commissioner's Office)支付50万英镑的罚款[7]。2018年5月,剑桥分析公司申请破产[8]。

03 共创模型.png

关于剑桥分析丑闻,Netflix 有部名为《THE GREATE HACK》纪录片详细叙述了里面的细节,感兴趣的朋友可以找来看看下哈。

第二个就是计算广告系统,简单来说就是各大互联网巨头在很大程度上都是广告公司,因为他们最大限度地利用了自家的产品成功获取到了大家的注意力。也就是说,他们拥有流量,那么他们拍卖流量就是自然而然的事情。

而现在的广告系统背后也都是有着算法模型,因为要自动化地实现流量根据价高者得的同时又不能损害自身生态系统,人工是不可能做到的。这里面还涉及到各大相关方之间的博弈,也非常有意思,我之前写的一篇文章《互联网广告那些事儿》就主要谈及地是这方面,列位可以再回顾下。

好了,有了上面两个背景知识输入,我们再来看 “可编程的多元隐私” 这部分内容就比较好理解了。

这里重点就是说数据的生产者要拥有书的治理权,也就是数据要想私有产权那样作为人们的所有物而存在。因为我们的数据要不要披露?何时披露?以及披露到何种程度?都应该由我们决定。

而基于个人社交图谱的 SBT 可以根据我们在不同社区的不同身份将我们的数据特别是隐私数据代码化,具体实现还有待深入研究,不过理论上是可行的。

与此同时,SBT 还可以很好的将我们的数据权利解构成 “使用权”、“处分权” 以及 “收益权”,从而能将数据产权分解成非常细小的单位。类似于比特币的最小单位为 “聪” 这样的存在,那么,个人对于数据产权的灵活配置就可以实现了。

最后,在这样的机制下,全新的 “注意力经济” 将会产生,中心化机构在这种 “注意力经济” 下将不再是主角。我们每个人都能更加充分地参与其中,到那个时候,只要有实力,就真的可以实现 “海阔凭鱼跃,天高任鸟飞” 了。关键在于,我们再也不用担心自己会被封号了,或者不敢发表自己的看法了;到那时,可能才是个体崛起最好的时代吧。

你可能感兴趣的:(共创模型)