《权力的游戏》"啪啪啪排行榜"!
《权力的游戏》第七季已经开播到第三集了,每周除了翘首以盼熟肉资源之外,最揪心的就是——这周又有哪些主角要领便当了。
我可能不是唯一一个想知道我最喜欢的角色将要达到什么样的结局的人。
第六季结尾,片方为了节约片酬,让丧心病狂的色后在大教堂埋了炸弹,直接KO掉了一大批人。
这不,还真的有粉丝刻苦专研剧情发展,为剧中的 94 个主要人物建立了一个关系网,做出一张准确率极高的“啪啪啪排行榜”,即“死亡概率表”(第七、八两季)
目前为止,多恩的沙蛇、高庭的荆棘女王,两位重要的权谋家已经挂了,和这张“死亡概率表”非常吻合!
这位“疯狂的”粉丝名叫Milan Janosov,中欧大学网络科学中心博士研究生。
他以人物社交关系为基础,构建一个基于真实场景下社会系统的聚合网络。网络图中的每一个顶点代表剧中的一个角色。每一对角色之间的链接的权重代表了这两个角色的社会联系的强度。
数据源:节目字幕
收集形式:对话
通过提取前六季的英文对话字幕,第二季和第三季的大部分情节都不见了,但剩下的四季形成了一个超过600个场景对白的语料库,以场景为单位(每集平均约有20个场景),对角色之间的关系进行分析处理。
交集越为明显,这两个角色之间的链接权重就越大。
场景是社会互动的基本单位(平均情节包含大约二十个)。这意味着每一个在同一场景中出现过一次(两次)的人都有一个(两个)的力量,在一个场景中,每个人都与每个人都有联系。
换句话说,场景就像图论中的完全图或“团”,增强了每次一起出现的角色之间的联系。
通过分别计算每个场景的完整网络图谱,再将所有数据聚合起来,我们就获得了维斯特洛的完整社交网络图样,内含约400个顶点,和3000条边。
在网络图中,每个大家族都用不同颜色进行区分(比如斯塔克家是蓝色,兰尼斯特家是红色,马泰尔家是黄色,等等),其他的角色用灰色表示。
每个顶点的大小跟该角色拥有的边的数目成正比,最受欢迎的几个角色已用标签标出,权重太低的一些无关角色则被滤掉了。
数据图展示分析
- 琼恩·雪诺周边有一个相对独立的小圈子。
这说明绝境长城周边的人们和维斯特洛联系较少。提利昂很特殊,龙妈通过他和网络的中心,包括君临城联系在一起。
- 在图的中心,我们可以看到两个巨大的社群,
分别代表着斯塔克家族和兰尼斯特家族以及他们各自的影响力范围,例如斯塔克和徒利家族之间的纽带,兰尼斯特和马泰尔家族之间的冲突等等,在故事的中心地带编织出一张稠密的大网,形成人物关系的核心。
接下来就是技术工作了。通过各种度量来计算每个节点的重要程度,并用这些度量来衡量对应的角色在整个维斯特洛的社会生态系统中的重要程度。我们采用的部分度量有:
- 1)节点度数——某个节点和多少个其他节点相连;
- 2)节点权重——某个节点上所有的连接的权重之和;
- 3)聚集度数——某个节点的所有联系节点中,相互之间也相连的比例有多少;
- 4)介数中心性——某个节点是否处于网络信息流的“交通要道”上,也就是任意两个点之间的最短路径有多少是经过这个给定的节点的。
除了衡量重要程度之外,我们还研究了前六季中每个死亡角色的数据,将网络中的具体位置和角色生存的可能性挂上钩。
也就是说,他希望训练出一个机器学习算法,能通过角色所处的具体网络位置,预言出某个角色的死亡。
基于以上数据,对接下来谁会死进行一些有根据的猜测:这些活着的人中,有哪些跟已经死了的人,有着最接近的网络特性指标?
于是,这个问题就类似著名的流失问题,我们可以用多种基于分类的算法来解决。在本次分析中,我们采用了多种算法中最精确的一种——支持向量机(SVM)算法。
机器学习算法将上面说的所有网络特性都纳入计算,根据目标变量的可能取值作出预测。为此,样例数据被多次随机分成测试数据和训练数据两部分,每次分组后都按训练结果对测试部分进行预测,并评估预测结果的准确度。
在交叉验证策略下,SVM 分类器的预测正确率(现在死了没有)大约在72.3%左右,从提供的测试数据的大小和属性来说,这个结果还算可以了。
重点来了
机器学习的优势都在于,它能从巨量的属性数据中,发现出潜在的关联。在预测过程中,他用了5折的交叉验证,并重复了100次,以达到一个比较稳定的预测概率,以及误差值。最后他制作了一个图表,对仅存的主要人物,根据他们的死亡概率进行了排名。
排名第一的是小沙蛇——特蕾妮·沙德(Tyene Sand),最有可能死亡,概率是0.95。
实际上,从S7E02开始,3位小沙蛇和她们的母亲,或在海战中被干掉了,或被瑟曦弄死,弥塞拉的仇也算是报了。这样一来,多恩就后继无人了。
难以置信名第二的居然是龙妈,概率为0.91。
这个让人“不能接受”的预测,恐怕也是机器学习算法的缺陷。我们认为:由于龙妈的整个家族已经不在,因此她继续存活的可能性极大。不过,《权力的游戏》从来都不害怕杀掉剧中的关键人物。
龙妈如果本季就挂了,片方和马丁胖子恐怕要被寄刀片了,龙妈和囧雪都还没xxoo呢,怎么能挂!
第三位是灰虫子(Grey Worm),无垢军团的指挥官,刚和弥桑黛啪啪啪过,死亡概率为0.90。
随着剧情的发展,剧迷也推测出,本季灰虫子很可能会挂,第三集凯岩城不攻自破,背后肯定藏着什么阴谋,不论如何,还是希望他能挺过去!
第四位的罗宾·艾林(Robert Arryn),恐怕很多人都记不住了。他就是那个新任鹰巢城公爵,预计死亡的概率是0.90。
什么,宝宝还小不想死??抱歉,凡人。
第五名是维斯特洛大陆中,最具天赋异禀的男人(你懂的)——波德瑞克·派恩(Podrick Payne),美人布蕾妮的侍卫,死亡率为0.88。
你们的无面者贾坤Jaqen,死亡率0.87,排名靠前,不过尚不确定他会在本季露面。所以迷妹们暂时不用担心。
至于狼家仅存的四位,二丫以 0.84 排名最靠前,看来二丫日子也不好过。三傻排名居后,暂时安全;至于囧雪,不用看也知道,这家伙已经被复活一次了,一时半会是开挂死不了的。
狮家的三位,排名最靠前的是弑君者,有超过0.6的概率,不过还是暂时安全。万人厌恶的色后,本季死不了的,因为她的死亡概率只有不到0.3。
至于大家都喜欢的小恶魔提利昂·兰尼斯特,虽然只有0.52的死亡概率,但鉴于小指头培提尔·贝里席有0.50的死亡概率,有可能小恶魔会先走一步。
另外,最不可能死的,居然是臭佬席恩·葛雷乔伊(Theon Greyjoy),事实证明,面对自己的亲姐姐被抓,他居然没有觉醒,而是选择临阵脱逃,虽然死不了,估计活下来也够呛
终极死亡排名如下:
这份名单告诉我们许多有趣的事情。
首先,Daenerys似乎很有可能会死去,一批投机重叠,而提利昂和琼恩·雪诺似乎是相对安全的。
其次,无论是广受欢迎的艾莉亚·史塔克和不友好的猎犬,已经如此接近死亡很多次,都是在危险的位置。
令人惊讶的是,Cersei,现在坐在铁王座上,和Baelish谁会尽力去得到那个似乎是一个更好的位置。看来乔拉·莫尔蒙会找到他的病情的治疗方法,尽管他已经治愈,Theon Greyjoy有可能还活着。可悲的是,同样不能这样说Arryn家族。
知道真相的你也不用太伤心,因为本剧的宗旨就是:凡人皆有一死。
文章内分析原出处:CEU,原作者:Milan Janosov,
文章内分析翻译自:Network Science Predicts Who Dies Next in Game of Thrones
[1] https://genius.com/search?q=game+of+thrones
[2] http://blog.yhat.com/posts/predicting-customer-churn-with-sklearn.html
一只阿木木