“众包”数据新闻工作者获取源数据的方式之一,简单来说就是让很多人一起生产数据,这些“人”可能就是该作品的受众本身。以体育比赛为例,球迷是实现“众包”潜在载体。
目前体育类数据新闻作品大多聚焦于比分结果、过程性比分、判罚数据、某场比赛/赛季中运动员技术动作、运动员个人历时性数据统计、队服及其他装备样式等,其主体大多为比赛、运动员、裁判、教练、装备。而事实上,体育的社会功能之一在于娱乐性,娱乐的主体除了竞技带给运动员快乐之外,还有体育迷观看比赛获得的快乐。“粉丝”是体育比赛不可忽视的主体,也应该得到数据新闻的重视。
那么问题来了——粉丝能有什么数据呢?买国安vs上港的票花了多少钱?不同年龄段的球迷喜欢哪些俱乐部?梅吹和罗黑怎么互怼?……
买票花了多少钱:这个数据趣味性弱,“强强对决票价贵”的结果显而易见;球迷对俱乐部的喜爱情况:数据缺少科学性且不易收集;关于球迷态度的文本分析:有一定操作性,对分词的语法要求高,此外对语义分析的结果是否有新意存疑。
球迷数据可能存在的问题:
第一,标准不统一。“喜欢梅西”,到底是多喜欢,就算是量化成0-10分,每个人对数字的理解也不一样。
第二,采集方式不够科学,数据具有偶发性。“选取500位中传球迷作为样本”,这500人无法代表全世界球迷的看法,说服力较弱。
第三,数据不易收集。个体数据具有偶发性,大规模收集群体数据具有一定难度。当然,可以考虑给工体每个座位按一个投票器,收集现场五万多球迷的偏好。只是开个玩笑,这种工程量之大可想而知;该方法也无法收集非现场的千万观众的态度数据。
Economist联手Siemens(西门子)做了一组作品Reimagine the world,以声音为切口来看到平常之事。
其中Reimagine the game以多场拜仁慕尼黑俱乐部(FC Bayern München)的比赛为例展示了球迷在比赛过程中的呼声大小变化。这一次,球迷成为了主角,该作品也通过声音这一元素实现了球迷的数据众包收集。这个是我看到的第一件让球迷行为成为主体的数据新闻作品。
受众进入Reimagine the game后,首先可以对俱乐部进行选择,即哪支球队与拜仁慕尼黑的比赛。
Reimaginethe game先给出90分钟全程球迷的声音音频并配以声音大小的3D柱状图。其中进球、犯规给牌、VAR等关键节点特殊标出,受众可点击回听特定的20-30秒音频。
进入细分导航可以从以下4个方面对观众的反馈进行详细了解:Game Timeline, Fan Energy, Highlights, Players, Social Ripple.
Game Timeline(全局了解,悬浮可观看声音变化原因)
Fan Energy(详细了解现场观众的声音整体大小变化,通过量化指标来展现)
Hightlights(读者可点击进入goals、speacial moments、fans、attempts四个子项进行横向对比)
Players(读者可以看到呼声最高的前五名球员,即在他们进球、解围、阻挡时观众的反应最为强烈)
Social Ripple(可以看到比赛中、比赛前后12小时共2类时间范围内,推特上对2支队伍的态度)
2018年10月6日,门兴格拉德巴赫主场对阵拜仁慕尼黑,门兴格拉德巴赫最终以3:0获胜。猜一下现场观众情绪最为热烈,或者说哪一时刻球迷声音最大?首粒进球时?追平比分的关键进球?都不是。通过Reimagine the game可以看到,当出现对主队“不利”的判罚时,现场观众反映声音最大!
比赛第10分钟,门兴格拉德巴赫收获首粒进球,此时观众的声音指标是75。
第16分钟门兴格拉德巴赫完成第二次射门,比分来到2:0,此时观众声音指标75。
比赛第68分钟,门兴格拉德巴赫球员完成射门,立刻被边裁判为无效——越位了(offside),此时观众的声音指标达到了82,这也是正常比赛最“吵”的时刻。
出现对主队的不利判罚时场内声音最大,这一点也是可以理解的。
为什么不是在主场进球或客场进球时声音最大呢?进球时,进球队非常兴奋,声音大;被进球的队伍可能会发出叹息声。主场的球迷数量肯定多,他们的声音会大于客队球迷的声音。
当主队受到不利判罚时,主场球迷肯定拍桌子暴怒啊,与此同时客队球迷会因对自己有利而欢呼。所以双方此时都处于“被点燃”的状态,自然此时声音最大。
Reimagine the game通过直观的数据(通过3D柱子的高低体现声音分贝的大小)阐明了这一事实,传递了某种意义上的新认知;此外,尝试了利用足球赛场上的数据的新方式。
文/Why