数据分析师看世界杯的正确姿势是什么?
约上老友,豪饮冰啤。
利用大数据,借助好工具,来一个数据分析视角下的冠军预测。
这才是数据分析师看世界杯的正确姿势。
今晚23:00,对全球的球迷来说都是个期盼已久的时刻,俄罗斯世界杯终于来了。
对于没有时间看球的加班党来说,不能和其他球迷一起感受激动人心的进球惊喜,总可以猜猜比赛的结果吧?
所以,首场俄罗斯对阵沙特阿拉伯,谁会赢?
像这样的令人跃跃欲试的猜测,能够持续31天、64场比赛。
到底谁能在7月15日的卢日尼基体育场完美上演冠军表现呢?不同主队的球迷可能有着完全不同的答案。
那么,作为一个球迷,当你看到下面这张图的时候,你最先看到的是哪面国旗?
你第一眼看到的国旗大概就是你心里的答案了。
当然你心里的答案也不是空穴来风,可能是源于对某个球星的疯狂热爱,也可能是因为你对各届世界杯的了如指掌,每个人都有自己判断的依据。
一、几种猜测方法
笔者总结了网上流行的几种预测方式,帮你成为“预言帝”
1.归纳演绎法
这应该是忠实球迷最常用的方式了。主要是基于个人对于球队、球员个人能力、阵容分析、历史战绩、球队主帅等历史信息进行判断。
以德国为例:德国队共参加过18次世界杯,13次晋级四强,8次杀入世界杯决赛,获得过4次冠军、4次亚军、4次季军,是世界杯的传统豪强。
而在上届世界杯中,德国以5胜1平的不败战绩闯入决赛,与梅西领衔的阿根廷争夺大力神杯。双方在常规时间内战成0-0平,格策替补登场,在加时赛中打入制胜球绝杀阿根廷,第四次夺得世界杯冠军。
以此方式对比各个球队的实力,通过小组赛抽签结果判断出死亡之组,然后分析能够出线的球队。再以此为基础判断后续的1/8、1/4、决赛结果。
根据这种方法,某球迷给出的他认为的夺冠热门球队是德国、巴西、法国、葡萄牙。
2.地域判断法
从世界杯近百年的历史来看,每一届的冠军都来自欧洲和南美洲。因此,综合历史和实力考虑,绝大多数的球迷都认为,今年的冠军依然会在这两个大洲中产生。
毕竟,非欧美国家在世界杯历史上取得的最好成绩是2002年打入四强的韩国。
至于这一届的冠军是来自欧洲还是南美?力挺欧洲国家的球迷给出了两个理由:
(1)历史结果
细数以往的世界杯,从2006年世界杯以后,随着意大利、西班牙和德国的连续夺冠,不少人觉得南美洲的球队大势已去。
哪怕是四强范围内,欧洲球队在进几届世界杯中也有着显著的优势。
2006年世界杯,四强分别为意大利、法国、德国、葡萄牙,2010年西班牙、荷兰、德国包揽了前三。到上一届的时候,虽然巴西和阿根廷都杀入了四强,但在半决赛中都分别输给了荷兰与德国。
(2)地理位置优势
因为时差、饮食、气候、文化等因素的原因,在同一大洲参与比赛的球队有着天然的优势。
不信你看,在欧洲举行的世界杯基本是欧洲国家队夺冠,在美洲举行的基本都是南美国家队夺冠,不在欧洲的日韩和南非世界杯,巴西和西班牙各下一城。
至于南美球队称霸欧洲举办的世界杯,历史上同样只发生过一次:1958年瑞典世界杯,17岁的贝利横空出世,开启了巴西足球四届三夺冠的伟大篇章。
3.游戏预测法
在众多球迷喜欢玩的游戏里,足球经理(Football Manager,简称 FM)这款游戏一定再适合不过了,因为这个游戏拥有庞大的数据库,而且玩家可以设置战术、选择球员,充分模拟比赛场景,为预测提供了有力的支持。
前不久一位国外的知名游戏主播用该游戏模拟了100次俄罗斯世界杯的进程,并且统计出了各个团队荣誉及个人荣誉的分布情况。
而他利用游戏模拟出最多次夺得世界杯冠军的球队是:比利时。
纵观以上的三种方法,不难发现,不论是归纳演绎法还是地域判断法,都是基于以往的数据+个人观点作出的判断,而游戏预测法可能更加偏向于机器根据以往数据作出的判断。
也就是说,我们是可以完全按照数据分析的方法进行预测的。
二、大数据如何预测?
1.Opta 的结论
Opta Sports 是一家总部位于伦敦的体育数据提供商,他们为此做出了自己的预测。当然预测并不是凭空而来的,需要有一些具体的参考条件。
Opta 在数据模型的建立中,会根据球队以往表现的数据来计算他们的进攻和防守能力,判断出每场比赛可能的潜在结果(胜平负)。
(1)历史比赛数据
在 Opta 参考的以往表现的数据中,包含的是世界杯之前的四年中所有的官方比赛结果得出的,包括世界杯预选赛、联盟锦标赛及预选赛、友谊赛、以及国际足联的联合会杯的比赛,当然也包括2010年以及2014的世界杯比赛。
(2)主场优势
他们计算了两个“主场优势”:第一个是关于东道主的,第二个是其他所有的球队,另外对于那些自1970年起赢得过世界杯冠军的球队(具有冠军血统的球队)也算做一个优势。
(3)未考虑到的因素
但是这些统计预测并没有算上一些球员的特殊情况,比如说某位球星明天如果受伤了,那么他的球队可能会因此受到影响。
(4)还有哪些影响因素?
对于以上预测所考虑的范围,很多人觉得维度太少,很难服众。那么,对最终的比赛结果能够产生影响的因素可能还有以下几个:主教练能力、球员大赛经验、心理素质、两队阵型、两队首发、裁判的执法风格、天时(天气、季节)、地利(场地海拔、向阳背阳)等等。除了以上这些,你觉得还会有什么影响因素呢?
此图由 Yonghong Z-Suite 球迷小分队制作
当然,Opta 最终的分析结果显示,最有可能在俄罗斯世界杯夺得冠军的球队是巴西(13.2%),紧随其后的是德国(10.7%)以及阿根廷(10.1%)。
另外值得一提的是,英格兰(2.1%)夺冠的概率还不及日本(2.2%)。
2.维克多的 AI 预测
维克多是俄罗斯彼尔姆国立大学物理系的大四学生,他制造出的能够预测世界杯结果的人工智能系统。并且,彼尔姆国立大学认为该预测的准确度超过80%。
维克多建立的这个人工智能神经网络,采用了对影响比赛结果的几条标准进行分析,标准包括天气、裁判、球员心情、球员状态、伤病情况,同时参考了过去几届的世界杯数据资料,得出了非常详尽的结论。
该 AI 预测出德国队会是冠军,亚军和季军分别是巴西队和阿根廷队。实力较弱的东道主俄罗斯会在32支球队中排名27。也就是说,该 AI 甚至不认为俄罗斯队能从小组赛晋级。自家人打自家人的脸,这个 AI 还是挺诚实的。
随着人工智能的进一步发展,这个结果可能会越来越准,到时候猜球可能就不仅仅只是靠运气,更多的可能会变成一项数据分析能力的比拼。可能未来会有一台人工智能的机器被赋予章鱼“保罗”的名字。
那么,你觉得这届世界杯谁最终能捧起大力神杯?赢得球迷的尖叫和眼泪呢?
Reference:
《喵?英格兰夺冠概率不如日本》 作者/Helen
《世界杯冠军的N种猜想》 作者/羽则
- End -
他们都在用Yonghong服务
人人都是数据分析师专区
点击“阅读原文”,免费申请
Yonghong Z-SuiteAI深度分析功能试用