法国队夺了世界杯冠军，却彻底打了AI预测的脸

此前，高盛、瑞银、多蒙德大学等都利用AI技术对2018俄罗斯世界杯进行预测。比赛结果却大相径庭：高盛认为巴西最终会捧起大力神杯，瑞银推断是德国。AI预测足球赛，还没那么准。

随着法国和克罗地亚的决赛，法国队夺冠后，这届俄罗斯世界杯也宣告结束。

本届世界杯，我们见证了一场场精彩的比赛，看到每个队的球员为了国家荣誉勇敢拼搏，也看到了现场的观赛的球迷，充满激情地为自己的国家加油助威。
除了精彩的比赛，这届世界杯也引入了诸多科技——5G、VAR、智能设备、人工智能等，其中，AI赛事预测在世界杯的应用最为人们关注。

咨询机构、金融机构、博彩公司、科技企业等都在赛前或者赛中，利用AI的各种算法模拟预测数千万场比赛，进行每场比分预测，预测大赛冠亚军。

有趣的是，人工智能的预测结果却差强人意。赛前，高盛集团利用数据挖掘、机器学习和计量经济学对比赛结果进行了百万次模拟，从而预测出每轮比赛中的胜利者。高盛最后得出结论：决赛中，巴西队会击败卫冕冠军德国队，最终捧起大力神杯。

这样的例子还有：德国多特蒙德大学研究者，通过设计的独立AI产品预测到，西班牙将赢得大力神杯；瑞银集团则在使用了“用以帮助客户挑选股票的计量经济学工具”后得到了“高度精准的模型”，认为德国队将再次捧起大力神杯。

可是，随着德国、西班牙、阿根廷、葡萄牙等传统豪门球队接连被淘汰，无论是足球圈、科技圈还是金融圈，对AI预测这件事充满了嘲讽声：AI预测被打脸，我们要“天台见”。

那么，AI是否能够预测比赛赛事？原理是什么？AI预测失败的原因是什么？相信看过这篇文章后，大家会有一定的答案。

一、 AI预测赛事，还在探索期

AI预测是基于企业历史数据分析、利用深层次的数据模型和机器学习等算法，替代传统人为的经验式决策，预测分析出结果，从而可以快速帮助企业搭建从数据分析到商业决策的桥梁，进而使企业在复杂的数据环境中找到最佳解决方案。

目前，AI 预测已经应用在金融、零售、制造、医疗、文娱等领域。如零售业的库存管理、产品销量预测；制造业的工厂设备故障预测；金融业的信用卡逾期还款预测和借贷风险预测；医疗领域疾病的预测；文娱领域通过AI预测奥斯卡奖项、AI预测综艺选秀节目的冠军……

这些场景都在实践AI预测，体育赛事也不例外。早在AI预测世界杯足球赛事之前，已经有人把AI预测到橄榄球、网球、篮球等领域。其中，“超级碗”比赛（是美国职业橄榄球大联盟NFL的年度冠军赛）是AI预测赛事最为典型案例。

2017年2月，美国的Unanimous A.I.公司利用自主UNU平台成功预测了“超级碗”的准确比分。此外，Unanimous A.I.准确预测了肯塔基赛马会的一项比赛结果，这项结果的赔率为540比1。这也让该公司创始人路易斯·罗森博格（Louis Rosenberg）用20美元赚到了1.1万美元。

据悉，Unanimous A.I.创始人罗森博格将“蜂群思维”引入UNU中，让用户可以通过移动游标，使结果更接近想要的答案，从而协调预测。在其平台上，AI提供后端算法，这些算法监控到用户在平台上如何互动，他们的互动是否表现出信心、过度信心或不确定性，并试图引导游标移动至最能代表群体观点的位置。

简单来说，通过蜂群实验，可以将预测结果与实际情况进行对比，罗森博格及其团队希望获得具有统计意义的足够数据来完善平台，让预测更准确。同时，其他研究人员也在多项研究中测试蜂群智慧的理论，也取得了良好的结果。

例如，根据相关资料显示，在牛津大学的一项研究中，美国足球迷被要求预测英超联赛的比赛结果。在他们进行预测时，准确率约为55%。而作为“蜂群”的一部分，他们的准确率上升至72%。

据悉，关于今年的“超级碗”，UNU也做出了预测，结果是爱国者队将以4到6分的优势胜出，比赛总分将超过48.5分。此外，UNU还成功预测了马克龙当选法国总统，不过这是题外话了。

再回到今年世界杯的AI预测赛事结果，以高盛集团为例，他采用AI技术，综合每个球队的小组表现、球员的个人表现、往年世界杯战绩等信息，利用机器学习模型将这些数据与2005年以来的世界杯和欧洲杯比赛得分进行对比，然后，他们还对世界杯进行了100万次模拟，最终预测结果显示，巴西最终将在决赛中击败德国。

然而，结果我们都看到了，德国、巴西全部出局，无缘世界杯决赛。那么，为什么AI预测在体育赛事里，预测结果如此不稳定？

二、缺乏有效数据

通过以上对比，我们不禁要问，AI预测“超级碗”比赛已经很不错了，为什么却惨败在本届世界杯上？答案是：赛事不确定性太强，缺乏有效数据支撑！

我们知道，AI的发展离不开数据、算法、场景化落地这“三驾马车”，其中，数据是基础，是AI的原材料，同时，这些数据是指企业经过处理和加工后的高价值数据。如果数据量不够、质量不高，很难训练算法模型，更别说产品化、场景落地了。

其实，早些年AI沉寂了很长一段时间，很大程度是因为算力以及数据的匮乏。现在，随着存储变得非常便宜以及数据大规模的爆发，涌现出了非常多的应用，这一时期的代表性事件为阿尔法狗大战李世石，使得AI重回大众视野中。

业内人士认为，体育赛事会带来大量人工智能开发者喜欢的数据。具体的例子包括篮球前锋的投篮命中率、橄榄球选手的跑动距离，以及足球中场球员的助攻等。体育赛事中还有其他不太明显的数据，可以让我们获得更精细、更完整的视点。

然而，在数据的数量和质量方面，并非所有体育运动都是平等的。例如棒球，很容易拿出球员的各项统计数据。而网球协会则会收集高精度数据集，其中包括比赛中球的运行轨迹，从而让预测分析变得更简单。

具体到足球赛事上，会涉及选手的身体状态，精神品质，球队士气、教练的排兵布阵、球员的临场发挥，裁判的争议吹罚等因素，这些数据不但会影响赛场发挥，也无法收集有效数据，反哺模型算法。

其次，有些比赛压根就没有数据。国家队之间的历史交战记录非常稀疏，这些数据没有任何借鉴意义，这样无法提供足够多的信号支持预测的结果。

此外，业内人士认为，数据本身也具有一定的欺骗性，毕竟在统计时，一脚世界杯进球和对方的乌龙球都会成为比分牌上的数字“1”，但这个数字却无法完全真实反映场上的情况。

总的来说，在足球赛事上，缺乏大量有效的数据支撑，同时球赛的影响因素充满着不确定性，无法通过数据反哺模型训练，这样就很难做出正确的预测。

原文发布时间为：2018-07-25
本文作者：i黑马旗下的
本文来自云栖社区合作伙伴“互联网er的早读课”，了解相关信息可以关注“互联网er的早读课”

法国队夺了世界杯冠军，却彻底打了AI预测的脸

你可能感兴趣的:(人工智能,5g,后端)