机器学习预测世界杯:巴西夺冠

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

3天后,2018年俄罗斯世界杯开打,首场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日拉开序幕。

每届世界杯最受关注的当属决赛,上届2014年巴西世界杯,东道主巴西队意外爆冷,只获得第四名,无缘决赛。今年的世界杯,不少机构/研究人员给出预测:德国将和巴西争夺冠军,并且,巴西队夺冠的概率更大些。

综合各种预测和民意调查,冠军几乎肯定在巴西、德国和阿根廷之间展开,虽然强强争锋喜闻乐见,但似乎也少了些惊喜。

机器学习和大数据的方法正越来越多地被用在比赛结果预测上,不仅是世界杯,也不仅是结果,球队组成、战术选择和球员训练都已经开始见到机器学习的身影。对于球迷和观众而言,人工智能也将展开一种全新的参与/观看体育赛事的体验。

机器学习预测结果:巴西获得冠军

肯尼亚的投资银行Genghis Capital Investment Bank的投资银行分析师Gerald Muriuki,日前在Medium上公布了他使用机器学习预测FIFA 2018的结果——巴西将赢得冠军

这一结果跟微软的AI和数据科学专家Sorin Peste的预测结果一致。

实际上,预测世界杯冠军是一个典型的机器学习问题,你首先预测每场比赛的获胜者,接着再预测小组赛、半决赛和决赛的冠军。在这个过程中,你需要进行数据整合、特征建模和结果预测。因此,很多机器学习或数据科学家,都做过类似的项目。

Muriuki和Peste两个人都是根据足球比赛的历史数据,建立机器学习模型,模拟比赛,并预测这些比赛的结果。下面我们分别来看看。

使用逻辑回归进行预测

Muriuki使用了两个来自Kaggle的数据集,包含了从1872年到2017年国际足球比赛的结果。他先分析了两个数据集,做了一些特征工程,选择跟2018年世界杯最相关的特征进行预测,再足控了一些数据增强。

在模型的选择上,Muriuki用的是逻辑回归,一种分类器算法。逻辑回归通过使用逻辑函数预估概率,从而衡量分类因变量和一个或多个自变量之间的关系。简单说,给定一组相关的数据后,逻辑回归能够预测结果(在世界杯的情况下,就是预测是输还是赢)。

这是他的模型预测最初几场比赛的结果:俄罗斯vs沙特,俄罗斯胜利;乌拉圭vs埃及,乌拉圭胜利;伊朗vs摩洛哥,平局。4天以后就可以验证这个结果是对还是错了。

机器学习预测世界杯:巴西夺冠_第1张图片

16强的结果是这样的:

机器学习预测世界杯:巴西夺冠_第2张图片

四分之一决赛将在葡萄牙vs巴西,以及德国vs阿根廷之间展开。

机器学习预测世界杯:巴西夺冠_第3张图片

最终巴西vs德国,巴西获胜。

机器学习预测世界杯:巴西夺冠_第4张图片

使用随机森林进行预测

另一方面,微软的AI和数据科学专家Sorin Peste的预测过程则更加完善。在数据的选择上,除了历年世界杯结果,Peste还使用了欧洲杯、奥运会等大型比赛的数据,以及这些比赛的胜率分布。

转载于:https://my.oschina.net/u/3611008/blog/1828839

你可能感兴趣的:(数据结构与算法,python,人工智能)