通过数据可视化进行足球进球方式分析球员属性

在我们进行数据可视化之前我们需要了解足球世界的一些数据网站。

国际足坛数据三巨头:
1.Football Stats, Live Match Data and Player Statistics – Squawka.com
2.http://www.whoscored.com
3.http://www.fourfourtwo.com/au/performance
此外还有:
1.Footballdatabase.eu, The greatest source of football statistics on the Internet !
2.Opta Home
转会数据最牛逼的是德国转会市场:
European leagues and cup competitions
国内:
创冰的数据包括中超中甲亚冠五大联赛欧预赛和欧锦赛 比赛和球员的数据项也最全面 单场有15000多项
http://data.champdas.com

在这里我们需要将精准的图表与创意的视觉设计进行结合,来解读一些有意思的数据,讲述与众不同的球员故事。在这里作者借助不同球员雷达图的 「形状」 特点不同,来直观地对他们的场上表现进行分类

构建视觉空间

通过数据可视化进行足球进球方式分析球员属性_第1张图片
这是八边形上的八个参·数,按照位置分成三组:1 左边三个是 「头球攻门」 相关的数据,2 右边三个是 「用脚射门」 相关的数据,3 上下两个是 「空中对抗」 相关的数据

选择有效样本

在这里我们选择了14/15赛季以来,五大联赛打进头球最多的30名球员(超过10球)来作为 「所有优秀头球手总体」 的一个 「样本」。具体名单如下(按头球进球数排序):(更新至2018.5.15,来源 understat.com)
通过数据可视化进行足球进球方式分析球员属性_第2张图片
划分球员类型

回想一下,我们之前把这八个数据按照区域位置分了成三类:1 「头球攻门」,2 「用脚射门」,3 「空中对抗」。一个球员至少擅长其中一种,最多三种,所以,排列组合得到:擅长1,擅长2,擅长3,擅长1和2,擅长1和 3,擅长2和3,擅长全部,一共7种不同情况(当然,不考虑都不擅长的情况,这种人大概是进不了这30人名单的)、

只擅长 「头球攻门」,纯头球手,射门渣渣。这类人的图像是一个 「开口向左的扇形」,具体的定义标准是左三项显著高于其余五项。
通过数据可视化进行足球进球方式分析球员属性_第3张图片
只擅长2 「用脚射门」,真射门员,头球只是附带。这类人的图像是一个 「开口向右的扇形」,定义标准是右三项数据显著高于其余五项。
通过数据可视化进行足球进球方式分析球员属性_第4张图片
只擅长3 「空中对抗」,支点型高中锋。这类人的图像是一个 纵向发展的 「尖锥形」,上下二项显著高于其余六项。
通过数据可视化进行足球进球方式分析球员属性_第5张图片
擅长1 「头球攻门」 和 2 「用脚射门」,不擅 3 「空中对抗」。全能型得分手,然而做支点能力不行。这类人的形状是一个左右对称的 「蝴蝶型」 ,左右六项显著高于其他两项
通过数据可视化进行足球进球方式分析球员属性_第6张图片
擅长1 「头球攻门」 和 3 「空中对抗」,全能型头球手,可回撤当支点,可前插抢头球,脚下的技术成为唯一的制约。这类人的形状是一个「面向左边的半圆」,左三项和上下二项显著高于其他三项
通过数据可视化进行足球进球方式分析球员属性_第7张图片
擅长2 「用脚射门」 和 2 「空中对抗」,不擅1 「头球攻门」,支点型射手??(我自己造的词……)看似非常奇怪的组合,现实中并不常见,这类人的形状是一个 「面向右边的半圆」,右三项和上下二项显著高于左三项。
通过数据可视化进行足球进球方式分析球员属性_第8张图片
擅长全部。超级全能前锋,真·八边形战士,现实中几乎不存在。这类人的形状是 「近圆形」,定义的标准是八项数据没有一项显著高于其他。
通过数据可视化进行足球进球方式分析球员属性_第9张图片
按匹配度分档——谁才是各自类型的典型球员?
是身体卓著,天赋异禀的ta
还是球商极高,用脑踢球的ta
作者legendgw依靠数据可视化技术给出了他的答案

第一档:完美匹配。这些人简直就是各自类别的模板,不仅看上去像,而且严格符合类型定义中的标准
通过数据可视化进行足球进球方式分析球员属性_第10张图片
头球射术皆顶级,单凭印象流都可以判断,C罗毫无疑问是第四类 「蝴蝶型」 全能得分手,而他的雷达图形状恰恰说明了这一点。这个 「蝴蝶型」 标准的可怕——定义中要求的六项攻门数据全都超出了灰色均值区域,和他同类型的再无人能做到;两项争顶数据也同时低于均值,说明C罗这几年在场上完全不是支点中锋的打法。留意一下,C罗是所有30人里面,超出灰色均值参数最多的(6项)!!

通过数据可视化进行足球进球方式分析球员属性_第11张图片
天王盖地虎,标准如吉鲁!第一类 「左扇形」 纯头球手的代表,3项头球攻门的数据已经强到快要突破天际。至于用脚射门,自然不是很强,但也压在均值的灰色区域内。同时大家留意一下,吉鲁是所有30人里面,唯一的八项数据都不低于均值的(至少都达到灰色区域)!!
通过数据可视化进行足球进球方式分析球员属性_第12张图片
通过数据可视化进行足球进球方式分析球员属性_第13张图片
北伦敦的两位当家前锋,凯恩和奥巴梅杨,俩人几乎是一个模子里刻出来的,都是非常完美的第二类 「右扇形」 真·射门员(伪·头球手)。

第二档:略有瑕疵。这些人基本符合各自的模板,在一两个地方会有细微的出入。
通过数据可视化进行足球进球方式分析球员属性_第14张图片
大圣。首先,贝尔是比目鱼,哦不,是蝴蝶型,和C罗一样——这个很有意思。传统的观念来说,锋线搭档通常要 「互补」 才能有好的效果,比如欧文-赫斯基组合。然而另一种思路是,锋线球员类型 「同质化」 才能达到最佳效果,比如巴萨的MSN就是,每个人都有很强的持球过人射门的能力。而从本文的雷达图来看,C罗和贝尔都是蝴蝶型,也很 「同质化」,兼具头顶脚踢,让人猜想皇马的锋线选择也应当是走的 「同质化」 这个思路

通过数据可视化进行足球进球方式分析球员属性_第15张图片
法尔考。法尔考是 「蝴蝶型」 也不让人意外。毕竟巅峰时期的法尔考也是以头顶脚踢全能而著称。现在即便不再巅峰,然而球员踢法并没有改变。这个就是雷达图妙的地方——形状代表球员风格和打法,所以当球员因为表现起伏数据上下波动时,雷达图的形状并不会改变,改变的是面积大小。所以相信巅峰的法尔考应该是比现在更大一号,更标准的蝴蝶型。
通过数据可视化进行足球进球方式分析球员属性_第16张图片
卢卡库。被诟病喜欢拉边不喜欢当支点、争顶能力差,已经是历史遗留问题了。这张图来看,不喜欢当支点这一说法,应该可以冼冼睡了。卢卡库的形状是一个标准的 「尖锥形」,也就是第三类,支点中锋。然而这个尖锥形的瑕疵在于,相比顶端,底端不够尖——而底端恰恰是成功争顶的数据。所以说,争顶成功率低,这个还是名副其实的。不过卢卡库这个赛季的成功争顶已经有了明显进步(去除这个赛季的数据,正下方的成功争顶都达不到灰色均值区域),因此我们可以预测,他的 「尖锥形」 在未来几年应当会变得越来越标准。

第三档:勉强能算。这类人的形状乍一看和模板相去甚远,只能通过定义来判断。
通过数据可视化进行足球进球方式分析球员属性_第17张图片
红贝贝。和之前的略伦特类似,贝洛蒂的图像也有两种可能的读法。把上下两个代表 「头球争顶」 的两个角削掉一些,就是一个 「右扇形」 了;而把下方的的 「成功争顶数」 的角向下挪,又会是符合 「右半圆」 的定义。然而无论是哪一种,贝洛蒂始终没有一项真正超出均值区域的——也就是说,想成为各自类型的顶级,还有一段很长的路要走。值得一提的是,贝洛蒂是30人里面唯一一个真正意义的接近 「右半圆」 这种稀有类型的。
通过数据可视化进行足球进球方式分析球员属性_第18张图片
来了!见识一下!这才是真正的前锋!惊不惊喜,意不意外?不多说了。水爷的图,论形状,其实挺好判断的,不该出现在这一类。他放在这一类,是因为形状虽标准,尺寸不到位。「尖锥形」 是要求上下两端超出均值的灰色区域的,水爷的暂时不够——但是大家也都知道水爷这是什么情况,哈哈。

在上边我们列举了部分球员的数据和他们所得到的能力图,我们来会看一下我们通过数据可视化得到了什么,我们是怎么构建这么一个数据模型的。

回顾

空间构建:
1 八角雷达图,构建一个八个维度的空间;
2 定义八项参数,分成三种能力,按空间位置排布。
设置对照:
3 选取26人的样本,代表所有优秀头球手的总体;
4 利用置信区间,锁定总体均值所在的范围。
探索类型:
1 三种能力排列组合,形成七种理论可能的不同类型。
2 球员和各自类型并不总是完美match,有些略有瑕疵,有些只是定义上符合,有些必须补上一角才能看上去相似。
3 七种可能的类型,两种完全找不到实际例子,一种只有缺角版。剩下四种比较常见。
4 C罗,吉鲁,凯恩等,都是各自类型的完美代表。

数据可视化能运用的方向还有很多,希望我今后可以在这方面努力深造。

你可能感兴趣的:(数据可视化)