国际足坛数据三巨头:
1.Football Stats, Live Match Data and Player Statistics – Squawka.com
2.http://www.whoscored.com
3.http://www.fourfourtwo.com/au/performance
此外还有:
1.Footballdatabase.eu, The greatest source of football statistics on the Internet !
2.Opta Home
转会数据最牛逼的是德国转会市场:
European leagues and cup competitions
国内:
创冰的数据包括中超中甲亚冠五大联赛欧预赛和欧锦赛 比赛和球员的数据项也最全面 单场有15000多项
http://data.champdas.com
在这里我们需要将精准的图表与创意的视觉设计进行结合,来解读一些有意思的数据,讲述与众不同的球员故事。在这里作者借助不同球员雷达图的 「形状」 特点不同,来直观地对他们的场上表现进行分类
这是八边形上的八个参·数,按照位置分成三组:1 左边三个是 「头球攻门」 相关的数据,2 右边三个是 「用脚射门」 相关的数据,3 上下两个是 「空中对抗」 相关的数据
回想一下,我们之前把这八个数据按照区域位置分了成三类:1 「头球攻门」,2 「用脚射门」,3 「空中对抗」。一个球员至少擅长其中一种,最多三种,所以,排列组合得到:擅长1,擅长2,擅长3,擅长1和2,擅长1和 3,擅长2和3,擅长全部,一共7种不同情况(当然,不考虑都不擅长的情况,这种人大概是进不了这30人名单的)、
只擅长 「头球攻门」,纯头球手,射门渣渣。这类人的图像是一个 「开口向左的扇形」,具体的定义标准是左三项显著高于其余五项。
只擅长2 「用脚射门」,真射门员,头球只是附带。这类人的图像是一个 「开口向右的扇形」,定义标准是右三项数据显著高于其余五项。
只擅长3 「空中对抗」,支点型高中锋。这类人的图像是一个 纵向发展的 「尖锥形」,上下二项显著高于其余六项。
擅长1 「头球攻门」 和 2 「用脚射门」,不擅 3 「空中对抗」。全能型得分手,然而做支点能力不行。这类人的形状是一个左右对称的 「蝴蝶型」 ,左右六项显著高于其他两项
擅长1 「头球攻门」 和 3 「空中对抗」,全能型头球手,可回撤当支点,可前插抢头球,脚下的技术成为唯一的制约。这类人的形状是一个「面向左边的半圆」,左三项和上下二项显著高于其他三项
擅长2 「用脚射门」 和 2 「空中对抗」,不擅1 「头球攻门」,支点型射手??(我自己造的词……)看似非常奇怪的组合,现实中并不常见,这类人的形状是一个 「面向右边的半圆」,右三项和上下二项显著高于左三项。
擅长全部。超级全能前锋,真·八边形战士,现实中几乎不存在。这类人的形状是 「近圆形」,定义的标准是八项数据没有一项显著高于其他。
按匹配度分档——谁才是各自类型的典型球员?
是身体卓著,天赋异禀的ta
还是球商极高,用脑踢球的ta
作者legendgw依靠数据可视化技术给出了他的答案
第一档:完美匹配。这些人简直就是各自类别的模板,不仅看上去像,而且严格符合类型定义中的标准
头球射术皆顶级,单凭印象流都可以判断,C罗毫无疑问是第四类 「蝴蝶型」 全能得分手,而他的雷达图形状恰恰说明了这一点。这个 「蝴蝶型」 标准的可怕——定义中要求的六项攻门数据全都超出了灰色均值区域,和他同类型的再无人能做到;两项争顶数据也同时低于均值,说明C罗这几年在场上完全不是支点中锋的打法。留意一下,C罗是所有30人里面,超出灰色均值参数最多的(6项)!!
天王盖地虎,标准如吉鲁!第一类 「左扇形」 纯头球手的代表,3项头球攻门的数据已经强到快要突破天际。至于用脚射门,自然不是很强,但也压在均值的灰色区域内。同时大家留意一下,吉鲁是所有30人里面,唯一的八项数据都不低于均值的(至少都达到灰色区域)!!
北伦敦的两位当家前锋,凯恩和奥巴梅杨,俩人几乎是一个模子里刻出来的,都是非常完美的第二类 「右扇形」 真·射门员(伪·头球手)。
第二档:略有瑕疵。这些人基本符合各自的模板,在一两个地方会有细微的出入。
大圣。首先,贝尔是比目鱼,哦不,是蝴蝶型,和C罗一样——这个很有意思。传统的观念来说,锋线搭档通常要 「互补」 才能有好的效果,比如欧文-赫斯基组合。然而另一种思路是,锋线球员类型 「同质化」 才能达到最佳效果,比如巴萨的MSN就是,每个人都有很强的持球过人射门的能力。而从本文的雷达图来看,C罗和贝尔都是蝴蝶型,也很 「同质化」,兼具头顶脚踢,让人猜想皇马的锋线选择也应当是走的 「同质化」 这个思路
法尔考。法尔考是 「蝴蝶型」 也不让人意外。毕竟巅峰时期的法尔考也是以头顶脚踢全能而著称。现在即便不再巅峰,然而球员踢法并没有改变。这个就是雷达图妙的地方——形状代表球员风格和打法,所以当球员因为表现起伏数据上下波动时,雷达图的形状并不会改变,改变的是面积大小。所以相信巅峰的法尔考应该是比现在更大一号,更标准的蝴蝶型。
卢卡库。被诟病喜欢拉边不喜欢当支点、争顶能力差,已经是历史遗留问题了。这张图来看,不喜欢当支点这一说法,应该可以冼冼睡了。卢卡库的形状是一个标准的 「尖锥形」,也就是第三类,支点中锋。然而这个尖锥形的瑕疵在于,相比顶端,底端不够尖——而底端恰恰是成功争顶的数据。所以说,争顶成功率低,这个还是名副其实的。不过卢卡库这个赛季的成功争顶已经有了明显进步(去除这个赛季的数据,正下方的成功争顶都达不到灰色均值区域),因此我们可以预测,他的 「尖锥形」 在未来几年应当会变得越来越标准。
第三档:勉强能算。这类人的形状乍一看和模板相去甚远,只能通过定义来判断。
红贝贝。和之前的略伦特类似,贝洛蒂的图像也有两种可能的读法。把上下两个代表 「头球争顶」 的两个角削掉一些,就是一个 「右扇形」 了;而把下方的的 「成功争顶数」 的角向下挪,又会是符合 「右半圆」 的定义。然而无论是哪一种,贝洛蒂始终没有一项真正超出均值区域的——也就是说,想成为各自类型的顶级,还有一段很长的路要走。值得一提的是,贝洛蒂是30人里面唯一一个真正意义的接近 「右半圆」 这种稀有类型的。
来了!见识一下!这才是真正的前锋!惊不惊喜,意不意外?不多说了。水爷的图,论形状,其实挺好判断的,不该出现在这一类。他放在这一类,是因为形状虽标准,尺寸不到位。「尖锥形」 是要求上下两端超出均值的灰色区域的,水爷的暂时不够——但是大家也都知道水爷这是什么情况,哈哈。
在上边我们列举了部分球员的数据和他们所得到的能力图,我们来会看一下我们通过数据可视化得到了什么,我们是怎么构建这么一个数据模型的。
空间构建:
1 八角雷达图,构建一个八个维度的空间;
2 定义八项参数,分成三种能力,按空间位置排布。
设置对照:
3 选取26人的样本,代表所有优秀头球手的总体;
4 利用置信区间,锁定总体均值所在的范围。
探索类型:
1 三种能力排列组合,形成七种理论可能的不同类型。
2 球员和各自类型并不总是完美match,有些略有瑕疵,有些只是定义上符合,有些必须补上一角才能看上去相似。
3 七种可能的类型,两种完全找不到实际例子,一种只有缺角版。剩下四种比较常见。
4 C罗,吉鲁,凯恩等,都是各自类型的完美代表。
数据可视化能运用的方向还有很多,希望我今后可以在这方面努力深造。