球龄对GmSc效率值的单因素方差分析

2015-06-15

统计课与软工课老师是好基友,于是就把统计课作业融合到软工大作业:NBA信息查询平台中。

同样是团队作业,我和另一个同学被分到做统计模块。于是我这个从来不看NBA的女孩子略微研究了一下NBA,然后写了一篇小报告。结果在演示那天给统计课老师讲的时候,他竟然说:“嗯,你这个统计分析有点意思。”我真是被惊喜到了,哈哈,看来统计课老师应该不是NBA迷,不然怎么被我一本正经地胡说八道的报告蒙混过去了呢?(doge脸)

当然也不是胡说八道啦,都是根据之前数据统计得出的结论。我硬是找各种关联,终于凑出了球龄与GmSc效率值的关联,也不知道是不是真的有关联,毕竟我不看NBA嘛。

好啦,文章如下。


球龄对GmSc效率值的单因素方差分析

1引言

NBA专家认为,一个运动员有三种年龄:生理年龄、心理年龄和球龄。其中球龄是指运动员加入NBA后的职业年数,反映了一个人参加专业训练的先后和发展的早晚。能反映运动员在系统训练过程汇总的阶段性特点。对球龄存在三种阶段:一是运动员从事运动生涯的启蒙期(基础训练期);二是运动员已训练了一段时间后的高峰期(专业训练期);三是运动员达到较长时间段的训练后的熟练期(职业训练期)。篮球运动员的身体机能、身体素质、技战术水平都与他的球龄有一定关系。在篮球比赛对抗中,当身体技战术水平接近时,比赛经验、心理、意识等因素越来越重要,而这与球员的球龄是相关的。每一位优秀的男篮运动员都要经过6-10年的精雕细琢,不断地在比赛中锻炼成长,最终才能成才。他的球龄和经验是成正比的。所以在篮球比赛中,双方实力比较接近时,经验起了非常重要的作用。

GmSc效率值是球员在场表现各个方面的加权计算结果,能够反映这个球员在球场上的综合表现。本文分析球龄对球员的GmSc效率值指标是否有显著影响。

2 数据来源

本文用的数据是来源于NBA官网的统计数据和ESPN网站上的数据,某个球员的2组数数据分别采用的10-11赛季和14-15赛季(球龄跨度5年)的数据,我们认为一个球员经过5年的NBA比赛,其GmSc效率值的变化是可供统计和分析的。

本文主要思想是单因素方差分析。推断球龄对Gmsc效率值是否有显著影响。一个球员的一次试验中的赛季因素A,共有3个不同的因素水平(季前赛,常规赛,季后赛),分别记为A1,A2,A3。我们研究相隔5年的2个赛季。

我们分析球龄跨度5年,是否会对球员的GmSc效率值产生显著差异。我们需要检验的假设:

H0:μ1=μ2;即球龄的增长不会对球员的GmSc效率值产生显著差异。

3 模型选择和策略识别

本文主要做得就是球龄和GmSc效率值有什么关系,所以,我们剔除了那些10-11和14-15赛季没有比赛的球员,去除了不可比较的样本。选择的模型就是单因素方差分析模型。

其中,综合性指标的计算公式如下:

GmSc 效率值:得分+0.4×投篮命中数-0.7×投篮出手数-0.4×(罚球出手数-罚球命中数)+0.7×前场篮板数+0.3×后场篮板数+抢断数+0.7×助攻数+0.7×盖帽数-0.4×犯规数-失误数

由于样本均值是总体均值的无偏估计,我们首先会想到计算样本均值。方差分析涉及多种不同的样本均值。例如,每一种因素水平,每一行样本数据,都有一个均值。每个样本数据与平均值存在一定的波动,即使对于同一种因素水平,样本数据也不完全一致。我们采用偏差平方和进行波动的度量。方差分析方法的基本思想就是从总偏差平方和分解出可追溯到指定来源的不同的偏差平方和。

首先计算偏差平方和ST(总偏差平方和),SA(水平间偏差平方和),Se(水平内偏差平方和),再计算他们对应的自由度fT,fA和fe,然后计算卡方统计量VA和Ve,最后计算检验统计量FA,查表比较FA和F0.05,F0.01。

因为Se代表同一个赛季内球员GmSc效率值的数据波动(主要体现随机误差),SA代表不同赛季(体现球龄变化)内球员GmSc效率值的数据波动。当F比1大较多时,可认为球龄的变化带来了试验数据的显著差异。

4 结论

上述的分析,我们可以从统计结果看出来的是:纵向比较,对于同一个球员的不同赛季来说,5年的球龄历炼对于他的GmSc效率值的影响是不一定的。有73.6%是无显著差异,20.2%是显著差异,6.2%是高度显著差异。横向比较,可以通过散点图看出,对于0-6球龄的球员,5年的球龄历炼能够让他的GmSc效率值发生较大的变化;对于6-12球龄的球员,在跨越5年的赛季中,GmSc效率值的变化不大;对于12-18球龄的球员,5年前和5年后的GmSc效率值也会产生一定变化。

所以我们可以分析:对于一个新晋的球员,他的球场综合能力会随着参加比赛积累经验而逐渐提升;而对于一个已经打了几年,技艺熟练,经验丰富的球员来说,球龄的增长对于他场上表现影响不大,即他的赛场风格已趋于稳定;对于一个球龄已高,即将退役,身体素质已随着时间而略为下降的球员来说,球龄对球场综合能力也会产生一定的影响,他的“球风”不如之前那么稳了。


然后这是软工大作业展示我的统计的界面哦。


卧槽,才发现当时的NBA数据库被我删了,现在程序运行会报错。。。。呜呜呜呜……没法看了。

好吧,也就只能看看首页了。

球龄对GmSc效率值的单因素方差分析_第1张图片

右边的2个统计点进去都是空的图表,因为,数据库被我删了啊,没法从后台拿数据。嘤嘤嘤。。。

你可能感兴趣的:(软件工程统计方法)