为什么库里在场的时候球队得分比他不在场时多?

库里的神奇魔法

尽管我们纵观NBA历史的时候会发现从不乏神奇的三分射手,但仍未有人能带来像当下库里能带来的巨大影响。正是因为库里在场上的弹无虚发,才造就了一个新的“物理学名词”——库有引力——当库里在场上的时候会吸引最多的防守注意力,从而给队友创造出更加舒适的投篮空间,甚至还可以带动队友手感,提高球队整体命中率和进攻效率,最终赢得比赛。如果我们查询NBA官网金州勇士队的数据,会惊奇地发现当库里不在场和在场时队友命中率的确实相去甚远。

为什么库里在场的时候球队得分比他不在场时多?_第1张图片

从ESPN网站的数据来看,库里是联盟中ORPM值第一的球员,也就是说在100个进攻回合中,库里在场的时候球队可以比他不在场时多得7.27分,反之当库里不在时,这种神奇也随之不复存在。

虽然是否在场的这些数据依然属于较少的样本,但库里对队友得分效率的影响实实在在地存在,并且在过去的几个赛季里对金州勇士队产生了深远的影响,这些事实都可以证明我们前述观点。

其实除了三分球和“库有引力”,库里是96年以来在场进攻效率历史和进攻速度双历史第一,并且他对进攻节奏的影响非常大。库里作为历史上最高效的得分手的同时,还能够把队友变得和他一样高效,并且毫不占用球权。最容易被人们忽略的事实是,库里是一位优秀的组织者,我们很难找出第二个对球队进攻节奏有这么大影响力的球员,他做到了真正意义上的“无球胜有球”。当然这一切都来源于库里的无私和谦逊。

数据科学

如果我们不对库里的数据做深度的挖掘和分析,那么我们很容易被常见的得分、助攻、篮板、抢断等数据所迷惑,从而错失对库里真正作用的认识。而为我们揭开库里神奇魔法谜底的,正是数据科学。

早在2012年,《哈佛商业评论》中的一篇文章就将数据科学家誉为“21世纪最性感的职业”。在大数据技术蓬勃发展的今天,我们早已知道数据科学能够带来的无穷力量,就像前面库里的例子一样,在数据科学面前任何假象都将被打碎,任何真相也无处可藏。但同样是在今天,数据科学依然没有找到一个明确的立足点,它与其他学科的界限依旧很模糊。大多数情况下,我们知道有很多问题都可以用数据科学去分析,去解释,但是往往我们总是被一个问题难住,那就是“我们该如何开始”。

从大的方向来说,一个数据科学项目由三个阶段组成:

准备阶段:充分收集项目相关信息和数据。

构建阶段:利用统计分析工具等,将收集的信息变成执行计划,并付诸行动。

完成阶段:交付产品,获得反馈,进行修改,校正结果,结束项目。

1

准备阶段

在准备阶段,我们需要弄明白我们到底知道什么,拥有什么,能得到什么,起点在哪里以及终点在哪里。换句话说,就是要明白我们的目标是什么,我们已知的和未知的是什么,以及确定问题的边界。

想要明白目标是什么,那么自然少不了对客户的细心询问,聆听来自客户的声音。如果用户并不能准确描述他的期望,那么我们可以使用一组提问来发现事实,并使用数据回答问题,做出有见地的分析。使用“什么是有可能的”、“什么是有价值的”、“什么是有效率的”三个过滤器确定合适的实现方式,并确定最终的可交付物。

不论是已知还是未知的数据,在获取数据的时候都需要注意数据的侦查,寻找对项目有帮助的数据,同时考虑数据是否充足,如果不充足可能需要整合数据源。光有数据还不够,还需要对数据进行整理,也就是把不容易处理的、非结构化或其他任意格式的数据和信息转换成常规软件可用数据的过程。这个过程同样充满了不确定性,需要特定工具在特定情况下完成工作。

准备阶段最后一步就是评估可用的数据和迄今的进展。知道更多关于数据的事,加强对数据以及如何分析数据的认识,将会使我们在整个数据科学项目中的每一步中作出更明智的决策。做一些基本的描述性统计、假设检验等,在投入大量时间实现完整的软件之前,对数据子集做粗略的统计分析,以确定项目处于正轨上。

为什么库里在场的时候球队得分比他不在场时多?_第2张图片

2

构建阶段

在构建阶段,首先要从指制定实现目标的计划开始,利用统计学原理和工具,助力实现项目目标。正是因为数据科学的不确定性到处存在,所以每个数据科学项目都包括一系列待解答的问题。因为这些问题并不存在已准备好的解决方案,唯一的做法是应用现成或自定义的工具和智慧来解释结果过程中的意识和创造力,同时数据科学家应该具有定期复盘以及和团队分享的意识,及时修正这些方案,甚至重新考虑期望和目标。

在良好的数据科学中,统计学所需要的技能和知识占了至少三分之一甚至一半。分析和解释是统计学的科学方面,所关心的是从数据中获取知识并了解是否有足够的证据来支持既定的假设或者推论。面对大量的不确定性,良好的分析和解释对数据科学中需要统计性质很强的项目始终非常重要。在处理数据时,我们可以选择电子表格这样的用户图形界面应用来做,也可以自己通过编程研发工具,可以是脚本,也可以是应用,使用的语言可以是Octave、R和Python。当然我们还需要一些辅助工具,比如数据库、高性能计算、云服务和大数据技术,以及XX即服务。

项目计划应该包含多个路径和选项,具体选择将取决于项目的结果、目标和最后期限。评判项目结果好的依据是它在某种程度上有用,并且统计显著性可能是其中的一部分。

为什么库里在场的时候球队得分比他不在场时多?_第3张图片

3

完成阶段

在完成阶段,虽然已经构建完毕,但为了未来的路更好走,需要着眼于提炼和策划产品的形式和内容,并以特别简洁的方式向用户传达,这样可以有效地解决问题并达成项目目标,发现缺陷,并积极优化和改进产品。同样,为了可以给客户交付有效的产品,依然必须了解客户的想法, 并为其选择最好的结果载体,最后选择应该在产品中包含的信息和结果。那么需要明确结果所提供给的对象,以及结果能做什么。

数据科学产品的要点在于用户是否被动地消费信息,或客户是否积极主动地与产品互动,并能用产品回答许多问题。比如报告或白皮书,这是最简单也是最易消化的产品形式。分析工具也可以作为数据科学项目的产品交付给客户。

另一方面,记录项目所采取的最终分析步骤是个好主意,尤其是对分析的复现。除了交付的媒介外,还要确定包含哪些结果,突出那些重要的,具有决定性的结果,不要包括不确定的结果。尽管已经尽了最大的努力,但仍有可能有疏漏,我们需要做出识别并给予补救或建议。

最后就是项目善后的工作,以及对未来的工作进行思考。

为什么库里在场的时候球队得分比他不在场时多?_第4张图片

(文章来源:转载自微信公众号泡面办公室)

你可能感兴趣的:(为什么库里在场的时候球队得分比他不在场时多?)