NBA和数据挖掘

源地址1:http://home.wangjianshuo.com/mvm/000772.htm

源地址2:http://hi.baidu.com/mybdbd/item/dc31573b018940fa96f88df3


我们在学校里的时候,老师讲到“数据挖掘”,总是喜欢用啤酒和尿布做例子。这个例子实在是太生动,太贴近生活,以至于久而久之,大家都只会用这个例子了,众口一词,相当的乏味。其实,近来我发现,NBA是一个很活生生的好例子。NBA把数据挖掘用到了无处不在,时常令人有叹为观止的感叹。

例如,在最近的一期的《体育画报》里的一篇关于NBA的文章中提到:“二十年来,所有年度防守球员退役时都有枚戒指带”(言下之意,估计穆托姆博和阿泰斯特也会拿到总冠军的)。能够发掘到这样一个事实,基本上只有两种可能性:有那么一小撮对NBA掌故烂熟于胸且大脑极其发达的中年人,他/她们对一些深深隐藏在浩如烟海的数据背后的一些有趣的事实有极其敏锐的洞察力;或者NBA掌握了非常行之有效的数据挖掘技术,并运用这样的技术对其数十年如一其不厌其烦收集的数据进行了挖掘。

我比较愿意倾向于相信后面一种可能性,因为找到或者培养那种既能熟记大量数据又有敏锐洞察力的人是一件非常困难的事情,而且不具备可重复性——但我不止一次看到在涉及NBA的文章中出现那种深藏的事实,而且不单单是NBA,在美国的其他体育联盟(比如橄榄球、棒球等)里面,也经常能有类似的发现。同一期《体育画报》中另一处写道:“82games.com定义的‘关键时刻(最后5分钟双方分差小于5)’中,(Tracy McGrady)他有80%的得分靠单打的来。相反,姚明在‘关键时刻’...有高达60%的得分依赖助攻”。

从这些充满质感的数据和来自于数据中的事实中可以看出,即便不论那些数据挖掘是人做的还是计算机做的,美国的各大体育联盟对数据的收集之细,也是值得我们学习的。下次面试Senior SDE的时候不妨问这么一个问题:请设计一个NBA比赛和球员资料数据库。

--------------------------------------------   

美国著名的国家篮球队NBA的教练,利用IBM公司提供的数据挖掘工具临场决定替换队员。想象你是NBA的教练,你靠什么带领你的球队取得胜利呢?当然,最容易想到的是全场紧逼、交叉扯动和快速抢断等具体的战术和技术。但是今天,NBA的教练又有了他们的新式武器:数据挖掘。大约20个NBA球队使用了 Knowlesys公司开发的数据挖掘应用软件KWDMS系统来优化他们的战术组合。例如Scout就因为研究了魔术队队员不同的布阵安排,在与迈阿密热队的比赛中找到了获胜的机会。

       系统分析显示魔术队先发阵容中的两个后卫安佛尼.哈德卫(Anfernee Hardaway)和伯兰.绍(Brian Shaw)在前两场中被评为-17分,这意味着他俩在场上,本队输掉的分数比得到的分数多17分。然而,当哈德卫与替补后卫达利尔.阿姆斯创 (Darrell Armstrong)组合时,魔术队得分为正14分。

      在下一场中,魔术队增加了阿姆斯创的上场时间。此着果然见效:阿姆斯创得了21分,哈德卫得了42分,魔术队以88比79获胜。魔术队在第四场让阿姆斯创 进入先发阵容,再一次打败了热队。在第五场比赛中,这个靠数据挖掘支持的阵容没能拖住热队,但Advanced Scout毕竟帮助了魔术队赢得了打满5场,直到最后才决出胜负的机会。

       Advanced Scout是一个数据分析工具,教练可以用便携式电脑在家里或在路上挖掘存储在NBA中心的服务器上的数据。每一场比赛的事件都被统计分类,按得分、助 攻、失误等等。时间标记让教练非常容易地通过搜索NBA比赛的录像来理解统计发现的含义。例如:教练通过Advanced Scout发现本队的球员在与对方一个球星对抗时有犯规纪录,他可以在对方球星与这个队员“头碰头”的瞬间分解双方接触的动作,进而设计合理的防守策略。

       KWDMS的开发人,Bear,开发该应用时他正在Knowlesys的 KWDMS研究中心当研究员,他演示了一个技术新手应该如何使用数据挖掘。 Bear说:“教练们可以完全没有统计学的培训,但他们可以利用数据挖掘制定策略”。与此同时,另一个正式的体育联盟,国家曲棍球联盟,正在开发自己的数 据挖掘应用NHL-ICE,联盟与IBM建立了一个技术型的合资公司,去年11月推出一个电子实时的比赛计分和统计系统。在原理上是一个与 Advanced Scout相似的数据挖掘应用,可以让教练、广播员、新闻记者及球迷挖掘NHL的统计。当他们访问NHL的Web站点时,球迷能够使用该系统循环看联盟的比赛,同时广播员和新闻记者可以挖掘统计数据,找花边新闻为他们的实况评述添油加醋。

        当然,所有系统都有其局限性,他们毕竟不是人。所以不要期望这样的数据挖掘可以帮助一支球队找到赢得足球世界杯的策略。

你可能感兴趣的:(数据挖掘)