2020-09-29

厉害了!20年【科比NBA】生涯|数据分析

原创 小郑同学 菜鸟学Python 

阅读本文大概需要3分钟

本篇作者:小郑同学

使用工具:Ipython notebook

用到的库:Pandas,Matplotlib

1.数据来源

本次用到的数据来源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,看看数据长什么样呢

2.导入数据

1).数据集是一个下载好的csv文件( csv是数据分析金牌御用文件格式),我们把数据导入到pandas之后,初步分析一下

>>

(20, 30) #数据集是一个20行30列的大表格,正好是20年的数据

看一些数据的基本统计分析信息:

20年平均得分是24.2分,相当厉害,最高得分是35.4,最低7.6,那我们继续横向探索数据

2).接下来就可以继续分析了,一般来说,我们经常关注的是球员的得分,篮板,助攻,抢断和盖帽的能力,所以我们可以从这5个方面来分析,先来看一下科比的得分的基本情况

>>

常规赛总得分: 33633.3

常规赛场均得分: 24.9875928678

3).这里的总分会有偏差(实际总分是33643)

因为是根据每赛季的场均得分和场次得来的,所以数据会有出入,科比的得分巅峰是哪个赛季呢 ? 场均得分又是多少?只需两行代码就解决问题

max_point=data.PTS.max()

print(data[data.PTS==max_point])

>>

3).科比的巅峰赛季

科比的巅峰是在05-06赛季,27岁的时候,场均35.4分,要知道场均能上30分就已经很了不起了,果然是巅峰科比,进攻火力太猛了,那我们接着看一下上30分的有哪些赛季

print(data.loc[data.PTS>=30])

>>

30分以上的赛季有02-03,05-06和06-07

4).看一下这20年来各项的最强科比的数据

>>

assistants     6.3

blocks         1.0

point         35.4

rebounds       6.9

steals         2.2

dtype: float64

3.可视化数据

1).为了更好的展现数据的魅力,我们用matplotlib画个图看看吧

x轴用20年(1997-2016)的年份

y轴是每个赛季的得分情况

用数据可视化可以非常清晰的看出,96-97刚起步的时候,进步非常快,几乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆发了,黄金赛季在06-07人生顶峰35分,而2014开始慢慢走向低谷,哪到底发生了什么了呢

2).其他的篮板,助攻,抢断和盖帽都可以仿照得分的方式来分析,表中分别对应TRB,AST,STL,BLK,看一下大致情况就好

篮板

助攻

结合前面的数据,我们发现从2013年开始从得分王,开始慢慢的转为助攻王,助攻的得分明显上升甚至达到职业生涯的顶峰,猜想也许是因为体能或者伤痛的原因,转为助攻

综合画一个雷达图

结论:

这个小例子非常适合小白入门数据分析,综合了很多知识,非常不错,大家若有什么问题,欢迎留言讨论.另外现在投稿非常踊跃,目前累计有20+投稿。有机器学习,爬虫,有数据分析等等,因为我对稿件的质量要求比较高,通过率只有3-4成(稿件一定要通俗易懂),若给大家回复的comments不当的地方,请多多包涵,目的只有一个"提供高质量的文章给粉丝",另外我发现粉丝里面高手很多,水平都在不断的上涨,厉害了小伙伴们!!!

你可能感兴趣的:(2020-09-29)