用python做实验数据分析_Python小实验——利用Python进行NBA比赛数据分析

首先确定需要统计的数据,以及数据的来源。

通过毕达哥拉斯定律来进行估计:获胜的概率等于得分的平方除以(得分的平方加上机会得分的平方)

使用到了Elo等级划分制度,不懂就去百度

scipy 下载失败,百度了错误之后试着下载

scipy-0.15.1-win32-superpack-python2.7,最新版本为python3.4

后来发现是依赖包没有安装,但是没有办法直接下载依赖包,所以搜索scipy for win64-Python2.7,安装成功

首先插入实验相关模块,然后设置回归训练时所需用到的参数变量(当每支队伍没有elo等级分时,赋予其基础elo等级分),在最开始需要初始化数据,从T、O和M表格中读入数据,去除一些无关数据并将这三个表格通过Team属性列进行连接(根据每支队伍的Miscellaneous Opponent,Team统计数据csv文件进行初始)

将胜利队伍和失败队伍的特征值随机分配到每场比赛数据的左右侧意思是,为了随机产生[winTeam, loseTeam](胜利队伍特征值在左侧,对应的y值标签为0),[loseTeam, winTeam](失败队伍在左侧, 对应的y值标签为1)这样的训练样本。你也可以固定利用数据集前一半为[winTeam, loseTeam],后一半为[loseTeam, winTeam]这样来生成数据。只要保证两类数据的分布比较均衡,且在训练时随机得取到两类训练样本即可。

最后出现找不到模块的错误由朱老师接着完成

你可能感兴趣的:(用python做实验数据分析)