实训第一周

第一天
 获取数据Csv文件
 分析数据 预判胜利的队伍有多大的获胜概率
 比赛情况比赛特征+ELO等级分
 机器学习 判断胜利 预测

第二天:
阅读代码,记录基本流程,理顺资料1的思路
 关于最好的结果:能够更准确地验证2018年(测试集)的,准确率>70%,能够准确预测2019年,准确率>70
 问题1:同样的数据,同样的模型,如何适应差别很大的两年?
Maybe可以支持球员的调整(输入球员调整,例如<詹姆斯,湖人>,对数据表进行修改),在此基础之上预测
 问题2:数据组成是球队往年数据和球员,具体如何安排特征向量?是进行不同权重的组合,还是?
其实往年数据就是球员的整体数据,球员的新信息应该是变动(伤病,跳槽)带来的,应该是球员按照一定标准打分,再加入作为一个和ELO并列的向量/或者按一定的标准和ELO按不同权重组合得到新的数值进行回归。
 问题3:一定要用回归?用分类的方法可以吗
母鸡 要查一查

第三天:无进展

第四天:
 自顶向下需求列举

 根据常规赛预测季后赛八支球队
 数据
 需要数据:
 三年常规赛:胜负数据包括胜负(got),(ELO需要三个表,自己,对手,综合)(not),可验证数据(not)
 球员个人数据:各项指标
 数据处理:
选择数据的组合运用方式
 建模

 根据季后赛预测前八排名

 AI基本输出
请问本赛季是否有球员变动(伤病/改签)?y/n
请输入伤病的球员数:N
请输入伤病的球员名:XX YY
请输入改签的球员数:M
请输入改签的球员名和新签的球队:ZZ ABC
收到修改数据,AI现在开始预测
进入季后赛的东部前八是:
进入季后赛的西部前八是:
AI预测这十六支队伍的最后排名和可能性是:

整理自己的思路,确定影响最大的要素,列出目前所有的可能性(数据选取,模型选择)

 问题1:分类和回归在什么情况下使用,最大的区别是什么?各种分类方法的适合使用在什么环境。(建模问题)
分类解决离散问题,回归解决连续问题。

第五天:
搜集资料,扩充思路,找到更多的方法
开始写最基本的程序原型,写好之后调整,讨论,修改


总结:这一周整体来说进展很慢,反思一下,应该是工作方式有问题。早上来的晚,有效时间不到三个小时,中间没有活动和思维转换,效率很低。下午也是如此,七个小时的时间其实非常毛,强度很小。其实这个项目,一周足矣。关键是如何保证效率,一直问自己做到什么,能学到什么,耗费时间并不能达到目的,也不能学到东西。

关键词:了解背景,效率低,未开动,没有分工

你可能感兴趣的:(实训记录)