来源:http://www.mathlabs.cn/python_20.html
本文主要归纳Python、数据分析的学习线路图,学习方向:
共分为五大板块:
(1)python语法
(2)常用数据结构(列表、元组、字典)
(3)python高级用法(日期和时间、列表推导式、高阶函数、多线程)
(1)聚合
(2)表连接
(3)子查询
(1)机器学习基本概念(样本、标签、特征、训练集、测试集、分类、聚类、回归)
(2)基本分类算法(决策树、线性模型、贝叶斯模型等)
(3)集成学习(bagging、boosting等)
参考资料:周志华:《机器学习》,清华大学出版社,2016
(1)pandas基本函数使用
(2)sklearn 5个分类算法调用,参数设置,交叉验证评估
(3)sklearn单机特征工程、特征选择与聚类算法调用
赛题地址:天池新手赛
(1)数据划分(训练集,验证集,测试集)
(2)提取特征(不少于50个)
生活大实惠:O2O优惠券使用预测
在后面的学习中,我会分享一些自己总结的学习资料
文章由数据实验室原创,转载请注明来源