大数据学习线路图,Python/数据分析实战基础

来源:http://www.mathlabs.cn/python_20.html

本文主要归纳Python、数据分析的学习线路图,学习方向:

共分为五大板块:

板块一:熟悉python,SQL

python

(1)python语法

(2)常用数据结构(列表、元组、字典)

(3)python高级用法(日期和时间、列表推导式、高阶函数、多线程)

SQL

(1)聚合

(2)表连接

(3)子查询

板块二:机器学习基本算法入门

(1)机器学习基本概念(样本、标签、特征、训练集、测试集、分类、聚类、回归)

(2)基本分类算法(决策树、线性模型、贝叶斯模型等)

(3)集成学习(bagging、boosting等)

参考资料:周志华:《机器学习》,清华大学出版社,2016

板块三:sklearn、pandas

(1)pandas基本函数使用

(2)sklearn 5个分类算法调用,参数设置,交叉验证评估

(3)sklearn单机特征工程、特征选择与聚类算法调用

板块四:数据分析进阶(天池新手赛)

赛题地址:天池新手赛

(1)数据划分(训练集,验证集,测试集)

(2)提取特征(不少于50个)

板块五:数据分析实战(天池新手赛)

生活大实惠:O2O优惠券使用预测

在后面的学习中,我会分享一些自己总结的学习资料

文章由数据实验室原创,转载请注明来源

你可能感兴趣的:(Python,大数据)