数据分析师笔记

最近看了一场live,为了防止忘记,还是记点笔记来吧。

live的老师结合自身经历,讲了自己的学习方法。学习过程分为三个步骤,第一个是练习代码;第二个是系统的看书和做笔记;第三个是做一个数据分析项目;

学习的内容了分为以下几个方面,第一个是SQL语法和具体数据库应用,以mysql为例。在这个方面,需要掌握的核心技能是DDL语言和DML语言,各种聚合函数和关联查询,还有创建存储过程。学习过后要能够把他们应用起来,使用SQL语言操作mysql数据库,了解数据在数据库中的存储方式。第二个方面是python基础和python做数据分析。关于python,需要掌握的核心技能是列表,元组,字典,函数,语法结构为选择,顺序和循环,和python读写文件等,python做数据分析,需要掌握numpy,pandas和matploytlib等框架,具体的应用就是能用python操作结构化数据,进行数据的清洗,数据抽取,数据可视化等操作,还有能使用python操作数据库等。第三个方面是统计学基础知识。这个方面的核心技能是要掌握描述性统计,比如说期望,概率和中位数,众数等,和统计推断和概率论,包括,抽样,分布,估计置信区间,假设检验,线性回归和时间序列等。加分项是机器学习,这个过程需要了解分类,回归,聚类等算法的概念,决策树,随机森林,线性回归和逻辑回归,svm,神经网络,聚类算法,pca,特征工程和模型评价。具体的应用就是能调用当前的主流框架来做分析,比如说sklearn,pytorch,TensorFlow等,并且了解各个算法在具体的使用场景。除此之外,还需要掌握数据分析领域知识和分析思维和表达,建议入行数据分析师,可以从事金融,互联网,电信运营商等领域。这个方面需要掌握的核心技能有漏斗思维,分类思维,平衡思维,A/Btest思维等,在这个过程中可以先学会使用工具,多看看书等。可以学一学spss。

注意,决定要从事数据分析,首先一定要学习编程知识,并且熟练掌握,比如说python,多加编程练习,养成良好的记录笔记的习惯,夯实数据基础。后面作者讲述了数据分析师岗位的区别和当前数据的概念区别以及数据分析工作。简单记录一下:

数据产品经理:熟悉整个数据的开发流程,落地成数据产品

数据开发工程师:搭建基础设施,进行数据的存储,处理,计算,这个过程要合乎时间预算;

数据挖掘工程师:建立模型,预测,区分对象,主要技能是编程和算法,偏向预测和分析;

当前关于数据的几个概念:

大数据:超大规模数据,使用分布式存储分析;

数据挖掘:算法和机器学习相同,偏向于应用;

机器学习:通过大量的数据训练模型,让模型学习到样本和标签的对应关系;

深度学习:是机器学习的分支,是神经网络算法的衍生;

数据分析师的工作:

初级数据分析师:数据提取,报表开发,根据分析,撰写报告;

数据分析师进阶:BI,行业分析方法,机器学习。

记录下内容共同学习

你可能感兴趣的:(笔记)