2019-07-28

数据分析学习小组第一次作业

学习大纲

   通过跟群友2周的学习分享以及居士对数据分析的描述,结合自己学习Linux的过程,总觉得学习一门新课程时,根据自己的情况做一份学习计划大纲是有必要的。

   记得学习Linux时,网络配置整了2周都没整好,通过Google查了很多文章也没能解决。一筹莫展时,突然想到Linux有很多版本,能不能查看其他版本的。结果是查到了,发现虚拟机的有些版本的Linux不支持自带的无线网卡。从这个事也给我一个启示,不能一个人埋头苦干的学,跟别人一起学习效率高的多。这也是加入学习小组的前因后果。

   下面我就这2周的搜集/整理,做一份学习大纲如下:

1. 学习数据分析需要学习的内容有:概率统计,execl,sql,Python基础知识,numpy包,pandas包,matplotlib包。

2. 自己目前学习的书单:麻瓜编程的小白python入门书(已学完),漫画统计学(群友分享的书籍),谁说菜鸟不会数据分析(Python篇)实体书。

3. 数据分析职业分类:大体上分为普通数据分析,数据工程和数据挖掘。需要掌握excel,sql,概率统计,Python,数据挖掘,机器学习等。(参考了秦路的《数据分析职业规划》)

4. 跟上学习小组的作业进度,坚持下去。 

对于Python的学习感悟:

1. 自己初次接触Python是偶尔从文章上看到的,通过自己的搜索,知道了IDE是啥,自己也顺利安装上了Pycharm。Mac笔记本,新版本(2019.1)的pycharm设置字体快捷键是command+ 逗号键盘,然后找到下面的Font。

2. 关于pycharm的激活,网上找的激活码激活能激活几个月。长期的话某宝上有能永久激活全家桶的,二十来块钱,亲测能用。

Pycharm激活


3. pytharm的使用有很多快捷,用起来是很方便的。后面会整理一份快捷键发到星球中。

4 .pycharm需要用到各类库。我用的是anaconda。具体如何导入pycharm可以自己搜一下。



对于概率分布

1. 概率中通常将试验的结果称为随机变量。随机变量将每一个可能出现的试验结果赋予了一个数值,包含离散型随机变量和连续型随机变量。

2. 数学期望和方差。数学期望是试验每次可能结果的乘以其结果的总和,它是概率大平均值。而方差是对随机变量的变异性来说的,也就是对风险的度量。方差越大,随机变量的结果越不稳定。

3. 二项概率分布 是一种离散型的概率分布。


二项概率分布


4. 正态分布 它是分析连续型随机变量的最重要分布。


正态分布

你可能感兴趣的:(2019-07-28)