大数据统计基础前四周笔记

该笔记从炼数成金的课程中整理

第一周


概率论与统计学

统计学可以分为:*** 描述统计学 不推断统计学 ***

描述集中趋势

  • 均值
  • 中位数
  • 众数
大数据统计基础前四周笔记_第1张图片
image.png

描述离散程度

  • 方差(注意样本方差和总体方差)
  • 标准差(注意样本标准差和总体标准差)

画图

  • 直方图
  • 箱线图
  • 茎叶图
  • 线图
  • 柱状图
  • 饼图

第二周


样本空间
事件
事件运算定律
交换律:结合律:分配律:德摩根律:(这里详见插图)

大数据统计基础前四周笔记_第2张图片
image.png

频率
古典模型(也叫等可能模型)
附:排列组合公式图

大数据统计基础前四周笔记_第3张图片
image.png

几何模型:P(A)=事件面积/总样本面积

第三周


条件概率
条件概率乘法定律:P(AB)=P(B|A)P(A)
全概率公式: P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...+P(A|Bn)P(Bn)
划分
设S为试验E的样本空间,B1,B2……Bn为E的一组事件。若  (1)BiBj=∅,i≠j,i,j=1,2,……,n  (2)B1 ∪B2 ∪…… ∪Bn=S 则称B1,B2……Bn是样本空间S的一个划分
贝叶斯公式

大数据统计基础前四周笔记_第4张图片
image.png

独立性: P(AB)=P(A)P(B), 则AB相互独立

第四周


随机变量
离散or连续可以类比自然数与实数
0-1分布随机变量只能取0-1
伯努利试验
二项分布

大数据统计基础前四周笔记_第5张图片
image.png

泊松分布

大数据统计基础前四周笔记_第6张图片
image.png
image.png

分布函数
概率密度

大数据统计基础前四周笔记_第7张图片
image.png

均匀分布
正态分布

image.png

你可能感兴趣的:(大数据统计基础前四周笔记)