可汗学院公开课——统计学笔记Task1

可汗学院公开课——统计学笔记

  • 1.集中趋势、总体和样本
  • 2.方差、标准差
  • 随机变量
  • 二项分布
  • 泊松分布
  • 大数定理
  • 正态分布

1.集中趋势、总体和样本

集中趋势 :集中趋势是统计学中一组数据向某一中心值靠拢的过程。它反映了数据中心点位置所在。
总体和样本 :研究中实际观测或调查的一部分个体为样本,研究对象的全体为总体。
样本均值:
可汗学院公开课——统计学笔记Task1_第1张图片
总体均值:
可汗学院公开课——统计学笔记Task1_第2张图片

2.方差、标准差

方差:方差是用来描述数据和均值之间的偏离程度
1.总体方差:
可汗学院公开课——统计学笔记Task1_第3张图片
2.样本方差(无偏估计):
可汗学院公开课——统计学笔记Task1_第4张图片
标准差:标准差是用来描述数据和均值之间的偏离程另一个很重要的标志
可汗学院公开课——统计学笔记Task1_第5张图片
可汗学院公开课——统计学笔记Task1_第6张图片

随机变量

随机变量分为离散随机变量和连续随机变量

二项分布

  • 进行n次独立试验
  • 每一次试验都存在失败和成功的可能,每一次试验的成功概率相同且等于p
  • 实验次数有限
    满足以上条件就可以当作二项分布处理

成功k次的概率
在这里插入图片描述
数学期望E(x) = np

泊松分布

  • 单独时间在给定区间随机、独立地发生,给定区间可以是时间或空间,例如可以是一个星期,也可以是一英里。
  • 已知该区间内的事件平均发生次数(或者叫做发生率),且为有限值。该事件平均发生次数通常用希腊字母λ表示。

推导过程:
在这里插入图片描述
期望和方差都为λ。

大数定理

当试验次数足够多时,样本均值收敛于总体均值。

正态分布

当试验次数足够多时,正态分布与二项分布近似

概率密度函数:
可汗学院公开课——统计学笔记Task1_第7张图片
累积分布函数:
在这里插入图片描述
经验法则:在μ±σ区间内占比68%,在μ±2σ区间内占比95%,在μ±3σ区间内占比99.7%。
对于标准正态分布,均值为0,标准差为1

你可能感兴趣的:(可汗学院公开课——统计学笔记Task1)