可汗统计学习笔记

12.样本和总体

sample样本,population总体,mean均值
总体是一个概念,一般来说总体是不可以全部测量的,所以我们只取一部分来测量这就是样本。例如:我们不可能测量所有人的身高,但是我们可以在所有人中取一部分来测量这部分人的平均身高,这就是样本均值。总体的平均就是总体均值。
简单说:总体均值就是总体数的平均,样本均值就是样本数的平均。

13.总体方差

可汗统计学习笔记_第1张图片
总体方差是为了查看样本与均值之间的偏差度。就是说同样均值的一些数有的和均值相差很远,有的和均值相差很近。

14.样本方差

样本方差
样本方差总的来说和总体方差公式相同,
但是我们计算的样本方差,希望它是总体方差的一个无偏估计,所以我们在无偏估计中除以的不是n而是n-1
可汗统计学习笔记_第2张图片
详细证明过程见:https://blog.csdn.net/hearthougan/article/details/77859173

15.标准差

标准差 standard deviation
标准差就是总体方差或者样本方差的开方
标准差

16.诸方差公式:

就是对方差公式的一个展开,从而得到简便的求方差公式。
对此部分展开。展开项
就类似于用期望求得的方差公式:
方差公式

17.随机变量

随机变量 random variable
随机变量并非传统上的变量,而更像是一种会根据需求随机取值的寒素。一般来说随机值是根据概率取值。

18.概率密度函数

用概率密度函数可以求得概率:
对一定区域的概率密度函数求积分便可以求得某一事件的概率。其实就是一个连续型事件概率的累加,正如离散型事件概率的累加一样。如果试图求某一个点的精确概率是不可能的因为积分的结果为零。
整体的概率为1.

19,20,21,22.二项分布

二项分布和正态分布类似,就是类似于扔硬币或者投篮进不进一样只有两种可能的事件。
详细见:https://blog.csdn.net/huangjx36/article/details/77990392

23.期望值

这是对数字的个数引入其出现频率的概念,从而得到的一种权重的均值。如:60%*3+20%*4+20%*5 的结果,可以看到百分比就是每种数的概率,得到的是一个权重的均值。
随机变量的期望值其实就是总体的均值。用频率求出均值和之前总值除以个数没有区别,只是有时无法查出总体的个数。

24.二项分布的期望

本节依据之前的例子推出的一般公式
可汗统计学习笔记_第3张图片
二项分布的概率公式:
二项分布概率公式
二项分布的期望
二项分布的期望
最终就是np。此公式只对二项分布的随机变量成立。

25,26.泊松过程

泊松过程本质上来源于二项分布。
老师举一个很好的例子说明这个问题,就是在一小时内会有多少量车通过某一路段,我们把一小时分为60分钟,只要判断每一分钟是有车还是没有车就可以,这就是一个二项分布的问题,但是如果一分钟内有多辆车的话,我们就继续细分到每一秒是有车还是没有车,如此下去推到极限的场景就得到了泊松分布。
泊松过程
详细参考:https://jentchang.github.io/2019/01/01/stats-25/

你可能感兴趣的:(统计学,可汗)