统计中的基本概念

随机变量

随机变量,可以理解为是一个函数,是一个将随机过程映射到实际数据的函数。例如:

明天是否下雨,是一个随机过程,我们可以用随机变量 X将其映射到数据上,比如用1代表下雨,用0代表不下雨,即X = {1,0}。

随机变量有两类,分别是离散(Discrete)随机变量和连续(Continuous)随机变量。

总体(population)

随机变量能取到的所有的值。总体很多时候不能穷举,需要用样本来估计。

样本(sample)

总体中随机抽样值的集合。

总体均值 Population mean()

对总体中所有的数据求均值;

很多时候不可能得到总体中所有的数据,也不能得到总体中数据的个数,这是都需要样本数据来进行估计和近似。

一般情况下,如果样本数据个数大于30的话,就认为可以很好的对总体进行近似和估计。

样本均值 Sample mean()

从总体中,随机抽取的样本的均值。

,n代表样本个数

概率分布(离散随机变量)

纵轴代表概率,横轴代表随机变量的取值

概率密度函数(连续随机变量)

与概率分布类似,纵轴代表概率,横轴代表随机变量的取值

你可能感兴趣的:(统计中的基本概念)