数据分析师统计知识笔记

一、无偏估计

1. 在统计学中,总体参数的估计基本上都是无偏估计。若\hat{\theta}的数学期望不为\theta,即E(\hat{\theta})\neq 0E(\hat{\theta})> 0(偏高估计)和E(\hat{\theta})< 0(偏低估计)则为\theta的有偏估计。

2. 无偏性的实际意义是指没有系统性的偏差,统计推断的误差有系统误差和随机误差。无偏性则表示,把这些正负偏差在概率上平均起来,其值为零,即无偏估计量只有随机误差而没有系统误差。

3. 无偏估计并不总是存在,如服从二项分布的总体B(n,p)0<p<1,则1/p的无偏估计就不存在。

4. 有些问题中,无偏估计很多,则其优良性由它们的方差来决定,方差越小越优良。

5. 统计学中,将存在无偏估计的参数称为可估参数,可估参数的无偏估计往往不唯一,而且只要不唯一,则即有无穷多个。一个参数往往有不止一个无偏估计。

6. 无偏估计不一定是好估计。

二、期望值

1. F-分布函数并不是每一个随机变量都有期望值的,因为有的时候这个积分不存在。

2. 如果两个随机变量的分布相同,则它们的期望值也相同。

3. 如果X是离散的随机变量,输出值为x_{1}x_{2},...,和输出值相应的概率为p_{1}p_{2},...(概率之和为1)。若级数{\sum}_{i} p_{i}x_{i}绝对收敛,那么期望值E(x)是一个无限数列的和:E[x]={\sum}_{i} p_{i}x_{i}

4. 如果X是连续的随机变量,存在一个相应的概率密度函数f(x),若积分\int_{-\infty }^{\infty }xf(x)dx绝对收敛,那么X的的期望值可以计算为:E[x]=\int_{-\infty }^{\infty }xf(x)dx

你可能感兴趣的:(数据分析)