概率论与数理统计知识点小结

随机事件

全概率公式

贝叶斯公式

排列组合(只能刷题了)

公式:

重复组合,又放回的抽r次:

随机变量分布及统计量

分布函数

性质:1)单调不减 2) ; 3) 右连续

期望:

方差:

协方差:

相关系数:

分布函数 期望 方差 备注
0-1分布
二项分布
泊松分布 二项分布分的极极限
几何分布
超几何分布 设有N个产品中,有M个不合格,从中随机不放回的抽n个。其中不合格品为x个的概率
均匀分布
指数分布 ELSE 0
正态分布

切比雪夫不等式

伯努利大数定律:随着n增大,频率与概率有较大偏差的可能性越来越小

中心极限定理:对独立同分布随机变量序列(这个共同分布可以是离散的、连续的、正态的、非正态的),只要其共同分布的方差存在,且不为0,那么这n个独立同分布的随机变量之和的分布渐进近似于正态分布。

样本及抽样分布

简单随机样本 : iid

统计量:随机变量的函数(不含参数),也是随机变量

三大抽样分布

分布: 。其中 为自由度

  • 可加性:
  • 期望方差:
  • 分位点:单侧分布

分布:。其中为自由度

  • more heavily-taled
  • n趋于无穷大时,附近正态分布
  • 分位点:对称分布

F 分布:。其中

  • 单侧分布

  • 分位点

参数估计

矩估计

​ 多个参数需要多阶矩:

最大似然估计

评选标准

无偏性


E[\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2] = \frac{1}{n-1}E[\sum_{i=1}^n(X_i^2 - 2X_i\bar{X} + \bar{X}^2)] \\ =\frac{1}{n-1}E(\sum_{i=1}^n X_i^2 - \sum_{i=1}^n 2X_i\bar{X} + \sum_{i=1}^n\bar{X}^2) \\= \frac{1}{n-1} E(\sum_{i=1}^n X_i^2 - 2n \bar{X}^2 + n\bar{X}^2) \\ = \frac{1}{n-1} (E\sum_{i=1}^n X_i^2 - nE(\bar{X}^2))
其中
nE(\bar{X}^2) =n E[(\frac{1}{n}\sum_{i=1}^nX_i)^2] \\= n\frac{1}{n^2} E(\sum_{i=1}^n X_i^2 +2\sum_{i!=j} X_iX_j ) \\ = \frac{1}{n}[\sum_{i=1}^nE(X_i^2) + 2\frac{n(n-1)}{2} E(X_i)E(X_j)) ] \\ = DX + \bar{X}^2 + (n-1)\bar{X}^2 = DX + n\bar{X}^2
带回可得

有效性

相合性:依概率收敛于

区间估计

抽样分布.jpeg

假设检验:

总体已知
假设检验.jpeg
假设检验二.jpeg
总体未知

拟合优度检验 :样本是否来自某个分布,主要思想是当X来自分布F(x),那么事件的频率与概率的差值不会太大。因此构造统计量:
\sum_{i=1}^kC_i(\frac{f_i}{n}-p_i)^2 \\ C_i为常数,当C_i= n/p_i 时, \chi^2 = \sum_{i=1}^k\frac{n}{p_i}(\frac{f_i}{n}-p_i)^2 = \sum_{i=1}^k \frac{f_i^2}{np_i} -n \\ 当n充分大,近似服从 \chi^2(k-1)
第一类错误与第二类错误:因为是控制第一类错误的概率,因此是受到保护的,不轻易拒绝原假设。一般选两类错误中后果严重的错误为第一类错误。如果两类错误没有哪一类更严重,常常取维持现状。

ANOVA(方差分析):可以用来比较多组总体的均值

你可能感兴趣的:(概率论与数理统计知识点小结)