概率论自复习思路

概率论复习思路(存在纰漏)

文章目录

  • 概率论复习思路(存在纰漏)
    • 基本概念
    • 随机变量分布
    • 多维随机变量分布
      • 离散型
      • 连续性
    • 数字特征
      • 数学期望
      • 方差
      • 协方差系数
      • 矩、协方差矩阵
    • 大数定律
    • 抽样分布、估计、假设检验
      • 参数估计
      • 区间估计
      • 假设检验


基本概念

  1. 样本空间,和事件、差事件

  2. 两个事件的关系:相不相容、是不是对立、两者之间的关系( ρ \rho ρ相关系数只反映线性方面,还可能存在非线性关系)

  3. 事件发生的概率和发生关系:比如概率为0不一定代表为不可能事件,不可能事件概率一定为0.同样类比于1和必然事件

  4. 条件概率:

    先验概率和后验概率:某个事件发生基于另一个事件,另一个事件发生基于此事件已知发生的情况

    贝叶斯公式+全概率公式 P19

  5. 事件独立性:判断是否独立,和事件发生概率能否等于两事件乘积

随机变量分布

  1. 离散型: P { X = x k } = p k P\{X=x_k\}=p_k P{X=xk}=pk

    常见的离散型随机变量:0~1 分布,伯努利试验(二项分布)、泊松分布

    分布函数:注意一些性质,单调递增、趋近于 + ∞ +\infty +为1,右连续

  2. 连续型: F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^{x}f(t)dt F(x)=xf(t)dt

    概率密度、分布函数

    常见的连续型随机变量:均匀分布、指数分布(无记忆性)、正态分布 P45

  3. 随机变量函数的分布:

    将基础随机变量与函数结合,对于离散型,直接计算可能值列写分布率;对于连续型,可以将函数代入基础随机变量的分布函数之中然后通过求导得到最后的概率密度(P53)

多维随机变量分布

离散型

  1. 联合分布率:直接对应相乘即可
  2. 边缘概率密度:可以理解为其中一个变量的某个值发生概率,就是联合分布率一列或一行相加

连续性

  1. 联合概率密度:相乘时注意定义域
  2. 边缘分布:注意积分区域的选择,x、y在坐标轴形成的区域
  3. 两个随机变量的函数分布:X*Y,X/Y时记得加绝对值

数字特征

数学期望

期望:权值*概率

方差

D ( X ) = V a r ( X ) = E { [ x − E ( x ) ] 2 } = E ( X 2 ) − [ E ( X ) ] 2 D(X)=Var(X)=E\{[x-E(x)]^2\}=E(X^2)-[E(X)]^2 D(X)=Var(X)=E{[xE(x)]2}=E(X2)[E(X)]2

D ( X + Y ) = D ( X ) + D ( Y ) D ( X − Y ) = D ( X ) + D ( Y ) D(X+Y)=D(X)+D(Y)\\ D(X-Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y)D(XY)=D(X)+D(Y)

协方差系数

ρ \rho ρ相关系数针对只是针对线性关系来说,而相互独立时针对一般关系

矩、协方差矩阵

原点矩:一二阶原点矩

中心矩:二阶中心矩就是方差

大数定律

依概率收敛区别于普通收敛,是依概率收敛可以在某个时候超过对应范围,而收敛则是在某个值后,一直在小 ϵ \epsilon ϵ里面。

切比雪夫不等式:

中心极限定理:正态分布正则化思想

De Moivre-Laplace 定理:仅适用于二项分布

抽样分布、估计、假设检验

χ \chi χ分布、 t t t分布、 F F F分布

常见统计量:不含有未知参数

几种常见统计量的抽样变换

α \alpha α分位数

正态总体的样本均值和样本方差的分布

参数估计

矩估计:

利用样本一阶矩估计总体一阶矩,一个参数的话就只需要计算样本一阶矩,样本二阶矩估计总体二阶矩。比如题目有两个未知参数,然后给了样本,知道分布的话,我们可以通过求样本的均值和方差计算出样本的一二阶矩,然后估计总体的一二阶矩。然后与总体两个参数的一二阶矩相对应,计算那两个参数与样本一二阶的关系

极大似然估计:

计算含未知参数的概率密度,然后将n个样本的概率相乘,为似然函数,通过求导得出取得最大值时参数的值。多变量的话就是求偏微分。

估计的评价标准:无偏性、有效性、相合性

区间估计

利用抽样分布的那些统计量,比如样本方差变成什么卡方分布、t分布,然后根据新构造出来的抽样分布,利用给定显著性查表求出边界,注意单侧、双侧区间,然后就化简区间,得到参数的置信区间

已知方差,不知道均值;已知均值;不知道方差……P175

假设检验

类似于区间估计,也是利用抽样分布统计量,构造抽样分布,利用显著性检验,得到区间范围,然后根据假定的均值落在置信区间里面还是外面确定接受还是拒绝假设。

去真:假设为真,拒绝

取伪:假设为假,接受

你可能感兴趣的:(概率论)