概率论与数理统计复习笔记(待续)

概率论基础

基础分布

分布 说明 表达式 期望 方差
二项分布 n n n次伯努利试验 P ( X = k ) = C n k p k ( 1 − p ) ( n − k ) P(X=k)=C^k_np^k(1-p)^{(n-k)} P(X=k)=Cnkpk(1p)(nk) n p np np n p ( 1 − p ) np(1-p) np(1p)
泊松分布 X ∼ π ( λ ) X\sim \pi(\lambda) Xπ(λ),多用于描述事件的发生次数的概率 P ( X = k ) = λ k e − λ k ! P(X=k) = \frac{\lambda^ke^{-\lambda}}{k!} P(X=k)=k!λkeλ λ \lambda λ λ \lambda λ
指数分布 具有无记忆性,常用于可靠性理论和排队论中 P ( x ) = 1 θ e − x θ , x > 0 P(x) = \frac{1}{\theta}e^{-\frac{x}{\theta}}, x>0 P(x)=θ1eθx,x>0
正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2) P ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 P(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} P(x)=2π σ1e2σ2(xμ)2 μ \mu μ σ 2 \sigma^2 σ2
  • 指数分布的无记忆性

    • P ( X > s + t ∣ X > s ) = P ( X > T ) P(X> s+t \mid X > s)=P(X > T) P(X>s+tX>s)=P(X>T)
    • 举个例子,一个零件用了 s s s小时后,它还能再用 t t t小时的概率与这个零件没用过时能用 t t t小时的概率相同。很显然这个性质是指数函数带来的。
  • 泊松定律:

    • 固定 k k k,对于任意正整数 n n n, 令 n p n = λ np_n=\lambda npn=λ,则 lim ⁡ n → ∞ C n k p n k ( 1 − p n ) n − k = λ k e − k k ! \lim_{n\rightarrow \infin} C^k_np^k_n(1-p_n)^{n-k}=\frac{\lambda^ke^{-k}}{k!} limnCnkpnk(1pn)nk=k!λkek
    • 这个式子必须选定 k k k,令 n n n趋于无穷大才成立,对应的 p n p_n pn会趋近于无穷小
    • 泊松定理是二项分布的一种极限情况:试验次数非常大,而每次试验的成功概率 p p p非常小,这也符合生活中的很多例子,例如每天的顾客数量、每天的事故发生数量等等。当然,当 k k k的大小开始接近 n n n的时候,泊松分布就会失效,应该改用二项分布。这个理解也可以在两个分布的期望与方差上得到印证
  • 函数的概率分布:

    • 已知 X X X的概率分布函数 f X f_X fX,如果有 Y = g ( X ) Y=g(X) Y=g(X),要求 Y Y Y的概率分布函数 f Y f_Y fY,可以通过边缘分布函数 F X F_X FX求得 F Y F_Y FY, 然后对 F Y F_Y FY求导得到 F y F_y Fy

88页

样本与抽样分布

  • 箱线图,对于一组抽样,分别求出中位数 M M M、第一四分位点 Q 1 Q_1 Q1、第三四分位点 Q 3 Q_3 Q3,画出下面这张图(图片来源《概率论与数理统计》第四版 133页)。概率论与数理统计复习笔记(待续)_第1张图片

  • 概率分布的分位点:给定 α \alpha α,概率分布函数 f ( x ) f(x) f(x),如果 ∫ β + ∞ f ( x ) d x = α \int^{+\infin}_{\beta}f(x)dx=\alpha β+f(x)dx=α, 则 β \beta β则为该分布的 α \alpha α分位点。

  • 样本分布:主要是注意样本方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) S^2 = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline{X}) S2=n11i=1n(XiX)中的系数是 1 n − 1 \frac{1}{n-1} n11。实际上如果公式中不用样本均值 X ‾ \overline{X} X来近似 μ \mu μ而是直接用 μ \mu μ的话,系数还是直观的 1 n \frac{1}{n} n1。然而可以证明, E [ ( X ‾ − μ ) 2 ] = 1 n σ 2 E[(\overline{X}-\mu)^2]=\frac{1}{n}\sigma^2 E[(Xμ)2]=n1σ2,所以系数要予以修正。

  • χ 2 \chi^2 χ2分布: χ 2 = X 1 2 + X 2 2 + … + X n 2 \chi^2=X^2_1+X^2_2+\ldots+X^2_n χ2=X12+X22++Xn2,其中 X i X_i Xi为标准正态分布的样本,则 χ 2 ∼ χ 2 ( n ) \chi^2 \sim \chi^2(n) χ2χ2(n),即自由度为 n n n的卡方分布

  • Γ \Gamma Γ函数: Γ ( x ) = ∫ 0 + ∞ t x − 1 e − t d t , x > 0 \Gamma(x) = \int^{+\infin}_0 t^{x-1}e^{-t}dt , x>0 Γ(x)=0+tx1etdt,x>0,其历史可以参考这里

    • 这个函数是阶乘函数在实数乃至复数域上的扩展,对于正整数 n n n Γ ( n + 1 ) = n ! \Gamma(n+1) = n! Γ(n+1)=n!, 如果修改伽马函数让 Γ ( n ) = n ! \Gamma(n) = n! Γ(n)=n!,只需要将 t x − 1 t^{x-1} tx1改为 t x t^{x} tx即可;
    • 其满足阶乘的性质: Γ ( x + 1 ) = x Γ ( x ) \Gamma(x+1) = x\Gamma(x) Γ(x+1)=xΓ(x)(分部积分证明)。
  • t t t 分布: t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X,记为 t ∼ t ( n ) t\sim t(n) tt(n), 其中 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0,1), Y\sim\chi^2(n) XN(0,1),Yχ2(n), X , Y X,Y X,Y相互独立;

    • 概率密度函数为 h ( t ) = Γ [ ( n + 1 ) / 2 ] π n Γ [ n / 2 ] ( 1 + t 2 n ) − ( n + 1 ) / 2 h(t) = \frac{\Gamma[(n+1)/2]}{\sqrt{\pi n}\Gamma[n/2]}(1+\frac{t^2}{n})^{-(n+1)/2} h(t)=πn Γ[n/2]Γ[(n+1)/2](1+nt2)(n+1)/2,其关于 y y y轴对称;
    • lim ⁡ n → + ∞ h ( t ) = 1 2 π e − t 2 2 \lim_{n\rightarrow +\infin}h(t)=\frac{1}{\sqrt{2\pi}}e^{\frac{-t^2}{2}} limn+h(t)=2π 1e2t2,也就是说, n n n变大时, t t t分布将逐渐趋向于标准正态分布, n > 45 n>45 n>45时就几乎一样了
  • F F F分布: F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1,记为 F ( n 1 , n 2 ) F(n_1, n_2) F(n1,n2),自由度为 ( n 1 , n 2 ) (n_1, n_2) (n1,n2), 其中 U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U\sim\chi^2(n_1),V\sim\chi^2(n_2) Uχ2(n1)Vχ2(n2) U , V U,V UV相互独立。

    • 概率分布函数只在正半轴非 0 0 0,太复杂了,好像也没必要记住?
  • 正态分布样本的若干性质,假设正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) n n n个采样的均值,样本均值为 X ‾ \overline{X} X,样本方差为 S 2 S^2 S2:

    • X ‾ \overline{X} X S 2 S^2 S2相互独立
    • X ‾ ∼ N ( μ , σ 2 / n ) \overline{X} \sim N(\mu, \sigma^2/n) XN(μ,σ2/n)
    • ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) σ2(n1)S2χ2(n1) , (很有意思, ( n − 1 ) S 2 (n-1)S^2 (n1)S2其实和卡方分布的定义很像,但是里面用的是样本均值,可能也就是如此使得得到的自由度为 n − 1 n-1 n1)
    • X ‾ − μ S / n ∼ t ( n − 1 ) \frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) S/n Xμt(n1),可以由前两条推出
    • 如果有两个正态分布的样本 X , Y X, Y X,Y,则 S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 2 ) \frac{S^2_1/S^2_2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-2) σ12/σ22S12/S22F(n11n22)

参数估计

  • 点估计分为矩估计和最大似然估计,后者见得很多了,前者是指,如果分布具有 n n n个参数,则分别求出 1 1 1 n n n阶矩关于参数的表达式,然后计算样本中 1 1 1 n n n阶矩的具体值,最后联立方程得到结果。当参数只有两个时,用的就是均值和方差。在一些简单的分布中,矩估计和最大似然估计的结果似乎是一样的。

假设检验

确定原假设 H 0 H_0 H0和备择假设 H 1 H_1 H1,使用一个检验统计量来表示 H 0 H_0 H0,利用这个统计量的分布和显著性水平来判断假设是否成立。根据检验统计量的不同,可以分为 Z Z Z检验(正态分布), t t t检验, χ 2 \chi^2 χ2检验, F F F检验。
概率论与数理统计复习笔记(待续)_第2张图片
概率论与数理统计复习笔记(待续)_第3张图片
分布拟合检验、秩和检验:待读

其他

  • 切比雪夫不等式: P ( ∣ x − μ ∣ ≥ ϵ ) ≤ δ 2 ϵ 2 P(|x-\mu| \geq \epsilon) \leq \frac{\delta^2}{\epsilon^2} P(xμϵ)ϵ2δ2

    • 证明方法是写出 P ( ∣ x − μ ∣ ≥ ϵ ) P(|x-\mu| \geq \epsilon) P(xμϵ)的定义,然后在定义中用 f ( x ) ≤ ( x − μ ) 2 ϵ 2 f ( x ) f(x) \leq \frac{(x-\mu)^2}{\epsilon^2}f(x) f(x)ϵ2(xμ)2f(x)进行放缩即可。
  • 协方差: C o v ( X , Y ) = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] Cov(X, Y) = E[(X-E[X])(Y-E[Y])] Cov(X,Y)=E[(XE[X])(YE[Y])]

    • 相关系数: ρ X Y = C o v ( X , Y ) D ( x ) D ( Y ) \rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(x)}\sqrt{D(Y)}} ρXY=D(x) D(Y) Cov(X,Y)
    • ρ X Y ≤ 1 \rho_{XY}\leq 1 ρXY1
    • ρ X Y = 1 \rho_{XY}= 1 ρXY=1 当且仅当存在常数 a , b a, b a,b使得 P ( X = a + b Y ) = 1 P(X=a+bY)=1 P(X=a+bY)=1
    • 多维随机变量中,两两的协方差构成协方差矩阵

你可能感兴趣的:(基础知识)