-/+9-*–@TOC
随机试验的特点:
1.可以在相同的条件下重复地进行
2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果
3.进行一次试验之前不能确定哪一个结果会出现
设:A,B,C为事件,则:
A∪B=B∪A
A∩B=B∩A
A∪(B∪C)=A∪B∪C
A∩(B∩C)=A∩B∩C
A∪(B∩C)=(A∪B)∩(A∪C)
A∩(B∪C)=(A∩B)∪(A∩C)
德摩根律: A ⋃ B ‾ = A ‾ ⋂ B ‾ , A ⋂ B ‾ = A ‾ ⋃ B ‾ \overline{A\bigcup B}=\overline{A}\bigcap\overline{B},\overline{A\bigcap B}=\overline{A}\bigcup \overline{B} A⋃B=A⋂B,A⋂B=A⋃B
频率的定义:在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数m,称为事件A发生的频率。
概率的定义:设E是随机试验,S是样本空间,对于E的每一个事件A赋予一个实数,记P(A),称为事件A的概率,并满足:
P ( A ⋃ B ) = P ( A ) + P ( B ) − P ( A B ) ; P(A\bigcup B)=P(A)+P(B)-P(AB); P(A⋃B)=P(A)+P(B)−P(AB);
推广,任意n个事件:
P ( A 1 ⋃ A 2 ⋃ . . . ⋃ A n ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i ≤ j ≤ n P ( A i A j ) + ∑ 1 ≤ i ≤ j ≤ k ≤ n P ( A i A j A k ) + . . . + ( − 1 ) n − 1 p ( A 1 A 2 A 3 . . . . A n ) P(A_1\bigcup A_2 \bigcup ...\bigcup A_n)=\sum^n_{i=1}P(A_i)-\sum_{1\leq i\leq j\leq n}P(A_iA_j)+\sum_{1\leq i\leq j\leq k\leq n}P(A_iA_jA_k)+...+(-1)^{n-1}p(A_1A_2A_3....A_n) P(A1⋃A2⋃...⋃An)=∑i=1nP(Ai)−∑1≤i≤j≤nP(AiAj)+∑1≤i≤j≤k≤nP(AiAjAk)+...+(−1)n−1p(A1A2A3....An)
无重复排列:n个元素取k个 A n k = n ! ( n − k ) ! A^k_n=\frac {n!}{(n-k)!} Ank=(n−k)!n!
予许重复排列:n个元素取k个 n k n^k nk
n个元素取k个: C n k = A n k k ! = n ! ( n − k ) ! k ! 记 作 : ( k n ) C^k_n=\frac{A^k_n}{k!}=\frac{n!}{(n-k)!k!} 记作:(^n_k) Cnk=k!Ank=(n−k)!k!n!记作:(kn)
P ( B ∣ A ) , 事 件 A 成 立 的 条 件 下 B 成 立 的 概 率 P(B|A),事件A成立的条件下B成立的概率 P(B∣A),事件A成立的条件下B成立的概率
P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
P ( A B ) = P ( B ) P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P(AB)=P(B)P(A|B)=P(A)P(B|A) P(AB)=P(B)P(A∣B)=P(A)P(B∣A)
P ( A 1 A 2 . . . . A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) . . . P ( A n − 1 ∣ A 1 A 2 . . . A n − 2 ) P ( A n ∣ A 1 A 2 . . . A n − 1 ) P(A_1A_2....A_n)=P(A_1)P(A_2|A_1)...P(A_{n-1}|A_1A_2...A_{n-2})P(A_n|A_1A_2...A_{n-1}) P(A1A2....An)=P(A1)P(A2∣A1)...P(An−1∣A1A2...An−2)P(An∣A1A2...An−1)
若 B 1 ⋃ B 2 ⋃ . . . ⋃ B n = S , B i B j = ∅ 若B_1\bigcup B_2\bigcup...\bigcup B_n=S,B_iB_j=\emptyset 若B1⋃B2⋃...⋃Bn=S,BiBj=∅
则 : P ( A ) = P ( B 1 ) P ( A ∣ B 1 ) + P ( B 2 ) P ( A ∣ B 2 ) + . . . + P ( B n ) P ( A ∣ B n ) 则:P(A)=P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+...+P(B_n)P(A|B_n) 则:P(A)=P(B1)P(A∣B1)+P(B2)P(A∣B2)+...+P(Bn)P(A∣Bn)
P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) , i = 1 , 2 , . . . , n P(B_i|A)=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^nP(A|B_j)P(B_j)},i=1,2,...,n P(Bi∣A)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi),i=1,2,...,n
证 : P ( B i ∣ A ) = P ( B i A ) P ( A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) 证:P(B_i|A)=\frac{P(B_iA)}{P(A)}=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^nP(A|B_j)P(B_j)} 证:P(Bi∣A)=P(A)P(BiA)=∑j=1nP(A∣Bj)P(Bj)P(A∣Bi)P(Bi)
定义
设A,B,C是两事件,若 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)则称A,B相互独立。
{ { P ( A B ) = P ( A ) P ( B ) P ( B C ) = P ( B ) P ( C ) P ( A C ) = P ( A ) P ( C ) } A B C 两 两 独 立 P ( A B C ) = P ( A ) P ( B ) P ( C ) } A B C 相 互 独 立 \begin{Bmatrix} {\begin{Bmatrix} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C)\\P(AC)=P(A)P(C) \\ \end{Bmatrix}\text ABC两两独立} \\ P(ABC)=P(A)P(B)P(C)\end{Bmatrix}\text ABC相互独立 ⎩⎪⎪⎨⎪⎪⎧⎩⎨⎧P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)⎭⎬⎫ABC两两独立P(ABC)=P(A)P(B)P(C)⎭⎪⎪⎬⎪⎪⎫ABC相互独立
设随机试验的样本空间 S = e , X = X ( e ) S={e},X=X(e) S=e,X=X(e)是定义在样本空间S上的实值单值函数,称 X = X ( e ) X=X(e) X=X(e)为随机变量。
随机变量,他们可能取到的值是有限个或可列无限多个,称离散性随机变量
(个人理解:1.个数有限或可列;2.有明确对应的值)
随机变量X只可能取0与1两个值,分布律为 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 P(X=k)=p^k(1-p)^{1-k},k=0,1 P(X=k)=pk(1−p)1−k,k=0,1
记:X~B(1,p)
P ( X = k ) = C n k p k ( 1 − p ) n − k P(X=k)=C^k_np^k(1-p)^{n-k} P(X=k)=Cnkpk(1−p)n−k
记:X~B(n,p)
随机变量X所有的可能取值的概率为
P ( X = k ) = λ k e − λ k ! , k = 1 , 2 , . . . P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!},k=1,2,... P(X=k)=k!λke−λ,k=1,2,...
记:X~ π ( λ ) \pi(\lambda) π(λ)
泊松定理
设 λ \lambda λ>0是一个常数,n是任意正整数,设 n p n = λ np_n=\lambda npn=λ,则对于任一固定的非负整数k,有:
l i m n → ∞ C n k p n k ( 1 − p ) n − k = λ k e − λ k ! lim_{n\to\infty}C^k_np^k_n(1-p)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!} limn→∞Cnkpnk(1−p)n−k=k!λke−λ
所以当n很大,p很小时, λ = n p \lambda=np λ=np
P ( X = k ) = C n k p k ( 1 − p ) n − k ≈ λ k e − λ k ! P(X=k)=C^k_np^k(1-p)^{n-k} \approx\frac{\lambda^ke^{-\lambda}}{k!} P(X=k)=Cnkpk(1−p)n−k≈k!λke−λ
在伯努利试验中,设每次试验成功的概率均为p(0
P ( X = k ) = q k − 1 ( 1 − q ) P(X=k)=q^{k-1}(1-q) P(X=k)=qk−1(1−q)
记:X~G( p )
几何分布的无记忆性:
设X~G( p ),n,m为任意的两个正整数,则
P ( X > n + m ∣ X > n ) = P ( X > m ) P(X>n+m|X>n)=P(X>m) P(X>n+m∣X>n)=P(X>m)
N件产品,其中M件次品,今从中任取n件,则n件中的次品数X的分布列:
P ( X = k ) = C M k C N − M n − k C N n P(X=k)=\frac{C^k_MC^{n-k}_{N-M}}{C^n_N} P(X=k)=CNnCMkCN−Mn−k
对于非离散型随机变量X,由于其可能的取值不能一一列举出来,因而就不能像离散型随机变量那样可以用分布律来描述它。另外,我们通常所遇到的非离散型随机变量任取一指定的实数值的概率都等于0,因而我们转而去研究随机变量所取的值落在一个区间 ( x 1 , x 2 ] (x_1,x_2] (x1,x2]的概率P。
定义:设X是一个随机变量,x是任意实数
F ( x ) = P { X ≤ x } F(x)=P\{X\leq x\} F(x)=P{X≤x}
称为X的分布函数
因此,若已知X的分布函数,我们九就能得出X落在任意区间的概率,从这个意义上说,分布函数完整地秒速了随机变量的统计规律性。
分布函数的基本性质:
定义:设随机变量X的分布函数为F(x),存在非负函数f(x),对任意实数x,有
F ( x ) = ∫ − ∞ x f ( t ) d t . F(x)=\int^x_{-\infty}f(t)dt. F(x)=∫−∞xf(t)dt.
称X为连续型随机变量,f(x)为X的概率密度
性质:
推导:
连续型随机变量X的概率密度为:
概率密度: f ( x ) = { 1 ( b − a ) , a < x < b 0 , 其 他 } f(x)=\begin{Bmatrix}\frac{1}{(b-a)},a
→ \to →分布函数: F ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b } F(x)=\begin{Bmatrix}0,xF(x)=⎩⎨⎧0,x<ab−ax−a,a≤x<b1,x≥b⎭⎬⎫
概率密度: f ( x ) = { 1 θ e − x / θ , x > 0 0 , 其 他 } f(x)=\begin{Bmatrix}\frac{1}{\theta}e^{-x/\theta},x>0\\0,其他\end{Bmatrix} f(x)={θ1e−x/θ,x>00,其他}
其 中 θ > 0 为 常 数 其中\theta>0为常数 其中θ>0为常数
→ \to →分布函数: F ( x ) = { 1 − e − λ x , x > 0 0 , 其 他 } F(x)=\begin{Bmatrix}1-e^{-\lambda x},x>0\\0,其他\end{Bmatrix} F(x)={1−e−λx,x>00,其他}
无记忆性:
对于任意s,t>0有: P { X > s + t ∣ X > s } = P { X > t } P\{X>s+t|X>s\}=P\{X>t\} P{X>s+t∣X>s}=P{X>t}
概率密度: f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 μ 2 , − ∞ < x < ∞ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\mu^2}},-\infty
μ \mu μ, σ \sigma σ为常数,且 σ > 0 \sigma>0 σ>0,称X服从参数为 μ \mu μ, σ \sigma σ的正态分布或高斯分布
函数性质:
概率密度: ψ ( x ) = 1 2 π e − x 2 2 \psi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} ψ(x)=2π1e−2x2
分布函数: ϕ ( x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t \phi(x)=\frac{1}{\sqrt{2\pi}}\int ^x_{-\infty}e^{-\frac{t^2}{2}}dt ϕ(x)=2π1∫−∞xe−2t2dt
性质: ψ ( x ) = ψ ( − x ) , ϕ ( x ) = 1 − ϕ ( − x ) \psi(x)=\psi(-x),\phi(x)=1-\phi(-x) ψ(x)=ψ(−x),ϕ(x)=1−ϕ(−x)
一般正态分布N( μ \mu μ, σ 2 \sigma^2 σ2)的分布函数F(x)与标准正态分布的分布函数 ϕ ( x ) \phi(x) ϕ(x)的关系为:
F ( x ) = ϕ ( x − μ σ ) F(x)=\phi(\frac{x-\mu}{\sigma}) F(x)=ϕ(σx−μ)
即:X~N( μ \mu μ, σ 2 \sigma^2 σ2)则: X − μ σ \frac{X-\mu}{\sigma} σX−μ ~N(0,1)
对随机变量的函数 Y = g ( X ) Y=g(X) Y=g(X),已知随机变量X的分布,如何求的随机变量Y的分布。
已知X的概率密度为 f x ( x ) f_x(x) fx(x),分布函数 F x ( x ) F_x(x) Fx(x), Y = g ( X ) Y=g(X) Y=g(X),求Y的概率密度 f Y ( y ) f_Y(y) fY(y)
分布函数法
公式法
定理:设X的概率密度 f x ( x ) f_x(x) fx(x),y=g(X)为(a,b)上严格单调可微函数 ( − ∞ ≤ a ≤ b ≤ + ∞ ) (-\infty\leq a\leq b\leq+\infty) (−∞≤a≤b≤+∞),则Y=g(X)的概率密度为:
f Y ( y ) = { f x [ h ( y ) ] ∣ h ′ ( y ) ∣ , A < y < B 0 , 其 他 } f_Y(y)=\begin{Bmatrix}f_x[h(y)]|h'(y)|,A
其中h(y)为g(x)的反函数,A=min{g(a),g(b)},B=max{g(a),g(b)}
定义
设E是一个随机试验,他的样本空间是S,设X=X(e)和Y=Y(e)是在S上的随机变量,由他们构成的一个向量(X,Y)叫做二维随机变量,对于任意实数x,y,二元函数:
F ( x , y ) = P { ( X ≤ x ) ⋂ ( Y ≤ y ) } 记 作 → P { X ≤ x , Y ≤ y } → 二 维 随 机 变 量 的 分 布 函 数 F(x,y)=P\{(X \leq x)\bigcap (Y\leq y)\}\underrightarrow{记作}P\{X\leq x,Y\leq y\}\to二维随机变量的分布函数 F(x,y)=P{(X≤x)⋂(Y≤y)}记作P{X≤x,Y≤y}→二维随机变量的分布函数
基本性质:
离散型的随机变量:二维随机变量(X,Y)全部可能取到的值是有限对或可列无限多对。
连续的二维随机变量:二维随机变量(X,Y)的分布函数F(x,y)存在非负可积函数 f ( x , y ) 使 对 于 任 意 x . y 有 : F ( x , y ) = ∫ − ∞ y ∫ − ∞ x f ( u , v ) d u d v f ( x , y ) 为 二 维 随 机 变 量 的 概 率 密 度 f(x,y)使对于任意x.y有:\\F(x,y)=\int_{-\infty}^y\int_{-\infty}^xf(u,v)dudv\\f(x,y)为二维随机变量的概率密度 f(x,y)使对于任意x.y有:F(x,y)=∫−∞y∫−∞xf(u,v)dudvf(x,y)为二维随机变量的概率密度
设二维随机变量(X,Y)的分布函数F(x,y),X和Y各自的分布函数 F X ( x ) F_X(x) FX(x)和 F Y ( y ) F_Y(y) FY(y)为F(x,y)的边缘函数。即:
F X ( x ) = P ( X ≤ x ) = P ( X ≤ x , Y ≤ ∞ ) = F ( x , ∞ ) = l i n y → ∞ F ( x , y ) 同 理 : F Y ( y ) = F ( ∞ , y ) = l i n x → ∞ F ( x , y ) F_X(x)=P(X\leq x )=P(X\leq x,Y\leq \infty)\\=F(x,\infty)=lin_{y\to\infty}F(x,y)\\同理:F_Y(y)=F(\infty,y)=lin_{x\to\infty}F(x,y) FX(x)=P(X≤x)=P(X≤x,Y≤∞)=F(x,∞)=liny→∞F(x,y)同理:FY(y)=F(∞,y)=linx→∞F(x,y)
二维随机变量(X,Y)具有概率密度:
f ( x , y ) = { 1 S ( G ) , ( x , y ) ∈ G 0 , 其 他 } f(x,y)=\begin{Bmatrix}\frac{1}{S(G)},(x,y)\in G\\0,其他\end{Bmatrix} f(x,y)={S(G)1,(x,y)∈G0,其他}
称(X,Y)在G上服从均匀分布。
f ( x , y ) ≥ 0 , 且 ∫ − ∞ ∞ ∫ − ∞ ∞ f ( x , y ) d x d y = ∫ ∫ G 1 S ( G ) d x d y = 1 f(x,y)\geq 0,且\int_{-\infty}^\infty\int_{-\infty}^\infty f(x,y)dxdy=\int\int_G\frac{1}{S(G)}dxdy=1 f(x,y)≥0,且∫−∞∞∫−∞∞f(x,y)dxdy=∫∫GS(G)1dxdy=1
概率密度:
f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 e x p { − 1 2 ( 1 − ρ 2 ) ∗ [ ( x − μ 1 ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( y − μ 2 ) σ 1 σ 2 + ( y − μ 2 ) 2 σ 2 2 ] } f(x,y)=\frac{1}{2 \pi \sigma _1 \sigma_2\sqrt{1-\rho^2}}exp\begin{Bmatrix}-\frac{1}{2(1-\rho^2)}*[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\end{Bmatrix} f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1∗[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]}
其中 μ 1 , μ 2 , σ 1 > 0 , σ 2 > 0 , ∣ ρ ∣ < 1 , 都 是 常 数 记 : ( X , Y ) \mu_1,\mu_2,\sigma_1>0,\sigma_2>0,|\rho|<1,都是常数\\记:(X,Y) μ1,μ2,σ1>0,σ2>0,∣ρ∣<1,都是常数记:(X,Y)~N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) (\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho) (μ1,μ2;σ12,σ22;ρ)
二维正态分布的两个边缘分布都是一维正态分布:
X~N( μ 1 , σ 1 2 \mu_1,\sigma_1^2 μ1,σ12)
Y~N( μ 2 , σ 2 2 \mu_2,\sigma^2_2 μ2,σ22)
定义:设F(x,y),F(x,),F(y)依次为(X,Y),X,Y的分布函数,对任意实数x,y成立。
F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)
称X与Y相互独立。即联合概率密度等于边缘函数的乘积
设(X,Y)是二维连续型随机变量,概率密度为 f ( x , y ) f(x,y) f(x,y),则Z=X+Y仍为连续型随机变量,其概率密度:
f X + Y ( z ) = ∫ − ∞ ∞ f ( z − y , y ) d y f_{X+Y}(z)=\int _{-\infty}^\infty f(z-y,y)dy fX+Y(z)=∫−∞∞f(z−y,y)dy
或: f X + Y ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x f_{X+Y}(z)=\int _{-\infty}^\infty f(x,z-x)dx fX+Y(z)=∫−∞∞f(x,z−x)dx
若X,Y相互独立,X,Y的边缘密度分别为 f x ( x ) , f y ( y ) f_x(x),f_y(y) fx(x),fy(y),Z的概率密度为:
f X + Y ( z ) = ∫ − ∞ ∞ f X ( z − y ) f Y ( y ) d y f_{X+Y}(z)=\int _{-\infty}^\infty f_X(z-y)f_Y(y)dy fX+Y(z)=∫−∞∞fX(z−y)fY(y)dy
或: f X + Y ( z ) = ∫ − ∞ ∞ f X ( x ) f Y ( z − x ) d x f_{X+Y}(z)=\int _{-\infty}^\infty f_X(x)f_Y(z-x)dx fX+Y(z)=∫−∞∞fX(x)fY(z−x)dx
称为fx,fy的积卷公式
X i − N ( μ , σ 2 ) ( i = 1 , 2 , 3... ) 且 相 互 独 立 Z = X 1 + X 2 + . . . + X i Z − N ( μ 1 + μ 2 + . . . + μ i , σ 1 2 + σ 2 2 + . . . + σ i 2 ) X_i - N(\mu,\sigma^2) (i=1,2,3...)且相互独立\\ Z=X_1+X2+...+X_i\\ Z-N(\mu_1+\mu_2+...+\mu_i,\sigma_1^2+\sigma_2^2+...+\sigma^2_i) Xi−N(μ,σ2)(i=1,2,3...)且相互独立Z=X1+X2+...+XiZ−N(μ1+μ2+...+μi,σ12+σ22+...+σi2)
设(X,Y)是二维连续随机型变量,概率密度 f ( x , y ) f(x,y) f(x,y),则Z= Y X \frac{Y}{X} XY、Z=XY仍为连续型随机变量,其概率密度:
f Y / X ( z ) = ∫ − ∞ ∞ ∣ x ∣ f ( x , x z ) d x f X Y ( z ) = ∫ − ∞ ∞ 1 ∣ x ∣ f ( x , z x ) d x f_{Y/X}(z)=\int_{-\infty}^\infty|x|f(x,xz)dx\\ f_{XY}(z)=\int_{-\infty}^\infty\frac{1}{|x|}f(x,\frac{z}{x})dx fY/X(z)=∫−∞∞∣x∣f(x,xz)dxfXY(z)=∫−∞∞∣x∣1f(x,xz)dx
若X和Y相互独立,边缘密度为 f X ( x ) , f Y ( y ) f_X(x),f_Y(y) fX(x),fY(y)
f Y / X ( z ) = ∫ − ∞ ∞ ∣ x ∣ f x ( x ) f Y ( x z ) d x f Y X ( z ) = ∫ − ∞ ∞ 1 ∣ x ∣ f x ( x ) f Y ( z x ) d x f_{Y/X}(z)=\int_{-\infty}^\infty|x|f_x(x)f_Y(xz)dx\\ f_{YX}(z)=\int_{-\infty}^\infty\frac{1}{|x|}f_x(x)f_Y(\frac{z}{x})dx fY/X(z)=∫−∞∞∣x∣fx(x)fY(xz)dxfYX(z)=∫−∞∞∣x∣1fx(x)fY(xz)dx
设 X 1 , X 2 . . . X n X_1,X_2...X_n X1,X2...Xn是n个相互独立的随机变量,它们的分布函数分别为 F X i ( x i ) ( i = 1 , 2... n ) F_{Xi}(x_i)(i=1,2...n) FXi(xi)(i=1,2...n),则M=max{X,Y}及N=min{X,Y}的分布函数为:
F m a x ( z ) = F X 1 ( z ) F X 2 ( z ) . . . F X n ( z ) F m i n = ( z ) = 1 − [ 1 − F X 1 ( z ) ] [ 1 − F X 2 ( z ) ] . . . [ 1 − F X n ( z ) ] F_{max}(z)=F_{X_1}(z)F_{X_2}(z)...F_{X_n}(z)\\ F_{min=}(z)=1-[1-F_{X_1(z)}][1-F_{X_2(z)}]...[1-F_{X_n(z)}] Fmax(z)=FX1(z)FX2(z)...FXn(z)Fmin=(z)=1−[1−FX1(z)][1−FX2(z)]...[1−FXn(z)]
当 X 1 , X 2 . . . X n X_1,X_2...X_n X1,X2...Xn相互独立且具有相同的分布函数F(x)时:
F m a x ( z ) = [ F ( z ) ] n F m i n ( z ) = 1 − [ 1 − F ( z ) ] n F_{max}(z)=[F(z)]^n\\ F_{min}(z)=1-[1-F(z)]^n Fmax(z)=[F(z)]nFmin(z)=1−[1−F(z)]n
定义:设离散型随机变量X的分布列P(X=x)= p i ( i = 1 , 2... ) 若 级 数 ∑ i = 1 ∞ x i p i p_i(i=1,2...)\\ 若级数\sum_{i=1}^\infty x_ip_i pi(i=1,2...)若级数∑i=1∞xipi绝对收敛,即 ∑ i = 1 ∞ ∣ x i ∣ p i < ∞ , 则 称 ∑ i = 1 ∞ x i p i 为 X 的 数 学 期 望 记 为 E ( X ) \sum_{i=1}^\infty|x_i|p_i<\infty ,则称\sum_{i=1}^\infty x_ip_i为X的数学期望\\记为E(X) ∑i=1∞∣xi∣pi<∞,则称∑i=1∞xipi为X的数学期望记为E(X)
常用离散分布的期望
X~B(1,p),则E(X)=p
X~B(n,p),则E(X)=np
X~P( λ \lambda λ),则E(X)= λ \lambda λ
X~G( p),则E(X)=1/p
定义:设X是连续型随机变量,其密度函数为 f ( x ) f(x) f(x),若 ∫ − ∞ ∞ x f ( x ) d x \int_{-\infty}^\infty xf(x)dx ∫−∞∞xf(x)dx绝对收敛,则称: ∫ − ∞ ∞ x f ( x ) d x \int_{-\infty}^\infty xf(x)dx ∫−∞∞xf(x)dx为X的数学期望。
常用连续分布的期望
均匀分布:X~U(a,b),E(X)= a + b 2 \frac{a+b}{2} 2a+b
指数分布:X~E( λ \lambda λ),E(X)= 1 λ \frac{1}{\lambda} λ1
正态分布:X~N( μ , σ 2 \mu,\sigma^2 μ,σ2),E(X)= μ \mu μ
定理1:设Y=g(X),g(x)是连续函数
(1) 若X是离散型随机变量,其分布P(X= x i x_i xi)= p i p_i pi且 ∑ i = 1 ∞ ∣ g ( x i ) p i < ∞ ∣ \sum_{i=1}^\infty|g(x_i)p_i<\infty| ∑i=1∞∣g(xi)pi<∞∣则:
E ( Y ) = E ∣ g ( X ) ∣ = ∑ i = 1 ∞ g ( x i ) p i E(Y)=E | g(X)|=\sum_{i=1}^\infty g(x_i)p_i E(Y)=E∣g(X)∣=∑i=1∞g(xi)pi
(2) 若X是连续型随机变量,其概率密度为 f ( x ) f(x) f(x)则:
E ( Y ) = E ∣ g ( X ) ∣ = ∫ − ∞ ∞ g ( x ) f x ( x ) d x E(Y)=E|g(X)|=\int_{-\infty}^\infty g(x)f_x(x)dx E(Y)=E∣g(X)∣=∫−∞∞g(x)fx(x)dx
定理2:设Z=g(X,Y),G(x,y)为连续函数
(1)若(X,Y)是二维离散型随机变量,其分布列P(X= x i x_i xi,Y= x j x_j xj)= p i j p_{ij} pij则:
E ( Z ) = E ∣ g ( X , Y ) ∣ = ∑ i = 1 ∞ ∑ j = 1 ∞ g ( x i , y j ) p i j E(Z)=E|g(X,Y)|=\sum_{i=1}^\infty\sum_{j=1}^\infty g(x_i,y_j)p_{ij} E(Z)=E∣g(X,Y)∣=∑i=1∞∑j=1∞g(xi,yj)pij
(2)若(X,Y)是二维连续型随机变量,其概率密为 f ( x , y ) f(x,y) f(x,y)则:
E ( Z ) = E ∣ g ( X , Y ) ∣ = ∫ − ∞ ∞ ∫ − ∞ ∞ g ( x , y ) f ( x , y ) d x d y E ( X ) = ∫ − ∞ ∞ ∫ − ∞ ∞ x f ( x , y ) d x d y E ( Y ) = ∫ − ∞ ∞ ∫ − ∞ ∞ y f ( x , y ) d x d y E(Z)=E|g(X,Y)|=\int_{-\infty}^\infty\int_{-\infty}^\infty g(x,y)f(x,y)dxdy\\ E(X)=\int_{-\infty}^\infty\int_{-\infty}^\infty xf(x,y)dxdy\\ E(Y)=\int_{-\infty}^\infty\int_{-\infty}^\infty yf(x,y)dxdy E(Z)=E∣g(X,Y)∣=∫−∞∞∫−∞∞g(x,y)f(x,y)dxdyE(X)=∫−∞∞∫−∞∞xf(x,y)dxdyE(Y)=∫−∞∞∫−∞∞yf(x,y)dxdy
定义:设X是一个随机变量,若E|X-E(X)| 2 ^2 2存在,则E|X-E(X)| 2 ^2 2是X的方差,记作D(X),即:
D(X)=E|X-E(X)| 2 ^2 2
D ( X ) \sqrt{D(X)} D(X)是X的标准差或均方差,记 σ x \sigma_x σx
D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E(X^2)-[E(X)]^2 D(X)=E(X2)−[E(X)]2
常用分布的方差
泊松分布:X~P( λ \lambda λ),D(X)= λ \lambda λ
均匀分布:X~U(a,b),D(X)= ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2
正态分布:X~N( μ \mu μ, σ 2 \sigma^2 σ2),D(X)= σ 2 \sigma^2 σ2
二项分布:X~B(n,p),D(X)=np(1-p)
几何分布:X~G§,D(X)= 1 − p p 2 \frac{1-p}{p^2} p21−p
指数分布:X~E( λ \lambda λ)= 1 λ 2 \frac{1}{\lambda^2} λ21
协方差定义: 若E{|X-E(X)||Y-E(Y)|}存在,称它为随机变量X和Y的协方差,记Cov(X,Y)
当Cov(X,Y)>0,X与Y正相关
当Cov(X,Y)<0,X与Y负相关
当Cov(X,Y)=0,X与Y不相关
相关系数的定义: 若 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)存在,且D(X)>0,D(Y)>0,称: ρ x y = C o v ( X , Y ) D ( X ) D ( Y ) \rho_{xy}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} ρxy=D(X)D(Y)Cov(X,Y)为随机变量X,Y的相关系数。
相关系数是表示两个随机变量之间线性相关程度的一个数字特征(无量纲),相关系数越接近1,两个变量的线性相关程度越高,相关系数越接近0,两个变量的线性相关程度越低。
协方差也是表示两个随机变量之间的线性相关程度的一个数字特征(有量纲)
定义:
(1)若 E ( X k ) ( K = 1 , 2... ) E(X^k)(K=1,2...) E(Xk)(K=1,2...)存在,则称E( X k X^k Xk)为X的k阶原点矩,记: a k = E ( X k ) a_k=E(X^k) ak=E(Xk)
(2)若 E [ X − E ( X ) ] k E[X-E(X)]^k E[X−E(X)]k存在,则称 E [ X − E ( X ) ] k E[X-E(X)]^k E[X−E(X)]k为X的k阶中心矩,记: β k = E [ X − E ( X ) ] k \beta_k=E[X-E(X)]^k βk=E[X−E(X)]k
** E(X)为1阶原点矩;D(X)为2阶中心矩
(3)若 E ( X k Y l ) ( k , l = 1 , 2... ) E(X^kY^l)(k,l=1,2...) E(XkYl)(k,l=1,2...)存在,则称 E ( X k Y l ) E(X^kY^l) E(XkYl)为X和Y的k+l阶混合原点矩,记: a k , l = E ( X k Y l ) a_{k,l}=E(X^kY^l) ak,l=E(XkYl)
(4)若 E [ X − E ( X ) ] k [ Y − E ( Y ) l ] E[X-E(X)]^k[Y-E(Y)^l] E[X−E(X)]k[Y−E(Y)l]存在,则称 E [ X − E ( X ) ] k [ Y − E ( Y ) l ] E[X-E(X)]^k[Y-E(Y)^l] E[X−E(X)]k[Y−E(Y)l]为X和Y的k+l阶混合中心矩,记: β k , l = E [ X − E ( X ) ] k [ Y − E ( Y ) l ] \beta_{k,l}=E[X-E(X)]^k[Y-E(Y)^l] βk,l=E[X−E(X)]k[Y−E(Y)l]
**协方差为1+1阶混合中心矩
定义: 设 Z 1 , Z 2 . . . Z_1,Z_2... Z1,Z2...是一个随机变量序列,a是一个常数,若对任意 ϵ > 0 \epsilon>0 ϵ>0有: l i m n → ∞ P ( ∣ Z n − a ∣ < ϵ ) = 1 lim_{n\to\infty}P(|Z_n-a|<\epsilon)=1 limn→∞P(∣Zn−a∣<ϵ)=1,称序列依概率收敛于a
对任意随机变量X,若D(X)存在,则对任意的 ϵ > 0 \epsilon>0 ϵ>0有:
P [ ∣ X = E ( X ) ∣ ≥ ϵ ] ≤ D ( X ) ϵ 2 或 : P [ ∣ X = E ( X ) ∣ < ϵ ] ≥ 1 − D ( X ) ϵ 2 P[|X=E(X)|\geq\epsilon]\leq\frac{D(X)}{\epsilon^2}\\或:P[|X=E(X)|<\epsilon]\geq1-\frac{D(X)}{\epsilon^2} P[∣X=E(X)∣≥ϵ]≤ϵ2D(X)或:P[∣X=E(X)∣<ϵ]≥1−ϵ2D(X)
设 Y n Y_n Yn是n重伯努利试验中事件A发生的次数, p ( 0 < p < 1 ) p(0 p(0<p<1)
l i m n → ∞ P { ∣ Y n n − p ∣ ≥ ϵ } = 0 或 : l i m n → ∞ P { ∣ Y n n − p ∣ < ϵ } = 1 lim_{n\to\infty}P\{|\frac{Y_n}{n}-p|\geq\epsilon\}=0\\ 或:lim_{n\to\infty}P\{|\frac{Y_n}{n}-p|<\epsilon\}=1 limn→∞P{∣nYn−p∣≥ϵ}=0或:limn→∞P{∣nYn−p∣<ϵ}=1
设 X 1 , X 2 . . . X_1,X_2... X1,X2...是相互独立的随机变量序列,他们都有有限的方差,且方差有共同的上界,即 D ( X i ) ≤ C D(X_i)\leq C D(Xi)≤C,则对任意的 ϵ > 0 \epsilon>0 ϵ>0,有:
l i m n → ∞ P { ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n ( E X i ) ∣ ≥ ϵ } = 0 或 : l i m n → ∞ P { ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n ( E X i ) ∣ < ϵ } = 1 lim_{n\to\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^n(EX_i)|\geq\epsilon\}=0\\ 或:lim_{n\to\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^n(EX_i)|<\epsilon\}=1 limn→∞P{∣n1∑i=1nXi−n1∑i=1n(EXi)∣≥ϵ}=0或:limn→∞P{∣n1∑i=1nXi−n1∑i=1n(EXi)∣<ϵ}=1
设 X 1 , X 2 , . . . X_1,X_2,... X1,X2,...是独立同分布的随机变量序列,且 E ( X i ) = μ , D ( X i ) = σ 2 E(X_i)=\mu,D(X_i)=\sigma^2 E(Xi)=μ,D(Xi)=σ2,则对充分大的n,有:
∑ i = 1 n X i ≈ B ( n μ , n σ 2 ) \sum_{i=1}^nX_i\approx B(n\mu,n\sigma^2) ∑i=1nXi≈B(nμ,nσ2)
P ( a < ∑ i = 1 n ≤ b ) ≈ ϕ ( b − n μ n σ ) − ϕ ( a − n μ n σ ) P(a<\sum^n_{i=1}\leq b)\approx\phi(\frac{b-n\mu}{\sqrt{n}\sigma})-\phi(\frac{a-n\mu}{\sqrt{n}\sigma}) P(a<∑i=1n≤b)≈ϕ(nσb−nμ)−ϕ(nσa−nμ)
设随机变量 Y n Y_n Yn服从参数n,p的二项分布,则对充分大的n,有: 9时,用正态近似;当 p ≤ 0.1 ( 或 p ≥ 0.9 ) 且 n ≥ 10 时 , 用 泊 松 近 似 。 p\leq0.1(或p\geq0.9)且n\geq10时,用泊松近似。 p≤0.1(或p≥0.9)且n≥10时,用泊松近似。
Y n ≈ N ( n p , n p q ) 即 : P ( a < Y n ≤ q ) ≈ ϕ ( b − n μ n p q ) − ϕ ( a − n μ n p q ) Y_n\approx N(np,npq)\\即:P(a
**在实际中,0.1六、样本及抽样分布
1.随机样本
2.直方图和箱线图
3.抽样分布
七、参数估计
1.点估计
2.基于结尾样本的最大似然估计
3.估计量的评选标准
4.区间估计
5.正态总体均值与方差的区间估计
6.(0-1)分布参数的区间估计
7.单侧置信区间
八、假设试验
1.假设检验
2.正态总体均值的假设检验
3.正态总体方差的假设检验
4.置信区间与假设检验之间的关系
5.样本容量的选择
6.分布拟合检验
7.秩和检验
8.假设检验问题的 β \beta β值法
九、方差分析及回归分析
1.单因素试验的方差分析
2.双因素试验的方差分析
3.一元线性回归
4.多元线性回归
十、bootstrap方法