如果随机分布 X X X 有如下的概率分布:
P ( X = k ) = λ k k ! e − λ , k = 0 , 1 , ⋯ P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},k=0,1,\cdots P(X=k)=k!λke−λ,k=0,1,⋯
则称 X X X 服从参数为 λ \lambda λ 的泊松分布,简记为 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) , λ \lambda λ 为正常数。
1910年,著名科学家卢瑟福和盖格观察了放射性物质钋放射 α \alpha α 粒子的情况,他们进行了 N = 2608 N=2608 N=2608 次观测, 每次观测7.5秒,一共观测到10094个 α \alpha α 粒子放出。观测记录表明,**每7.5秒中放射出 α \alpha α 粒子的个数 X X X 近似服从泊松分布 P ( 3.87 ) P(3.87) P(3.87) **,3.87是7.5秒中放射出粒子的平均数。
可证明: X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) .设想将 t = 7.5 t=7.5 t=7.5 秒等分成 n n n 段,每段是 δ n = t / n \delta_n=t/n δn=t/n 秒,对充分大的 n n n 假定:
(1)在 δ n \delta_n δn 内最多只有一个 α \alpha α 粒子放出,并且放出一个粒子的概率 p n = μ δ n = μ t / n p_n=\mu\delta_n=\mu t/n pn=μδn=μt/n , μ \mu μ 是正常数;
(2)各小时间段内是否放射出 α \alpha α 粒子相互独立.
在以上假定下,放射出的粒子数 X X X 服从 B ( n , p n ) B(n,p_n) B(n,pn) ,于是:
P ( X = k ) = lim n → ∞ C n k p n k ( 1 − p n ) n − k = lim n → ∞ n ! k ! ( n − k ) ! ( μ t n ) k ( 1 − μ t n ) n − k = lim n → ∞ ( μ t ) k k ! n ( n − 1 ) ⋯ ( n − k + 1 ) n k ( 1 − μ t n ) n − k = ( μ t ) k k ! e − μ t \begin{aligned}P(X=k) & =\lim_{n\rightarrow\infty}C_n^kp_n^k(1-p_n)^{n-k}\\&=\lim_{n\rightarrow\infty}\frac{n!}{k!(n-k)!}(\frac{\mu t}{n})^k(1-\frac{\mu t}{n})^{n-k}\\&=\lim_{n\rightarrow\infty}\frac{(\mu t)^k}{k!}\frac{n(n-1)\cdots(n-k+1)}{n^k}(1-\frac{\mu t}{n})^{n-k}\\&=\frac{(\mu t)^k}{k!}e^{-\mu t}\end{aligned} P(X=k)=n→∞limCnkpnk(1−pn)n−k=n→∞limk!(n−k)!n!(nμt)k(1−nμt)n−k=n→∞limk!(μt)knkn(n−1)⋯(n−k+1)(1−nμt)n−k=k!(μt)ke−μt
取 λ = μ t \lambda=\mu t λ=μt ,得 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) .
该例子实际验证了二项分布向泊松分布趋近的事实;如果 n n n 很大, p p p 很小,就可以用泊松分布来描述二项分布 B ( n , p ) B(n,p) B(n,p) 。
泊松分布可以描述许多有类似背景的随机现象,例如某段高速公路上一年内的交通事故数,某市场一天中到达的顾客次数(排队论),某办公室一天中收到的电话数,某大学一天中上课迟到的总人数等等。
如果随机变量 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) ,则其期望与方差分别为:
E ( X ) = λ V a r ( X ) = λ E(X)=\lambda\\ Var(X)=\lambda E(X)=λVar(X)=λ
对正常数 λ \lambda λ ,如果随机变量 X X X 的概率密度是
f ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 f(x)=\begin{cases}\lambda e^{-\lambda x},&x\geq0\\0,&x<0\end{cases} f(x)={λe−λx,0,x≥0x<0
就称 X X X 服从参数为 λ \lambda λ 的指数分布,记作 X ∼ E ( λ ) X\sim E(\lambda) X∼E(λ) 。
定理:设 X X X 是连续型非负随机变量,则 X X X 服从指数分布的充要条件是对任何 s , t ≥ 0 s,t\geq0 s,t≥0,有
P ( X > s + t ∣ X > s ) = P ( X > t ) P(X>s+t|X>s)=P(X>t) P(X>s+t∣X>s)=P(X>t)
上性质称为无后效性,无后效性是指数分布的特征。
如果 X X X 表示某仪器的工作寿命,无后效性的解释是:当仪器工作了 s s s 小时后再继续工作 t t t 小时的概率等于该仪器刚开始就能工作 t t t 小时的概率,说明该仪器的使用寿命不随使用时间的增加发生变化,即仪器是“永葆青春”的。
一般来说,电子元件和计算机软件等具备这种性质,青花盘的使用寿命也具有无后效性。
定理的证明:略
用 X 1 X_1 X1 表示 α \alpha α 粒子实验中从开始到观测到第一个 α \alpha α 粒子的等待时间,可以证明 X 1 X_1 X1 服从指数分布。
用 N ( t ) N(t) N(t) 表示时间段 ( 0 , t ] (0,t] (0,t] 内观测到的 α \alpha α 粒子数,按照之前推导, N ( t ) ∼ P ( μ t ) N(t)\sim P(\mu t) N(t)∼P(μt) ,其中 μ \mu μ 是正常数。于是
P ( X 1 > t ) = P ( N ( t ) = 0 ) = e − μ t P(X_1>t)=P(N(t)=0)=e^{-\mu t} P(X1>t)=P(N(t)=0)=e−μt
所以,对任何 0 ≤ a < b 0\leq a0≤a<b ,有
P ( a < X 1 ≤ b ) = P ( X 1 > a ) − P ( X 1 > b ) = e − μ a − e − μ b = ∫ a b μ e − μ x d x P(a
因此 f ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 f(x)=\begin{cases}\lambda e^{-\lambda x},&x\geq0\\0,&x<0\end{cases} f(x)={λe−λx,0,x≥0x<0 是 X 1 X_1 X1 的概率密度。
可以想象,如果 X 2 X_2 X2 是从观测到第一个 α \alpha α 粒子开始到观测到第二个 α \alpha α 粒子的间隔时间, X 2 X_2 X2 也应当服从指数分布。
如果随机变量 X ∼ E ( λ ) X\sim E(\lambda) X∼E(λ) ,则其期望与方差分别为:
E ( X ) = 1 / λ V a r ( X ) = 1 / λ 2 E(X)=1/\lambda\\ Var(X)=1/\lambda^2 E(X)=1/λVar(X)=1/λ2