2.3 伯努利试验和直线上的随机游动

§3 Bernoulli试验和直线上的随机游动

文章目录

  • §3 Bernoulli试验和直线上的随机游动
    • 1.Bernoulli 概型
    • 2. Bernoulli概型中的一些分布
      • 2.1 Bernoulli 分布
      • 2.2 二项分布
      • 2.3 几何分布
      • 2.4 Pascal分布
    • 3. 直线上的随机游动
      • 3.1 无限制随机游动
      • 3.2 两端带有吸收壁的随机游动
    • 4. 推广的 Bernoulli 试验与多项分布

1.Bernoulli 概型

定义2.3.1(Bernoulli)试验

只有两种可能结果的实验被称为 Bernoulli试验。在这类问题中,我们可将事件域取为:
F = { ∅ , A , A ‾ , Ω } \mathscr{F} = \{ \empty, A,\overline{A},\Omega\} F={,A,A,Ω}
并称出现 A A A 为“成功”,出现 A ‾ \overline{A} A 为“失败”。

在某些情况中,试验的结果不止两个。但是,如果我们可以认为:出现且仅仅出现某一个特定的结果时认为其“成功”,其余任何结果都视为“失败”,则此时我们也可以把问题视为 Bernoulli 试验。

在 Bernoulli 试验中,首先需要给出下面概率:
P ( A ) = p ,    P ( A ‾ ) = q P(A) = p, \ \ P(\overline{A}) = q P(A)=p,  P(A)=q
显然, p , q ⩾ 0 p,q \geqslant 0 p,q0,且 p + q = 1. p+q = 1. p+q=1.


现在,我们考虑重复进行 n n n 次独立的 Bernoulli 试验。

定义2.3.2 n n n 重Bernoulli试验)

在每次试验中事件 A A A 和事件 A ‾ \overline{A} A 出现的概率都保持不变。我们称这样的试验为 n重Bernoulli试验 ,记为 E n E^{n} En.

对于 n n n 重Bernoulli试验,我们有下列的四个约定:

  1. 每次试验最多出现两个可能结果之一: A A A A ‾ \overline{A} A
  2. A A A 在每次实验中出现的概率 p p p 保持不变;
  3. 各次实验相互独立;
  4. 总共进行 n n n 次试验。

下面,我们给出 n n n 重Bernoulli 试验的概率空间:

n n n 重Bernoulli试验 E n E^{n} En 的样本点形如:
( A ^ 1 , A ^ 1 , ⋯   , A ^ n ) (\hat{A}_{1},\hat{A}_{1},\cdots,\hat{A}_{n}) (A^1,A^1,,A^n)
其中, A ^ i \hat{A}_{i} A^i A i A_{i} Ai A ‾ i \overline{A}_{i} Ai ,分别表示第 i i i 次试验中出现 A A A A ‾ \overline{A} A.显见,这样的样本点总共有 2 n 2^{n} 2n 个,这是一个有限样本空间。
为书写方便起见,我们进行如下约定:
( A 1 , A 2 , ⋯   , A n − 1 , A ‾ n ) (A_{1},A_{2},\cdots,A_{n-1},\overline{A}_{n}) (A1,A2,,An1,An)
表示前 n − 1 n-1 n1 次试验均出现事件 A A A ,而第 n n n 次试验出现事件 A ‾ \overline{A} A,简记为
A 1 A 2 ⋯ A n − 1 A ‾ n . A_{1}A_{2}\cdots A_{n-1}\overline{A}_{n}. A1A2An1An.
为给定 n n n 重Bernoulli试验的样本点的概率,我们主要考察在它中 A A A A ‾ \overline{A} A 出现的次数。若其中有 l l l A A A ,从而有 n − l n-l nl A ‾ \overline{A} A ,则利用试验的独立性可知:
P ( A ^ 1 A ^ 1 ⋯ A ^ n ) = P ( A ^ 1 ) P ( A ^ 2 ) ⋯ P ( A ^ n ) P(\hat{A}_{1} \hat{A}_{1} \cdots \hat{A}_{n}) = P(\hat{A}_{1})P(\hat{A}_{2})\cdots P(\hat{A}_{n}) P(A^1A^1A^n)=P(A^1)P(A^2)P(A^n)
= p l q n − l . =p^{l}q^{n-l}. =plqnl.
一般事件的概率由它所含样本点的概率求和得到。这样一来,我们已对 n n n 重Bernnoulli试验给定了概率空间。

Bernoulli试验是一种重要的概率模型。它是“在相同条件下进行重复试验”的一种数学模型,尤其在讨论某事件出现的频率时常用这种模型。


2. Bernoulli概型中的一些分布

2.1 Bernoulli 分布

若我们只进行一次Bernoulli试验,则这种概率分布称为 Bernoulli分布,这是最简单的情况。


2.2 二项分布

我们记 n n n 重Bernoulli试验中事件 A A A 出现 k k k 次的概率,记之为 b ( k ; n , p ) : b(k;n,p): b(k;n,p):

若以 B k B_{k} Bk n n n 重Bernoulli试验中事件 A A A 恰好出现 k k k 次这一事件,而用 A i A_{i} Ai 表示第 i i i 次试验中出现事件 A A A,以 A ‾ i \overline{A}_{i} Ai 表示第 i i i 次试验中出现 A ‾ \overline{A} A ,则
B k = A 1 A 2 ⋯ A k A ‾ k + 1 ⋯ A ‾ n + ⋯ + A ‾ 1 A ‾ 2 ⋯ A ‾ n − k A n − k + 1 ⋯ A n . B_{k} = A_{1}A_{2} \cdots A_{k} \overline{A}_{k+1} \cdots \overline{A}_{n} + \\ \cdots +\overline{A}_{1}\overline{A}_{2} \cdots \overline{A}_{n-k}A_{n-k+1} \cdots A_{n}. Bk=A1A2AkAk+1An++A1A2AnkAnk+1An.
右边的每一项表示在某 k k k 次试验中出现事件 A A A ,而在另外 n − k n-k nk 次实验中出现 A ‾ \overline{A} A,这种项共有 ( n k ) \binom{n}{k} (kn) 个,而且两两互不相容。

显见右边各项所对应事件的概率均为 p k q n − k p^{k}q^{n-k} pkqnk ,我们利用概率的可加性即得:
P ( B k ) = ( n k ) p k q n − k P(B_{k}) = \binom{n}{k}p^{k}q^{n-k} P(Bk)=(kn)pkqnk
即:
b ( k ; n , p ) = ( n k ) p k q n − k ,   k = 0 , 1 , 2 , ⋯   , n b(k;n,p) = \binom{n}{k}p^{k}q^{n-k}, \ k = 0,1,2,\cdots,n b(k;n,p)=(kn)pkqnk, k=0,1,2,,n

注意到 b ( k ; n , p ) ,   k = 0 , 1 , 2 , ⋯   , n b(k;n,p), \ k = 0,1,2,\cdots,n b(k;n,p) k=0,1,2,,n 是二项式 ( q + p s ) n (q + ps)^{n} (q+ps)n 展开式中 s k s^{k} sk 项的系数,因此上式称为 二项分布

特别地:
∑ k = 0 n b ( k ; n , p ) = ∑ k = 0 n ( n k ) p k q n − k = ( p + q ) n = 1. \sum^{n}_{k=0}b(k;n,p) = \sum_{k=0}^{n}\binom{n}{k}p^{k}q^{n-k} = (p+q)^{n} = 1. k=0nb(k;n,p)=k=0n(kn)pkqnk=(p+q)n=1.


2.3 几何分布

下面, 我们讨论在 Bernoulli 试验中"首次成功"出现在第 k k k 次试验的概率. 要使"首次成功"出现在第 k k k 次试验时, 必须且只需在前 k − 1 k-1 k1 次试验中均出现事件 A ‾ \overline{A} A, 而在第 k k k 次时出现 $A$, 因此该事件 (我们记为 W k W_{k} Wk ) 可表示为
W k = P ( A ‾ 1 ) P ( A ‾ 2 ) ⋯ P ( A ‾ k − 1 ) P ( A k ) = q k − 1 p . W_{k} = P(\overline{A}_{1})P(\overline{A}_{2})\cdots P(\overline{A}_{k-1})P(A_{k}) = q^{k-1}p. Wk=P(A1)P(A2)P(Ak1)P(Ak)=qk1p.

g ( k ; p ) = q k − 1 p ,      k = 1 , 2 , ⋯ g(k;p) = q^{k-1}p,\ \ \ \ k = 1,2,\cdots g(k;p)=qk1p,    k=1,2,
g ( k ; p ) g(k;p) g(k;p) 是几何级数的一般项, 故称上式为 几何分布. 此处有;
∑ k = 1 ∞ g ( k ; p ) = ∑ k = 1 ∞ q k − 1 p = p 1 1 − q = 1. \sum_{k = 1}^{\infty}g(k;p) = \sum_{k = 1}^{\infty}q^{k-1}p = p \frac{1}{1-q} = 1. k=1g(k;p)=k=1qk1p=p1q1=1.
几何分布给出了等待事件 A A A 出现共需要试验 k k k 次的概率. 这类概率在许多问题中都有涉及.


2.4 Pascal分布

下面, 我们讨论更为复杂的情况,也就是 Pascal 分布. 可以视其为几何分布的一种推广.

考虑 Bernoulli 试验,让我们考察要经过多长时间才会出现第 r r r 次成功:
若第 r r r 次成功发生在第 ζ \zeta ζ 次试验,则必然有 ζ ⩾ r . \zeta \geqslant r. ζr.
下面以 C k C_{k} Ck 表示"第 r r r 次成功发生在第 k k k 次试验" 这一事件,并且记其概率为 f ( k ; r , p ) f(k;r,p) f(k;r,p).

C k C_{k} Ck 发生当且仅当前面的 k − 1 k-1 k1 次试验中有 r − 1 r-1 r1 次成功, k − r k-r kr 次失败,而第 k k k 次试验的结果为成功,这两个事件的概率分别为: ( k − 1 r − 1 ) p r − 1 q k − r \binom{k-1}{r-1}p^{r-1}q^{k-r} (r1k1)pr1qkr p p p. 利用试验的独立性,得到:
P ( C k ) = ( k − 1 r − 1 ) p r − 1 q k − r ⋅ p = P ( C k ) = ( k − 1 r − 1 ) p r q k − r . P(C_{k}) = \binom{k-1}{r-1}p^{r-1}q^{k-r} \cdot p = P(C_{k}) = \binom{k-1}{r-1}p^{r}q^{k-r}. P(Ck)=(r1k1)pr1qkrp=P(Ck)=(r1k1)prqkr.
即:
f ( k ; r , p ) = ( k − 1 r − 1 ) p r q k − r ,     k = r , r + 1 , ⋯ f(k;r,p) = \binom{k-1}{r-1}p^{r}q^{k-r}, \ \ \ k = r,r+1,\cdots f(k;r,p)=(r1k1)prqkr,   k=r,r+1,
注意到:
∑ k = r ∞ f ( k ; r , p ) = ∑ k = r ∞ ( k − 1 r − 1 ) p r q k − r = ∑ l = 0 ∞ ( r + l − 1 r − 1 ) p r q l = ∑ l = 0 ∞ ( r + l − 1 l ) p r q l = ∑ l = 0 ∞ ( − r l ) ( − 1 ) l p r q l = p r ( 1 − q ) − r = 1. \sum_{k = r}^{\infty}f(k;r,p) = \sum_{k =r}^{\infty}\binom{k-1}{r-1}p^{r}q^{k-r} \\ = \sum_{l = 0}^{\infty} \binom{r + l - 1}{r - 1}p^{r}q^{l} = \sum_{l = 0}^{\infty} \binom{r+l-1}{l}p^{r}q^{l} \\ = \sum_{l = 0}^{\infty}\binom{-r}{l}(-1)^{l}p^{r}q^{l} = p^{r}(1-q)^{-r} = 1. k=rf(k;r,p)=k=r(r1k1)prqkr=l=0(r1r+l1)prql=l=0(lr+l1)prql=l=0(lr)(1)lprql=pr(1q)r=1.

我们称 f ( k ; r , p ) f(k;r,p) f(k;r,p)Pascal分布. 特别地,当 r = 1 r = 1 r=1 时,我们得到几何分布.


3. 直线上的随机游动

定义2.3.3 (随机游动)

我们考虑位于 x x x 轴上的一个质点,并限制它只能位于整数点. 在时刻 t = 0 t = 0 t=0 时, 它处于初始位置 a    a ∈ Z a \ \ a \in \mathbb{Z} a  aZ , 以后每个单位时间他总受到某个外力的随机作用使位置发生变化,分别以概率 p p p 和概率 q = 1 − p q = 1-p q=1p 向正方向/负方向移动一个单位.

在这个问题中, 我们所感兴趣的是质点在时刻 t = n t = n t=n 时的位置. 我们称用这种方式描述的质点运动为 随机游动.


定义2.3.4(无限制随机游动和有吸收壁的随机游动)

若质点可在整个数轴的整数点上游动,则称这种随机游动为 无限制随机游动.

若在某点 d d d 设有一个吸收壁, 质点一旦到达该点则被吸收从而不再游动, 因而游动过程结束,称这种随机游动为 d d d 点有吸收壁的随机游动.

此外, 我们还可以相应地考虑带有 “反射壁” 及 “弹性壁” 的随机游动, 在一个随机游动中还可以存在不止一个壁.

p = q = 1 2 p = q = \frac{1}{2} p=q=21 时,称这样的随机游动为 对称的, 此时质点向两方向移动的可能性相等.

在自然科学中, 我们可以将大量的问题都归结为随机游动问题. 例如: 随机游动模型可作为布朗运动的初步近似. 概率论中的一些古典问题也可引导到随机游动问题. 实际上, 随机游动可以视为 Bernoulli试验的一种描述法.


下面,我们简介随机游动的两个最简单的模型:

3.1 无限制随机游动

假定质点在时刻 0 0 0 从原点出发, 以 S n S_{n} Sn 记它在时刻 t = n t = n t=n 时的位置. 为了使质点在时刻 t = n t = n t=n 时位于 k k k ( k k k 也可以是负整数), 质点必须而且只需在前 n n n 次游动中向右游动的次数比向左游动的次数多 k k k 次.

若以 x x x 记它在前 n n n 次游动中向右游动的次数, y y y 记向左游动的次数,则
{ x + y = n x − y = k \begin{cases} x + y = n \\ x - y = k\end{cases} {x+y=nxy=k
x = n + k 2 x = \frac{n+k}{2} x=2n+k, 因为 x x x 是整数, 故 k k k 必须和 n n n 具有相同的奇偶性.

事件 { S n = k } \{S_{n} = k\} {Sn=k} 发生相当要求在前 n n n 次游动中有 n + k 2 \frac{n+k}{2} 2n+k 次向右, n − k 2 \frac{n-k}{2} 2nk 次向左. 利用二项分布即得:
P { S n = k } = ( n n + k 2 ) q n − k 2 p n + k 2 . P\{S_{n} = k\} = \binom{n}{\frac{n+k}{2}}q^{\frac{n-k}{2}}p^{\frac{n+k}{2}}. P{Sn=k}=(2n+kn)q2nkp2n+k.
k k k n n n 奇偶性相反时, 概率为 0. 0. 0.


3.2 两端带有吸收壁的随机游动

假定质点在时刻 t = 0 t = 0 t=0 时, 位于 x = a x = a x=a, 而在 x = 0 x = 0 x=0 x = a + b x = a+b x=a+b 处各有一个吸收壁,我们求质点在 x = 0 x = 0 x=0 被吸收或在 x = a + b x = a+b x=a+b 被吸收的概率. 使用的是差分方程法:

若以 q n q_{n} qn 记质点的初始位置为 n n n, 而最终在 a + b a+b a+b 点被吸收的概率, 显然; q 0 = 0 ,    q a + b = 1 q_{0} = 0,\ \ q_{a+b} = 1 q0=0,  qa+b=1若某时刻质点位于 x = n x = n x=n, 此处 1 ⩽ n ⩽ a + b − 1 1 \leqslant n \leqslant a+b-1 1na+b1, 则它要被 x = a + b x = a+b x=a+b 吸收.

有两种实现方式: 第一种是接下去的一次移动是向右的, 从而最终被 x = a + b x = a+b x=a+b 吸收; 另一种是接下去的一次移动是向左的, 而最终被 x = a + b x = a+b x=a+b 吸收. 所以, 按照全概率公式有: q n = p q n + 1 + q q n − 1 ,     n = 1 , 2 , ⋯   , a + b − 1. q_{n} = pq_{n+1} + qq_{n-1}, \ \ \ n = 1,2,\cdots, a+b-1. qn=pqn+1+qqn1,   n=1,2,,a+b1.这样, 我们就得到了关于 q n q_{n} qn 的一个二阶差分方程 (上式), 再利用边界条件 q 0 = 0 ,    q a + b = 1 q_{0} = 0,\ \ q_{a+b} = 1 q0=0,  qa+b=1 就可以求解.
利用这个差分方程系数的特殊性, 较为方便的解法是将原差分方程改写为: p ( q n + 1 − q n ) = q ( q n − q n − 1 ) ,     n = 1 , 2 , ⋯   , a + b − 1. p(q_{n+1} - q_{n}) = q(q_{n} - q_{n-1}),\ \ \ n = 1,2,\cdots,a+b-1. p(qn+1qn)=q(qnqn1),   n=1,2,,a+b1.
下面分两种情况求解;

  1. r = 1 r=1 r=1, 即 p = q = 1 2 p=q=\frac{1}{2} p=q=21, 也即对称随机游动的场合:

此时 c n = c n − 1 . c_{n} = c_{n-1}. cn=cn1.
因此, 若记
q n + 1 − q n = q n − q n − 1 = ⋯ = q 1 − q 0 = d q_{n+1}-q_{n} = q_{n}-q_{n-1} = \cdots =q_{1}-q_{0} = d qn+1qn=qnqn1==q1q0=d

q n = q 0 + n d q_{n} = q_{0} + nd qn=q0+nd
由于 q 0 = 0 ,   q a + b = 1 q_{0} = 0, \ q_{a+b} = 1 q0=0, qa+b=1, 故有:
q n = n a + b q_{n} = \frac{n}{a+b} qn=a+bn
特别地:
q a = a a + b . q_{a} = \frac{a}{a+b}. qa=a+ba.


  1. r ≠ 1 r \neq 1 r=1, 即 p ≠ q p \neq q p=q 的场合:

此时
c n = r c n − 1 = r 2 c n − 2 = ⋯ = r n c 0 . c_{n} = rc_{n-1} = r^{2}c_{n-2} = \cdots = r^{n}c_{0}. cn=rcn1=r2cn2==rnc0.
从而:
q n − q 0 = ∑ k = 0 n − 1 ( q k + 1 − q k ) = ∑ k = 0 n − 1 c k = ∑ k = 0 n − 1 r k c 0 = 1 − r n 1 − r c 0 . q_{n}-q_{0} = \sum^{n-1}_{k=0}(q_{k+1}-q_{k}) = \sum_{k=0}^{n-1}c_{k} = \sum_{k=0}^{n-1}r^{k}c_{0} = \frac{1-r^{n}}{1-r}c_{0}. qnq0=k=0n1(qk+1qk)=k=0n1ck=k=0n1rkc0=1r1rnc0.
由于 q 0 = 0 ,   q a + b = 1 q_{0} = 0, \ q_{a+b} = 1 q0=0, qa+b=1, 故有:
1 − r a + b 1 − r c 0 = 1 \frac{1-r^{a+b}}{1-r}c_{0} = 1 1r1ra+bc0=1
因此
q n = 1 − r n 1 − r a + b q_{n} = \frac{1-r^{n}}{1-r^{a+b}} qn=1ra+b1rn
特别地:
q a = 1 − r n 1 − r a + b = 1 − ( q p ) a 1 − ( q p ) a + b . q_{a} = \frac{1-r^{n}}{1-r^{a+b}} = \frac{1-(\frac{q}{p})^{a}}{1-(\frac{q}{p})^{a+b}}. qa=1ra+b1rn=1(pq)a+b1(pq)a.


若以 p n p_{n} pn 记质点从 n n n 出发而在 0 0 0 点被吸收的概率,则同样可列出差分方程:
p n = p p n + 1 + q p n + 1 ,     n = 1 , 2 , ⋯   , a + b − 1. p_{n} = pp_{n+1} + qp_{n+1},\ \ \ n = 1,2,\cdots, a+b-1. pn=ppn+1+qpn+1,   n=1,2,,a+b1.
及边界条件:
p 0 = 1 ,    p a + b = 0. p_{0} = 1,\ \ p_{a+b} = 0. p0=1,  pa+b=0.
类似地可以求得:当 p = q = 1 2 p = q = \frac{1}{2} p=q=21 时:
p a = a a + b p_{a} = \frac{a}{a+b} pa=a+ba
而在 p ≠ q p \neq q p=q 的情况下:
p a = 1 − ( p q ) b 1 − ( p q ) a + b = ( q p ) a − ( q p ) a + b 1 − ( q p ) a + b . p_{a} = \frac{1-(\frac{p}{q})^{b}}{1-(\frac{p}{q})^{a+b}} = \frac{(\frac{q}{p})^{a}-(\frac{q}{p})^{a+b}}{1-(\frac{q}{p})^{a+b}}. pa=1(qp)a+b1(qp)b=1(pq)a+b(pq)a(pq)a+b.
在任何情况下,均有:
p a + p b = 1. p_{a} + p_{b} = 1. pa+pb=1.
也就是说, 随机游动的质点最终必被两个端点之一所吸收.



4. 推广的 Bernoulli 试验与多项分布

二项分布可以被很容易地推广到 n n n 次重复独立试验且每次试验可能有若干个结果的情形. 将每次试验的可能结果记为 A 1 , A 2 , ⋯   , A r A_{1},A_{2},\cdots, A_{r} A1,A2,,Ar, 而 P ( A i ) = p i ,   i = 1 , 2 , ⋯   , r , P(A_{i}) = p_{i},\ i = 1,2,\cdots,r, P(Ai)=pi, i=1,2,,r,
p 1 + p 2 + ⋯ + p r = 1 ,    p i ⩾ 0. p_{1} + p_{2} + \cdots + p_{r} = 1, \ \ p_{i} \geqslant 0. p1+p2++pr=1,  pi0.
r = 2 r = 2 r=2 时, 我们即得到 Bernoulli 试验.

在这种推广的 Bernoulli 试验中,不难推出在 n n n 次试验中 A i A_{i} Ai 出现 k i k_{i} ki 次 ( i = 1 , 2 , ⋯   , r i = 1,2,\cdots,r i=1,2,,r) 的概率为;
n ! k 1 ! k 2 ! ⋯ k r ! p 1 k 1 p 2 k 2 ⋯ p r k r . \frac{n!}{k_{1}!k_{2}!\cdots k_{r}!}p_{1}^{k_{1}}p_{2}^{k_{2}}\cdots p_{r}^{k_{r}}. k1!k2!kr!n!p1k1p2k2prkr.
此处 k i ⩾ 0 k_{i} \geqslant 0 ki0, 且 k 1 + k 2 + ⋯ + k r = n . k_{1} + k_{2} + \cdots +k_{r} = n. k1+k2++kr=n.
上式称为 多项分布, 因其为 ( p 1 + p 2 + ⋯ + p r ) n (p_{1} + p_{2} + \cdots +p_{r})^{n} (p1+p2++pr)n 展开式的一般项,且知:
∑ k i ⩾ 0     k 1 + k 2 + ⋯ + k r = 1 n ! k 1 ! k 2 ! ⋯ k r ! p 1 k 1 p 2 k 2 ⋯ p r k r . \sum_{k_{i} \geqslant 0 \ \ \ k_{1} + k{2} + \cdots + k{r} = 1} \frac{n!}{k_{1}!k_{2}!\cdots k_{r}!}p_{1}^{k_{1}}p_{2}^{k_{2}}\cdots p_{r}^{k_{r}}. ki0   k1+k2++kr=1k1!k2!kr!n!p1k1p2k2prkr.
显然,多项分布是二项分布的推广, 二项分布的许多结论均和多项分布的场合平行. 以后, 我们只详细讨论二项分布的有关问题.

你可能感兴趣的:(概率论自学笔记,概率论,统计学)