概率导论(一)——样本空间与概率

参考书:《概率导论》,作者:Dimitri P. Bertsekas,John N. Tsitsiklis。
本系列博客为自学《概率导论》笔记。

思维导图

概率导论(一)——样本空间与概率_第1张图片

集合

  • 将一些研究对象放在一起,形成集合,这些对象就是集合的元素
  • S S S是一个集合, x x x S S S的元素。
    • x x x S S S的元素,则写成 x ∈ S x\in S xS
    • x x x不是 S S S的元素,则写成 x ∉ S x\notin S x/S
    • 若一个集合没有元素,则为空集,写成 ∅ \empty
  • S S S包含有限个元素 x 1 , x 2 , ⋯   , x n x_1,x_2,\cdots,x_n x1,x2,,xn,则写成 S = { x 1 , x 2 , ⋯   , x n } S=\lbrace{x_1,x_2,\cdots,x_n}\rbrace S={ x1,x2,,xn} .
  • S S S包含无限个元素 x 1 , x 2 , ⋯ x_1,x_2,\cdots x1,x2,,则写成 S = { x 1 , x 2 , ⋯ } S=\lbrace{x_1,x_2,\cdots}\rbrace S={ x1,x2,} .
    • S S S中的这些元素可以排成一列,此时称 S S S可数无限集
  • 也可以 以 x x x具有某种性质 P P P为条件来刻画一个集合,记作: { x ∣ x 满 足 性 质 P } \lbrace{x|x满足性质P}\rbrace { xxP}.
    • { x ∣ 0 ≤ x ≤ 1 } \lbrace{x|0≤x≤1}\rbrace { x0x1},是一个连续集合,但它的元素不能排成一列,故称为不可数的集合。
  • 若集合 S S S中的所有元素均为集合 T T T的元素,则称 S S S T T T的子集,记作 S ⊂ T S\sub T ST T ⊃ S T\supset S TS.
  • S ⊂ T S\sub T ST T ⊂ S T\sub S TS,则两个集合相等,记作: S = T S=T S=T
  • 将我们感兴趣的所有元素放在一起,形成一个集合,这个集合称为空间,记作: Ω \Omega Ω
    • Ω \Omega Ω确定以后,我们所讨论的集合 S S S都是 Ω \Omega Ω的子集。

集合运算

  • 集合 { x ∈ Ω ∣ x ∉ S } \lbrace{x\in \Omega|x \notin S}\rbrace { xΩx/S}称为集合 S S S相对于 Ω \Omega Ω补集,记作: S c S^c Sc。注意 Ω c = ∅ \Omega^c = \empty Ωc=
  • 由属于 S S S或属于 T T T的元素组成的集合称为 S S S T T T,记为: S ∪ T S \cup T ST. S ∪ T = { x ∣ x ∈ S 或 x ∈ T } S\cup T=\lbrace{x|x\in S 或 x\in T}\rbrace ST={ xxSxT}
  • 由既属于 S S S又属于 T T T的元素组成的集合称为 S S S T T T,记为: S ∩ T S \cap T ST. S ∩ T = { x ∣ x ∈ S 且 x ∈ T } S\cap T=\lbrace{x|x\in S 且 x\in T}\rbrace ST={ xxSxT}
  • 如果每一个正整数 n n n都能确定一个集合 S n S_n Sn,则: ⋃ n = 1 ∞ S n = S 1 ∪ S 2 ⋯ = { x ∣ x ∈ S n 对 某 个 n 成 立 } , \bigcup_{n=1}^{\infty}S_n=S_1\cup S_2 \cdots=\lbrace{x|x\in S_n对某个n成立}\rbrace, n=1Sn=S1S2={ xxSnn}, ⋂ n = 1 ∞ S n = S 1 ∩ S 2 ⋯ = { x ∣ x ∈ S n 对 一 切 n 成 立 } . \bigcap_{n=1}^{\infty}S_n=S_1\cap S_2 \cdots =\lbrace{x|x\in S_n对一切n成立}\rbrace . n=1Sn=S1S2={ xxSnn}.
  • 如果两个集合的交集是空集,则这两个集合称为不相交的。
  • 如果几个集合中,任何两个集合都没有公共元素,则这几个集合称为互不相交的。
  • 一组集合,如果这组集合中的集合互不相交,且它们的并为 S S S,则这组集合称为集合 S S S分割
  • x x x y y y为两个研究对象,我们用 ( x , y ) (x,y) (x,y)表示 x x x y y y有序对
  • 我们用 R R R表示实数集合,用 R 2 R^2 R2表示实数对的集合,即二维平面,用 R 3 R^3 R3表示三维实数向量的集合(三维空间)。

集合的代数

  • S ∪ T = T ∪ S ; S \cup T=T \cup S; ST=TS;
  • S ∪ ( T ∪ U ) = ( S ∪ T ) ∪ U ; S \cup (T \cup U)=(S \cup T)\cup U; S(TU)=(ST)U;
  • S ∩ ( T ∪ U ) = ( S ∩ T ) ∪ ( S ∩ U ) ; S \cap(T \cup U)=(S\cap T)\cup(S\cap U); S(TU)=(ST)(SU);
  • S ∪ ( T ∩ U ) = ( S ∪ T ) ∩ ( S ∪ U ) ; S \cup(T \cap U)=(S \cup T)\cap(S \cup U); S(TU)=(ST)(SU);
  • ( S c ) c = S ; (S^c)^c=S; (Sc)c=S;
  • S ∩ S c = ∅ ; S \cap S^c=\empty; SSc=;
  • S ∪ Ω = Ω ; S \cup \Omega=\Omega; SΩ=Ω;
  • S ∩ Ω = S ; S \cap \Omega=S; SΩ=S;
  • 德摩根定律:
    • ( ⋃ n S n ) c = ⋂ n S n c ; (\bigcup_n S_n)^c=\bigcap_n S_n^c; (nSn)c=nSnc;
    • ( ⋂ n S n ) c = ⋃ n S n c ; (\bigcap_n S_n)^c=\bigcup_n S_n^c; (nSn)c=nSnc;

概率模型

概率模型是对不确定现象的数学描述。

  • 概率模型的基本构成:
    • 样本空间 Ω \Omega Ω:这是一个试验的所有可能结果的集合。
    • 概率律:概率律为试验结果的集合 A A A(称为事件)确定一个非负数 P ( A ) P(A) P(A)(称为事件 A A A概率)。
      概率导论(一)——样本空间与概率_第2张图片

样本空间和事件

  • 样本空间:每一个概率模型都关联着一个试验,这个试验将产生一个试验结果,该试验的所有可能结果形成样本空间,用 Ω \Omega Ω表示样本空间。
  • 事件:样本空间的子集,即某些实验结果的集合,称为事件。

选择适当的样本空间

  • 在确定样本空间的时候,不同的试验结果必须是相互排斥的,这样,在试验过程中只可能产生唯一的一个结果。
  • 确定模型的时候,不能遗漏其样本空间中的任何一个结果。
  • 在建立样本空间的时候,要有足够的细节区分我们感兴趣的事件,同时要避免不必要的烦琐。

序贯模型

许多试验本身具有序贯的特征

例如:连续抛掷一枚硬币,一共抛掷三次,或者连续观察一只股票,共观察5天,又或者在一个通信接受设备上接收8个数字。

常用序贯树形图来刻画样本空间中的试验结果,如下图所示:

序贯树形图示例:
设所考虑的试验连续两次抛掷有4个面的骰子,,其样本空间有两种等价的刻画方法。
在这个试验中,可能的结果是全体有序对 ( i , j ) (i,j) (i,j),其中 i i i表示第一次抛掷骰子得到的数字, j j j表示第二次抛掷骰子得到的数字。
试验结果可用左图中的2维格子点表示,也可以用右图中的序贯树形图表示,后者的优点是可以表示试验的序贯特征。
在序贯树形图中,每一个可能的试验结果可以用一个末端的树叶表示,或等价的用与树叶相联系的由根部到树叶的一个路径表示。
左图中的阴影部分代表事件 { ( 1 , 4 ) , ( 2 , 4 ) , ( 3 , 4 ) , ( 4 , 4 ) } \lbrace{(1,4),(2,4),(3,4),(4,4)}\rbrace { (1,4),(2,4),(3,4),(4,4)},它表示第2次抛掷得到4.
同一个事件,可以在右图中用空心圆点标示的叶子集合表示。
序贯树形图中的每一个结点可以代表一个事件,这个事件就是由这个结点出发的所有叶子构成的事件。例如,用1标示的结点代表事件 { ( 1 , 1 ) , ( 1 , 2 ) , ( 1 , 3 ) , ( 1 , 4 ) } \lbrace{(1,1),(1,2),(1,3),(1,4)}\rbrace { (1,1),(1,2),(1,3),(1,4)},即第1次抛掷得1的事件。

概率导论(一)——样本空间与概率_第3张图片

概率律

当我们已经确定了样本空间以及与之联系的试验,为了建立一个概率模型,我们需要引进概率律的概念

  • 概率律:
    • 直观上,它确定了任何结果或任何结果的集合(称为事件)的似然程度。
    • 精确的说,它给每一个事件 A A A,确定一个数 P ( A ) P(A) P(A),称为事件 A A A概率
  • 概率公理
    • (非负性) 对一切事件 A A A,满足 P ( A ) ≥ 0 P(A)≥0 P(A)0.
    • (可加性) A A A B B B为两个互不相交的集合(概率论中称为互不相容的事件),则它们的并满足: P ( A ∪ B ) = P ( A ) + P ( B ) . P(A\cup B)=P(A)+P(B). P(AB)=P(A)+P(B).更一般地,若 A 1 , A 2 , ⋯ A_1,A_2,\cdots A1,A2,是互不相容的事件序列,则它们的并满足: P ( A 1 ∪ A 2 ∪ ⋯   ) = P ( A 1 ) + P ( A 2 ) + ⋯   . P(A_1\cup A_2 \cup \cdots)=P(A_1)+P(A_2)+\cdots. P(A1A2)=P(A1)+P(A2)+.
    • (归一化) 整个样本空间 Ω \Omega Ω(称为必然事件)的概率为1,即 P ( Ω ) = 1. P(\Omega)=1. P(Ω)=1.

可以把样本空间中的试验结果看成质点,每一个质点有一个质量。 P ( A ) P(A) P(A)就是这个质点集合的总质量,而全空间的总质量为1.
概率律中的可加公式:不相交的事件序列的总质量等于各个事件的质量之和。

  • P ( ∅ ) = 0 ; P(\empty)=0; P()=0;
  • P ( A 1 ∪ A 2 ∪ A 3 ) = P ( A 1 ) + P ( A 2 ) + P ( A 3 ) P(A_1 \cup A_2 \cup A_3)=P(A_1)+P(A_2)+P(A_3) P(A1A2A3)=P(A1)+P(A2)+P(A3)
  • 有限多个互不相容的事件的并的概率等于它们各自的概率之和。
  • 证明某一概率是否是样本空间上的概率律:
    即证明此概率是否满足概率律三大公理。
    若已经证明某一概率是概率律,则概率律的性质皆适用于此概率。

离散模型

  • 离散概率律:
    设样本空间由有限个可能的结果组成,则事件的概率可由组成这个事件的试验结果的概率所决定。事件 { s 1 , s 2 , ⋯   , s n } \lbrace{s_1,s_2,\cdots,s_n}\rbrace { s1,s2,,sn}的概率是 P ( s i ) P(s_i) P(si)之和,即: P ( { s 1 , s 2 , ⋯   , s n } ) = P ( s 1 ) + P ( s 2 ) + ⋯ + P ( s n ) . P(\lbrace{s_1,s_2,\cdots,s_n}\rbrace)=P(s_1)+P(s_2)+\cdots+P(s_n). P({ s1,s2,,sn})=P(s1)+P(s2)++P(sn).
  • 离散均匀概率律(古典概型):
    设样本空间由 n n n个等可能性的试验结果组成,因此每个试验结果组成的事件(称为基本事件)的概率是相等的。由此得到: P ( A ) = 含 于 事 件 A 的 试 验 结 果 数 n . P(A)=\frac {含于事件A的试验结果数}{n}. P(A)=nA.

连续模型

  • 若试验的样本空间是一个连续集合,其相应的单个点所组成的事件的概率必定为0

例如,若样本空间是 Ω = [ 0 , 1 ] \Omega=[0,1] Ω=[0,1],则 P ( 0.5 ) = 0 , P ( [ 0 , 0.5 ] ) = 1 2 P(0.5)=0,P([0,0.5])=\frac {1}{2} P(0.5)=0,P([0,0.5])=21

  • 例题:
    罗密欧和朱丽叶约定在某一时刻见面,而每个人到达约会地点的时间都会有延迟,延迟时间在0~1小时。第一个到达约会地点的人会在那儿等待15分钟,等了15分钟后,若对方还没有到达约会地点,先到者会离开约会地点。问他们能够相互的概率有多大?

设罗密欧的延迟时间是 x x x,朱丽叶的延迟时间是 y y y,则根据题意知, 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 , ∣ x − y ∣ ≤ 1 4 0≤x≤1,0≤y≤1,|x-y|≤\frac {1}{4} 0x1,0y1,xy41,在直角坐标系中画出对应的图形:
概率导论(一)——样本空间与概率_第4张图片
事件 M M M代表罗密欧和朱丽叶相互等待时间不超过15分钟, M M M是图中阴影部分,即: M = { ( x , y ) ∣ ∣ x − y ∣ ≤ 1 4 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 } M=\lbrace{(x,y)\big||x-y|≤\frac {1}{4},0≤x≤1,0≤y≤1}\rbrace M={ (x,y)xy41,0x1,0y1} M M M的面积等于1减去两个没有阴影的三角形的面积之和,即 1 − 3 4 × 3 4 = 7 16 1-\frac {3}{4} × \frac {3}{4}=\frac {7}{16} 143×43=167,因此他们能够相互的概率是 7 16 . \frac {7}{16}. 167.

概率律的性质

  • 概率律的若干性质:
    考虑一个概率律,令 A A A B B B C C C为事件。
    • (1)若 A ⊂ B A \sub B AB,则 P ( A ) ≤ P ( B ) . P(A)≤P(B). P(A)P(B).
    • (2) P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) . P(A \cup B)=P(A)+P(B)-P(A \cap B). P(AB)=P(A)+P(B)P(AB).
    • (3) P ( A ∪ B ) ≤ P ( A ) + P ( B ) . P(A \cup B)≤P(A)+P(B). P(AB)P(A)+P(B).
    • (4) P ( A ∪ B ∪ C ) = P ( A ) + P ( A c ∩ B ) + P ( A c ∩ B c ∩ C ) P(A \cup B \cup C)=P(A)+P(A^c \cap B)+P(A^c \cap B^c \cap C) P(ABC)=P(A)+P(AcB)+P(AcBcC)
  • 性质(3)可以推广成: P ( A 1 ∪ A 2 ∪ ⋯ ∪ A n ) ≤ ∑ i = 1 n P ( A i ) . P(A_1 \cup A_2 \cup \cdots \cup A_n)≤\sum_{i=1}^n P(A_i). P(A1A2An)i=1nP(Ai).

模型和现实

通过两个阶段来分析现实世界的许多不确定现象。

  • 第一阶段:
    在一个适当的样本空间中给出概率律,从而建立概率模型。
  • 第二阶段:
    我们将在完全严格的概率模型之下进行推导,计算某些事件的概率或推导出一些十分有趣的性质。
  • 概率论中存在一个“悖论”:
    对同一个问题,不同的计算方法似乎会得到不同的结论。

条件概率

条件概率是在给定部分信息的基础上对试验结果的一种推断。

在抛掷骰子的试验中有6种等概率的试验结果。
如果我们已经知道试验结果是偶数,即2,4,6这三种结果之一发生。
这样,得到试验结果是6的概率是: P ( 试 验 结 果 是 6 ∣ 试 验 结 果 是 偶 数 ) = 1 3 P(试验结果是6|试验结果是偶数)=\frac {1}{3} P(6)=31

  • 根据上例的推导可知,对于等概率模型的情况,下面关于条件概率的定义是合适的,即: P ( A ∣ B ) = 事 件 A ∩ B 的 试 验 结 果 数 事 件 B 的 试 验 结 果 数 P(A|B)=\frac {事件A\cap B的试验结果数}{事件B的试验结果数} P(AB)=BAB
    将这个结果推广,我们得到条件概率的定义: P ( A ∣ B ) = P ( A ∩ B ) P ( B ) P(A|B)=\frac {P(A \cap B)}{P(B)} P(AB)=P(B)P(AB)其中假定 P ( B ) > 0. P(B)>0. P(B)>0.

条件概率是一个概率律

  • 证明条件概率是一个概率律:
    • 非负性显然成立;
    • 由于 P ( Ω ∣ B ) = P ( Ω ∩ B ) P ( B ) = P ( B ) P ( B ) = 1 P(\Omega|B)=\frac {P(\Omega \cap B)}{P(B)}=\frac {P(B)}{P(B)}=1 P(ΩB)=P(B)P(ΩB)=P(B)P(B)=1,故归一化成立;
    • A 1 , A 2 A_1,A_2 A1,A2是任意两个不相容的事件, P ( A 1 ∪ A 2 ∣ B ) = P ( ( A 1 ∩ A 2 ) ∪ B ) P ( B ) = P ( ( A 1 ∩ B ) ∪ ( A 2 ∩ B ) ) P ( B ) = P ( A 1 ∩ B ) + P ( A 2 ∩ B ) P ( B ) = P ( A 1 ∩ B ) P ( B ) + P ( A 2 ∩ B ) P ( B ) = P ( A 1 ∣ B ) + P ( A 2 ∣ B ) P(A_1 \cup A_2|B)=\frac {P((A_1 \cap A_2)\cup B)}{P(B)}=\frac {P((A_1 \cap B)\cup (A_2 \cap B))}{P(B)}=\frac {P(A_1 \cap B)+P(A_2 \cap B)}{P(B)}=\frac {P(A_1 \cap B)}{P(B)}+\frac {P(A_2 \cap B)}{P(B)}=P(A_1|B)+P(A_2|B) P(A1A2B)=P(B)P((A1A2)B)=P(B)P((A1B)(A2B))=P(B)P(A1B)+P(A2B)=P(B)P(A1B)+P(B)P(A2B)=P(A1B)+P(A2B)故,可加性成立。
  • 条件概率的性质:
    • 设事件 B B B满足 P ( B ) > 0 P(B)>0 P(B)>0,则给定 B B B之下,事件 A A A的条件概率由下式给出: P ( A ∣ B ) = P ( A ∩ B ) P ( B ) . P(A|B)=\frac {P(A\cap B)}{P(B)}. P(AB)=P(B)P(AB).这个条件概率在同一个样本空间 Ω \Omega Ω上给出了一个新的(条件)概率律。
      凡是现有的概率律的所有性质对这个条件概率都是适用的。
    • 由于条件概率所关心的事件都是事件 B B B的子事件,可以把条件概率看成 B B B上的概率律,即把事件 B B B看成全空间或必然事件。
    • 当试验的 Ω \Omega Ω为有限集,并且所有的试验结果为等可能的情况下,条件概率律可由下式给出: P ( A ∣ B ) = 事 件 A ∩ B 的 试 验 结 果 数 事 件 B 的 试 验 结 果 数 P(A|B)=\frac {事件A \cap B的试验结果数}{事件B的试验结果数} P(AB)=BAB

例题:
有两个设计团队,一个比较稳重,记作 C C C,另一个具有创新性,记作 N N N。要求他们分别在一个月内做一个新设计。从过去的经验知道:
(a) C C C成功的概率为 2 3 ; \frac {2}{3}; 32;
(b) N N N成功的概率为 1 2 ; \frac {1}{2}; 21;
(c)两个团队中至少有一个成功的概率为 3 4 . \frac {3}{4}. 43.
已知两个团队中只有一个团队完成了任务。问这个任务是 N N N完成的概率有多大?
解:
现在共有4种可能结果:
S S SS SS:双方成功;
S F SF SF C C C成功, N N N失败;
F S FS FS C C C失败, N N N成功;
F F FF FF:双方失败。
现在将(a)(b)(c)写成概率等式: P ( S S ) + P ( S F ) = 2 3 , P ( S S ) + P ( F S ) = 1 2 , P ( S S ) + P ( S F ) + P ( F S ) = 3 4 P(SS)+P(SF)=\frac {2}{3},P(SS)+P(FS)=\frac {1}{2},P(SS)+P(SF)+P(FS)=\frac {3}{4} P(SS)+P(SF)=32,P(SS)+P(FS)=21,P(SS)+P(SF)+P(FS)=43结合归一化公理: P ( S S ) + P ( S F ) + P ( F S ) + P ( F F ) = 1 P(SS)+P(SF)+P(FS)+P(FF)=1 P(SS)+P(SF)+P(FS)+P(FF)=1得到: P ( S S ) = 5 12 , P ( S F ) = 1 4 , P ( F S ) = 1 12 , P ( F F ) = 1 4 . P(SS)=\frac {5}{12},P(SF)=\frac {1}{4},P(FS)=\frac {1}{12},P(FF)=\frac {1}{4}. P(SS)=125,P(SF)=41,P(FS)=121,P(FF)=41.所求的条件概率为: P ( F S ∣ { S F , F S } ) = 1 12 1 4 + 1 12 = 1 4 . P(FS|\lbrace{SF,FS}\rbrace)=\frac {\frac {1}{12}}{\frac {1}{4}+\frac {1}{12}}=\frac{1}{4}. P(FS{ SF,FS})=41+121121=41.

利用条件概率定义概率模型

在为试验建立具有序贯特征的概率模型的时候,通常很自然地首先确定条件概率,然后确定无条件概率。这一过程,经常使用的条件概率公式 P ( A ∩ B ) = P ( A ∣ B ) P ( B ) . P(A\cap B)=P(A|B)P(B). P(AB)=P(AB)P(B).

例题(雷达探测器):
若在某区域有一架飞机,雷达以99%的概率探测到并报警。
若在该地区没有飞机,雷达会以10%的概率虚假报警。
现在假定一架飞机以5%的概率出现在该地区。
问飞机没有出现在该地区而雷达虚假报警的概率有多大?飞机出现在该地区而雷达没有探测到的概率有多大?
解:
记: A = { 飞 机 出 现 } , B = { 雷 达 报 警 } , A c = { 飞 机 不 出 现 } , B c = { 雷 达 未 报 警 } A=\lbrace{飞机出现}\rbrace,B=\lbrace{雷达报警}\rbrace,A^c=\lbrace{飞机不出现}\rbrace,B^c=\lbrace{雷达未报警}\rbrace A={ }B={ }Ac={ }Bc={ }
题中给出的概率记录在下图描述样本空间的序贯树的相应枝条上。
每个试验结果可用树形图的叶子表示,它的概率等于由根部到树叶的枝条上显示的数据的乘积。
所求的概率为:
P ( 飞 机 不 出 现 , 报 警 ) = P ( A c ∩ B ) = P ( A c ) P ( B ∣ A c ) = 0.95 × 0.10 = 0.095 P(飞机不出现,报警)=P(A^c\cap B)=P(A^c)P(B|A^c)=0.95×0.10=0.095 P(,)=P(AcB)=P(Ac)P(BAc)=0.95×0.10=0.095
P ( 飞 机 出 现 , 未 报 警 ) = P ( A ∩ B c ) = P ( A ) P ( B c ∣ A ) = 0.05 × 0.01 = 0.0005 P(飞机出现,未报警)=P(A \cap B^c)=P(A)P(B^c|A)=0.05×0.01=0.0005 P(,)=P(ABc)=P(A)P(BcA)=0.05×0.01=0.0005
概率导论(一)——样本空间与概率_第5张图片

  • 利用序贯树形图计算概率,规则如下:
    • (a)设立一个序贯树形图,让关心的事件处于图的末端(叶子),由根结点一直到叶子的路径上的每一个结点代表一个事件。而我们所关心的事件的发生是由根结点一直到叶子的一系列事件发生的结果。
    • (b)在路径的每个分支上写上相应的条件概率。
    • (c)叶子所代表的事件是相应的分支上的条件概率的乘积。
  • 乘法规则:
    假定所有涉及的条件概率都是正的,有: P ( ∩ i = 1 n A i ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 ∩ A 2 ) ⋯ P ( A n ∣ ∩ i = 1 n − 1 A i ) . P(\cap_{i=1}^n A_i)=P(A_1)P(A_2|A_1)P(A_3|A_1 \cap A_2)\cdots P(A_n|\cap_{i=1}^{n-1}A_i). P(i=1nAi)=P(A1)P(A2A1)P(A3A1A2)P(Ani=1n1Ai).
  • 证明乘法规则:
    P ( ∩ i = 1 n A i ) = P ( A 1 ) P ( A 2 ∩ A 1 ) P ( A 1 ) ⋅ P ( A 3 ∩ A 1 ∩ A 2 ) P ( A 1 ∩ A 2 ) ⋯ P ( ∩ i = 1 n A i ) P ( ∩ i = 1 n − 1 A i ) . P(\cap_{i=1}^n A_i)=P(A_1)\frac {P(A_2 \cap A_1)}{P(A_1)}\cdot \frac {P(A_3 \cap A_1 \cap A_2)}{P(A_1 \cap A_2)}\cdots \frac {P(\cap_{i=1}^n A_i)}{P(\cap_{i=1}^{n-1}A_i)}. P(i=1nAi)=P(A1)P(A1)P(A2A1)P(A1A2)P(A3A1A2)P(i=1n1Ai)P(i=1nAi).再利用条件概率的定义,上式右端变成: P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 ∩ A 2 ) ⋯ P ( A n ∣ ∩ i = 1 n − 1 A i ) . P(A_1)P(A_2|A_1)P(A_3|A_1 \cap A_2)\cdots P(A_n|\cap_{i=1}^{n-1}A_i). P(A1)P(A2A1)P(A3A1A2)P(Ani=1n1Ai).

例题:(蒙提·霍尔问题,也称三门问题)
你站在三个封闭的门前,其中一个门后有奖品。当然,奖品在哪一个门后面是完全随机的。当你选定一个门以后,你的朋友打开其余两扇门中的一扇空门,显示门后没有奖品。此时,你可以有两种选择,保持原来的选择,或者改选另一扇没有被打开的门。当你做出最后选择以后,如果打开的门后有奖品,这个奖品就归你。
现在有三种策略:
(a)坚持原来的选择;
(b)改选另一扇没有被打开的门;
(c)你首先选择1号门,当你的朋友打开的是2号空门,你不改变注意。当你的朋友打开的是3号空门,你改变主义,选择2号门。
解析:
在策略(a)下,你的初始选择会决定你的输赢。由于奖品的位置是随机地确定的,你得奖的概率只能是 1 3 \frac {1}{3} 31
在策略(b)下,如果奖品的位置在你原来指定的门后(概率为 1 3 \frac {1}{3} 31),由于你改变了主意,因而失去了获奖机会。如果奖品的位置不在你原来指定的门后(概率为 2 3 \frac {2}{3} 32),而你的朋友,又将没有奖品的那扇门打开,当你改变选择的时候,一定有奖品,获奖概率是 2 3 \frac {2}{3} 32。因此(b)比(a)好。
在策略(c)下,由于提供的信息不够充分,还不能确定你赢得奖品的概率。答案依赖于你的朋友打开门的方式。现在讨论两种情况:
第一种情况是:假定奖品的位置是在1号门后(概率为 1 3 \frac {1}{3} 31),你的朋友打开了2号门,你不改变选择,则你得到奖品。当奖品在2号门后(概率为 1 3 \frac {1}{3} 31)的时候,你的朋友打开了3号门,你改变选择,则你依旧得到奖品。当奖品在3号门后的时候(概率为 1 3 \frac {1}{3} 31),你的朋友打开了2号门,你不改变选择,则你失去了奖品,综述,你获奖的概率是 2 3 \frac {2}{3} 32,和策略(b)一样。
第二种情况是:假定奖品在1号门后,你的朋友随机打开2号门或3号门(概率各为 1 2 \frac {1}{2} 21),此时你获奖的概率是 1 6 \frac {1}{6} 61.如果奖品在2号门后(概率为 1 3 \frac {1}{3} 31),你的朋友打开3号门,你不改变选择,你赢得奖品。综述,你获奖的概率是 1 6 + 1 3 = 1 2 \frac {1}{6}+\frac {1}{3}=\frac {1}{2} 61+31=21,此时策略(c)比策略(b)差。
综上所述:当然是改变选择。
此题在电影《决胜21点》出现过,截图如下:
概率导论(一)——样本空间与概率_第6张图片

全概率定理和贝叶斯准则

  • 全概率定理:
    A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An是一组互不相容的事件,形成样本空间的一个分割(每一个试验结果必定使得其中一个事件发生).又假定对每一个 i i i P ( A i ) > 0 P(A_i)>0 P(Ai)>0.则对于任何事件 B B B,下列公式成立 P ( B ) = P ( A 1 ∩ B ) + ⋯ + P ( A n ∩ B ) = P ( A 1 ) P ( B ∣ A 1 ) + ⋯ + P ( A n ) P ( B ∣ A n ) . P(B)=P(A_1 \cap B)+\cdots+P(A_n \cap B)=P(A_1)P(B|A_1)+\cdots+P(A_n)P(B|A_n). P(B)=P(A1B)++P(AnB)=P(A1)P(BA1)++P(An)P(BAn).
    概率导论(一)——样本空间与概率_第7张图片
    这条定理主要应用于计算事件 B B B的概率。直接计算事件 B B B的概率有点难度,但是若条件概率 P ( B ∣ A i ) P(B|A_i) P(BAi)是已知的或很容易推导计算时,全概率定理就成为计算 P ( B ) P(B) P(B)的有力工具。
    事件 B B B受到事件 A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An的约束。

例题:
爱丽丝在上一门概率课。在每周周末的时候,她可能跟上课程或跟不上课程。如果她在某一周是跟上课程的,那么她在下周跟上课程的概率为0.8(下周跟不上课程的概率为0.2)。然而,如果她在某一周没有跟上课程,那么她在下周跟上课程的概率为0.4(下周跟不上课程的概率为0.6)。现在假定,在第一周上课以前认为她是能跟上课程的。经过三周的学习,她能够跟上课程的概率有多大?
解:
U i U_i Ui B i B_i Bi分别表示经过 i i i周学习后跟上和跟不上课程的事件。
按照全概率定理, P ( U 3 ) P(U_3) P(U3)可由下式给出 P ( U 3 ) = P ( U 2 ) P ( U 3 ∣ U 2 ) + P ( B 2 ) P ( U 3 ∣ B 2 ) = P ( U 2 ) ⋅ 0.8 + P ( B 2 ) ⋅ 0.4 P(U_3)=P(U_2)P(U_3|U_2)+P(B_2)P(U_3|B_2)=P(U_2)\cdot 0.8+P(B_2)\cdot 0.4 P(U3)=P(U2)P(U3U2)+P(B2)P(U3B2)=P(U2)0.8+P(B2)0.4
对于 P ( U 2 ) P(U_2) P(U2) P ( B 2 ) P(B_2) P(B2),又可以利用全概率定理 P ( U 2 ) = P ( U 1 ) P ( U 2 ∣ U 1 ) + P ( B 1 ) P ( U 2 ∣ B 1 ) = P ( U 1 ) ⋅ 0.8 + P ( B 1 ) ⋅ 0.4 , P(U_2)=P(U_1)P(U_2|U_1)+P(B_1)P(U_2|B_1)=P(U_1)\cdot 0.8+P(B_1)\cdot 0.4, P(U2)=P(U1)P(U2U1)+P(B1)P(U2B1)=P(U1)0.8+P(B1)0.4, P ( B 2 ) = P ( U 1 ) P ( B 2 ∣ U 1 ) + P ( B 1 ) P ( B 2 ∣ B 1 ) = P ( U 1 ) ⋅ 0.2 + P ( B 1 ) ⋅ 0.6 P(B_2)=P(U_1)P(B_2|U_1)+P(B_1)P(B_2|B_1)=P(U_1)\cdot 0.2+P(B_1)\cdot 0.6 P(B2)=P(U1)P(B2U1)+P(B1)P(B2B1)=P(U1)0.2+P(B1)0.6
最后,由于爱丽丝在刚刚开始上课的时候是能够跟上课程的,我们有 P ( U 1 ) = 0.8 , P ( B 1 ) = 0.2 P(U_1)=0.8,P(B_1)=0.2 P(U1)=0.8,P(B1)=0.2
从前面三个方程式解得 P ( U 2 ) = 0.8 ⋅ 0.8 + 0.2 ⋅ 0.4 = 0.72 , P(U_2)=0.8\cdot 0.8+0.2 \cdot 0.4=0.72, P(U2)=0.80.8+0.20.4=0.72, P ( B 2 ) = 0.8 ⋅ 0.2 + 0.2 ⋅ 0.6 = 0.28 , P(B_2)=0.8 \cdot 0.2+0.2 \cdot 0.6=0.28, P(B2)=0.80.2+0.20.6=0.28,
再利用 P ( U 3 ) P(U_3) P(U3)的等式,得到 P ( U 3 ) = 0.72 ⋅ 0.8 + 0.28 ⋅ 0.4 = 0.688 P(U_3)=0.72\cdot 0.8+0.28\cdot 0.4=0.688 P(U3)=0.720.8+0.280.4=0.688
利用全概率公式得到递推式:(可以计算经过i周学习后) P ( U i + 1 ) = P ( U i ) ⋅ 0.8 + P ( B i ) ⋅ 0.4 , P(U_{i+1})=P(U_i)\cdot 0.8 + P(B_i)\cdot 0.4, P(Ui+1)=P(Ui)0.8+P(Bi)0.4, P ( B i + 1 ) = P ( U i ) ⋅ 0.2 + P ( B i ) ⋅ 0.6 P(B_{i+1})=P(U_i)\cdot 0.2+P(B_i)\cdot 0.6 P(Bi+1)=P(Ui)0.2+P(Bi)0.6

  • 贝叶斯准则:
    A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An是一组互不相容的事件,形成样本空间的一个分割(每一个试验结果必定使得其中一个事件发生).又假定对每一个 i i i P ( A i ) > 0 P(A_i)>0 P(Ai)>0.则对于任何事件 B B B,只要它满足 P ( B ) > 0 P(B)>0 P(B)>0,下列公式成立 P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i ) P ( B ) = P ( A i ) P ( B ∣ A i ) P ( A 1 ) P ( B ∣ A 1 ) + ⋯ + P ( A n ) P ( B ∣ A n ) P(A_i|B)=\frac {P(A_i)P(B|A_i)}{P(B)}=\frac {P(A_i)P(B|A_i)}{P(A_1)P(B|A_1)+\cdots+P(A_n)P(B|A_n)} P(AiB)=P(B)P(Ai)P(BAi)=P(A1)P(BA1)++P(An)P(BAn)P(Ai)P(BAi)
  • 贝叶斯准则进行因果推理(已知结果,求原因)
    • 当观察到结果 B B B的时候,我们希望反推结果 B B B是由原因 A i A_i Ai造成的概率 P ( A i ∣ B ) . P(A_i|B). P(AiB).
    • P ( A i ∣ B ) P(A_i|B) P(AiB)为由于代表新近得到的信息 B B B之后 A i A_i Ai出现的概率,称之为后验概率
    • P ( A i ) P(A_i) P(Ai)称之为先验概率

例题:(假阳性之谜)
设对于某种少见的疾病的检出率为0.95:
如果一个被检查的人有这种疾病,其检查结果为阳性的概率为0.95;如果该人没有这种疾病,其检查结果为阴性的概率为0.95.
现在假定某一人群中患有这种病的概率为0.001,并从这个总体中随机抽取一个人检测,检测结果为阳性。
现在问这个人患这种病的概率有多大?
解:
A A A为这个人有这种疾病, B B B为经检验这个人为阳性。
利用贝叶斯准则 P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( A ) P ( B ∣ A ) + P ( A c ) P ( B ∣ A c ) = 0.001 ⋅ 0.95 0.001 ⋅ 0.95 + 0.999 ⋅ 0.05 ≈ 0.0187 P(A|B)=\frac {P(A)P(B|A)}{P(A)P(B|A)+P(A^c)P(B|A^c)}=\frac {0.001 \cdot 0.95}{0.001 \cdot 0.95+0.999 \cdot 0.05}\approx 0.0187 P(AB)=P(A)P(BA)+P(Ac)P(BAc)P(A)P(BA)=0.0010.95+0.9990.050.0010.950.0187
一个检测为阳性的人,患病的概率竟然小于2%!

独立性

  • A A A独立于 B B B蕴含着 B B B独立于 A A A,称 A A A B B B是相互独立的,或 A A A B B B相互独立的事件
  • 根据公式 P ( A ∩ B ) = P ( A ) P ( B ) P(A\cap B)=P(A)P(B) P(AB)=P(A)P(B)来判断 A A A B B B是否相互独立。

例题:
考虑连续两次抛掷一个具有4个面的对称的骰子,假定16种可能的试验结果是等概率的,每个试验结果的概率为 1 16 \frac {1}{16} 161.
问事件 A i = { 第 一 次 抛 掷 后 得 i } , B j = { 第 二 次 抛 掷 后 得 j } A_i=\lbrace{第一次抛掷后得i}\rbrace,B_j=\lbrace{第二次抛掷后得j}\rbrace Ai={ i}Bj={ j}是否相互独立?
解:
P ( A i ∩ A j ) = P ( 两 次 抛 掷 的 结 果 是 ( i , j ) ) = 1 16 , P(A_i \cap A_j)=P(两次抛掷的结果是(i,j))=\frac {1}{16}, P(AiAj)=P((i,j))=161,
P ( A i ) = A i 中 的 试 验 结 果 数 总 的 试 验 结 果 数 = 4 16 , P(A_i)=\frac {A_i中的试验结果数}{总的试验结果数}=\frac {4}{16}, P(Ai)=Ai=164,
P ( B j ) = B j 中 的 试 验 结 果 数 总 的 试 验 结 果 数 = 4 16 . P(B_j)=\frac {B_j中的试验结果数}{总的试验结果数}=\frac {4}{16}. P(Bj)=Bj=164.
由于 P ( A i ∩ A j ) = P ( A i ) P ( B j ) P(A_i \cap A_j)=P(A_i)P(B_j) P(AiAj)=P(Ai)P(Bj),可知 A i A_i Ai B i B_i Bi是相互独立的。

条件独立

  • 特别地,在给定 C C C之下,若事件 A A A和事件 B B B满足 P ( A ∩ B ∣ C ) = P ( A ∣ C ) P ( B ∣ C ) , P(A\cap B|C)=P(A|C)P(B|C), P(ABC)=P(AC)P(BC),则称 A A A B B B在给定 C C C之下条件独立
  • 利用条件概率定义和乘法规则,得到 P ( A ∩ B ∣ C ) = P ( A ∩ B ∩ C ) P ( C ) = P ( C ) P ( B ∣ C ) P ( A ∣ B ∩ C ) P ( C ) = P ( B ∣ C ) P ( A ∣ B ∩ C ) . P(A \cap B|C)=\frac {P(A \cap B \cap C)}{P(C)}=\frac {P(C)P(B|C)P(A|B \cap C)}{P(C)}=P(B|C)P(A|B \cap C). P(ABC)=P(C)P(ABC)=P(C)P(C)P(BC)P(ABC)=P(BC)P(ABC).
  • 根据上面两式,只要 P ( B ∣ C ) ≠ 0 P(B|C)≠0 P(BC)=0,那么 P ( A ∣ B ∩ C ) = P ( A ∣ C ) . P(A|B \cap C)=P(A|C). P(ABC)=P(AC).

考虑抛掷两枚均匀的硬币。这个试验的4种可能结果都是等可能的,令
H 1 = { 第 一 枚 硬 币 正 面 向 上 } H_1=\lbrace{第一枚硬币正面向上}\rbrace H1={ }
H 2 = { 第 二 枚 硬 币 正 面 向 上 } H_2=\lbrace{第二枚硬币正面向上}\rbrace H2={ }
D = { 两 枚 硬 币 的 试 验 结 果 不 同 } D=\lbrace{两枚硬币的试验结果不同}\rbrace D={ }
事件 H 1 H_1 H1和事件 H 2 H_2 H2是相互独立的,但是
P ( H 1 ∣ D ) = 1 2 , P ( H 2 ∣ D ) = 1 2 , P ( H 1 ∩ H 2 ∣ D ) = 0 , P(H_1|D)=\frac {1}{2},P(H_2|D)=\frac {1}{2},P(H_1 \cap H_2|D)=0, P(H1D)=21,P(H2D)=21,P(H1H2D)=0,
这样, P ( H 1 ∩ H 2 ∣ D ) ≠ P ( H 1 ∣ D ) P ( H 2 ∣ D ) P(H_1 \cap H_2|D)≠P(H_1|D)P(H_2|D) P(H1H2D)=P(H1D)P(H2D),从而 H 1 H_1 H1 H 2 H_2 H2并不条件独立

  • 对于任何概率模型,记 A A A B B B是相互独立的事件, C C C是一个满足条件 P ( C ) > 0 , P ( A ∣ C ) > 0 , P ( B ∣ C ) > 0 P(C)>0,P(A|C)>0,P(B|C)>0 P(C)>0,P(AC)>0,P(BC)>0的事件,并且 A ∩ B ∩ C A \cap B \cap C ABC为空集。这样,由于 P ( A ∩ B ∣ C ) = 0 P(A \cap B|C)=0 P(ABC)=0 P ( A ∣ C ) P ( B ∣ C ) > 0 P(A|C)P(B|C)>0 P(AC)P(BC)>0 A A A B B B不可能条件独立。
  • 独立性总结:
    • 两个事件 A A A B B B,如果它们满足 P ( A ∩ B ) = P ( A ) P ( B ) , P(A \cap B)=P(A)P(B), P(AB)=P(A)P(B),则事件 A A A B B B相互独立。
      B B B还满足 P ( B ) > 0 P(B)>0 P(B)>0,则独立性等价于 P ( A ∣ B ) = P ( A ) . P(A|B)=P(A). P(AB)=P(A).
    • 若事件 A A A B B B相互独立,则事件 A A A B c B^c Bc也相互独立。
    • 设事件 C C C满足 P ( C ) > 0 P(C)>0 P(C)>0,两个事件 A A A B B B如果满足 P ( A ∩ B ∣ C ) = P ( A ∣ C ) P ( B ∣ C ) . P(A \cap B|C)=P(A|C)P(B|C). P(ABC)=P(AC)P(BC). A A A B B B称为在给定 C C C的条件下条件独立。
      若进一步假定 P ( B ∩ C ) > 0 P(B \cap C)>0 P(BC)>0,则 A A A B B B在给定 C C C的条件下的条件独立性与下面的条件是等价的。 P ( A ∣ B ∩ C ) = P ( A ∣ C ) . P(A|B \cap C)=P(A|C). P(ABC)=P(AC).
    • 独立性并不蕴含条件独立性,反之亦然。

一组事件的独立性

  • 几个事件的相互独立性的定义:
    A 1 , ⋯   , A n A_1,\cdots,A_n A1,,An n n n个事件。若它们满足 P ( ⋂ i ∈ S A i ) = ∏ i ∈ S P ( A i ) 对 { 1 , 2 , ⋯   , n } 的 任 意 子 集 S 成 立 . P\bigg(\bigcap_{i \in S}A_i\bigg)=\prod_{i \in S}P(A_i)对\lbrace{1,2,\cdots,n}\rbrace的任意子集S成立. P(iSAi)=iSP(Ai){ 1,2,,n}S.则称 A 1 , ⋯   , A n A_1,\cdots,A_n A1,,An为相互独立的事件。
  • 事件 A 1 , A 2 , A 3 A_1,A_2,A_3 A1,A2,A3,独立性条件归结为下列4个条件:
    P ( A 1 ∩ A 2 ) = P ( A 1 ) P ( A 2 ) , P(A_1 \cap A_2)=P(A_1)P(A_2), P(A1A2)=P(A1)P(A2), P ( A 1 ∩ A 3 ) = P ( A 1 ) P ( A 3 ) , P(A_1 \cap A_3)=P(A_1)P(A_3), P(A1A3)=P(A1)P(A3), P ( A 2 ∩ A 3 ) = P ( A 2 ) P ( A 3 ) , P(A_2 \cap A_3)=P(A_2)P(A_3), P(A2A3)=P(A2)P(A3), P ( A 1 ∩ A 2 ∩ A 3 ) = P ( A 1 ) P ( A 2 ) P ( A 3 ) . P(A_1 \cap A_2 \cap A_3)=P(A_1)P(A_2)P(A_3). P(A1A2A3)=P(A1)P(A2)P(A3).前三个式子说明两两独立,四个式子一起说明互相独立

可靠性

  • 在由多个元件组成的一个复杂系统中,通常假定各个元件的表现是相互独立的。

独立试验和二项概率

  • 设试验由一系列独立且相同的小试验组成,称这种试验为独立试验序列
  • 当每个阶段的小试验只有两种可能结果的时候,就称为独立的伯努利(Bernoulli)试验序列。
  • 二项概率:
    p ( k ) = { n 次 抛 掷 中 有 k 次 出 现 正 面 } p(k)=\lbrace{n次抛掷中有k次出现正面}\rbrace p(k)={ nk},则 p ( k ) = ( n k ) p k ( 1 − p ) n − k p(k)=\binom{n}{k}p^k(1-p)^{n-k} p(k)=(kn)pk(1p)nk其中记号 ( n k ) = n 次 抛 硬 币 的 试 验 中 出 现 k 次 正 面 的 试 验 结 果 数 。 \binom{n}{k}=n次抛硬币的试验中出现k次正面的试验结果数。 (kn)=nk
    ( n k ) \binom{n}{k} (kn)二项式系数,称为 n n n k k k的组合数, p ( k ) p(k) p(k)二项概率
    ( n k ) = n ! k ! ( n − k ) ! , k = 0 , 1 , ⋯   , n , i ! = 1 ⋅ 2 ⋯ ( i − 1 ) ⋅ i , 记 0 ! = 1. \binom{n}{k}=\frac {n!}{k!(n-k)!},k=0,1,\cdots,n,i!=1\cdot 2\cdots (i-1)\cdot i,记0!=1. (kn)=k!(nk)!n!,k=0,1,,n,i!=12(i1)i,0!=1.
  • 由于二项式概率的总和必须为 1 1 1,因此得到二项式公式 ∑ k = 1 n ( n k ) p k ( 1 − p ) n − k = 1. \sum_{k=1}^{n}\binom{n}{k}p^k(1-p)^{n-k}=1. k=1n(kn)pk(1p)nk=1.
  • ( n k ) \binom{n}{k} (kn) C n k C_n^k Cnk的意思一样,但是写法要注意,上下是相反的。

计数法

计数准则

  • 计数准则:
    考虑由 r r r个阶段组成的一个试验,假设:
    (a)在第1个阶段有 n 1 n_1 n1个可能的结果;
    (b)对于第1个阶段的任何一个结果,在第2个阶段有 n 2 n_2 n2个可能的结果;
    (c)一般地,在前 r − 1 r-1 r1个阶段的任何一个结果,在接下来的第 r r r个阶段有 n r n_r nr个结果,则在 r r r个阶段的试验中一共有 n 1 n 2 ⋯ n r n_1n_2\cdots n_r n1n2nr个试验结果,

n n n k k k排列

  • 假定 n n n个不同的对象组成一个集合,令 k k k是一个正整数, k ≤ n k≤n kn。从 n n n个对象中顺序的选出 k k k个对象,或 k k k个不同对象的序列数。 n ( n − 1 ) ⋯ ( n − k + 1 ) = n ( n − 1 ) ⋯ ( n − k + 1 ) ( n − k ) ⋯ 2 ⋅ 1 ( n − k ) ⋯ 2 ⋅ 1 = n ! ( n − k ) ! n(n-1)\cdots(n-k+1)=\frac {n(n-1)\cdots(n-k+1)(n-k)\cdots 2 \cdot 1}{(n-k)\cdots 2 \cdot 1}=\frac {n!}{(n-k)!} n(n1)(nk+1)=(nk)21n(n1)(nk+1)(nk)21=(nk)!n!这些序列称为 n n n k k k排列,当 k = n k=n k=n时,简称排列,此时所有可能的序列数为 n ( n − 1 ) ⋯ 2 ⋅ 1 = n ! . n(n-1)\cdots2 \cdot 1=n!. n(n1)21=n!.

组合

  • n n n个元素集合中选 k k k个元素的组合数为 ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k}=\frac {n!}{k!(n-k)!} (kn)=k!(nk)!n!

分割

  • 给定一个元素个数为 n n n的集合,并设 n 1 , n 2 , ⋯   , n r n_1,n_2,\cdots,n_r n1,n2,,nr为非负整数, n 1 + n 2 + ⋯ + n r = n n_1+n_2+\cdots+n_r=n n1+n2++nr=n,现在考虑,将 n n n个元素的集合分解成 r r r个不相交的子集,使得第 i i i个子集元素个数刚好是 n i n_i ni,问一共有多少种分解的方法。
  • 现在分阶段,每次确定一个子集,一共有 ( n n 1 ) \binom{n}{n_1} (n1n)种方法确定第一个子集, ( n − n 1 n 2 ) \binom{n-n_1}{n_2} (n2nn1)种方法确定第二个子集,以此类推,对于 r r r个阶段的选择,利用乘法准则,得到总共的选择方法数目为 ( n n 1 ) ( n − n 1 n 2 ) ( n − n 1 − n 2 n 3 ) ⋯ ( n − n 1 − ⋯ n r − 1 n r ) \binom{n}{n_1}\binom{n-n_1}{n_2}\binom{n-n_1-n_2}{n_3}\cdots \binom{n-n_1-\cdots n_{r-1}}{n_r} (n1n)(n2nn1)(n3nn1n2)(nrnn1nr1)上式等于 n ! n 1 ! ( n − n 1 ) ! ⋅ ( n − n 1 ) ! n 2 ! ( n − n 1 − n 2 ) ! ⋯ ( n − n 1 − ⋯ n r − 1 ) ! n r ! ( n − n 1 − ⋯ n r ) ! \frac {n!}{n_1!(n-n_1)!}\cdot \frac {(n-n_1)!}{n_2!(n-n_1-n_2)!}\cdots \frac{(n-n_1-\cdots n_{r-1})!}{n_r!(n-n_1-\cdots n_r)!} n1!(nn1)!n!n2!(nn1n2)!(nn1)!nr!(nn1nr)!(nn1nr1)!化简得 n ! n 1 ! n 2 ! ⋯ n r ! \frac {n!}{n_1!n_2!\cdots n_r!} n1!n2!nr!n!这个数称为多项式系数,并用下列记号表示: ( n n 1 , n 2 , ⋯   , n r ) \binom{n}{n_1,n_2,\cdots,n_r} (n1,n2,,nrn)
  • 计数法汇总:
    • n n n个对象的排列数 n ! n! n!;
    • n n n个对象中取 k k k个对象的排列数 n ! ( n − k ) ! \frac {n!}{(n-k)!} (nk)!n!;
    • n n n个对象中取 k k k个对象的组合数 ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k}=\frac {n!}{k!(n-k)!} (kn)=k!(nk)!n!;
    • n n n个对象分成 r r r个组的分割数,其中第 i i i个组具有 n i n_i ni个对象: ( n k ) = n ! n 1 n 2 ! ⋯ n r ! \binom{n}{k}=\frac {n!}{n_1n_2!\cdots n_r!} (kn)=n1n2!nr!n!

小结

  • 解决一个概率问题通常分成下列几个步骤:
    • (1)描述样本空间,样本空间是一个试验的所有可能的试验结果的集合;
    • (2)(可能不直接地)列出概率律(每个事件的概率);
    • (3)计算各种事件的概率和条件概率。
  • 计算概率的三种方法:
    • 计数法
    • 序贯树形图方法
    • 全概率公式

你可能感兴趣的:(《概率导论》学习笔记,概率论)