第一章从事件的角度引出样本空间、事件、概率的基本定义,并且介绍条件概率、独立性,贝叶斯公式的事件形式
样本(sample):某次试验的可能结果(outcome)
样本空间(sample space):所有样本的可能结果
事件(event):样本空间的一个 子集
注意条件三,他给了我们 在事件独立时求和概率的一个公式
P ( E ∣ F ) = P ( E F ) P ( F ) \mathrm{P}(E \mid F)=\frac{\mathrm{P}(E F)}{\mathrm{P}(F)} P(E∣F)=P(F)P(EF)
这反过来也成立
注意:两两独立不一定联合独立
例 1.10 (不独立的两两独立事件) 假定从装有号码分别为 1 , 2 , 3 , 4 1,2,3,4 1,2,3,4 的 4 个球的瓮中 抽取一个球. 设 E = { 1 , 2 } , F = { 1 , 3 } , G = { 1 , 4 } E=\{1,2\}, F=\{1,3\}, G=\{1,4\} E={1,2},F={1,3},G={1,4}. 如果所有 4 个结果都是等可能 的, 那么
P ( E F ) = P ( E ) P ( F ) = 1 4 P ( E G ) = P ( E ) P ( G ) = 1 4 P ( F G ) = P ( F ) P ( G ) = 1 4 \begin{aligned} & \mathrm{P}(E F)=\mathrm{P}(E) \mathrm{P}(F)=\frac{1}{4} \\ & \mathrm{P}(E G)=\mathrm{P}(E) \mathrm{P}(G)=\frac{1}{4} \\ & \mathrm{P}(F G)=\mathrm{P}(F) \mathrm{P}(G)=\frac{1}{4} \end{aligned} P(EF)=P(E)P(F)=41P(EG)=P(E)P(G)=41P(FG)=P(F)P(G)=41
然而
1 4 = P ( E F G ) ≠ P ( E ) P ( F ) P ( G ) \frac{1}{4}=\mathrm{P}(E F G) \neq \mathrm{P}(E) \mathrm{P}(F) \mathrm{P}(G) 41=P(EFG)=P(E)P(F)P(G)
因此, 即使事件 E , F , G E, F, G E,F,G 是两两独立的, 它们并非是联合独立的.
概率定义:若事件互不相容则
P ( ⋃ n = 1 ∞ E n ) = ∑ n = 1 ∞ P ( E n ) \mathrm{P}\left(\bigcup_{n=1}^{\infty} E_n\right)=\sum_{n=1}^{\infty} \mathrm{P}\left(E_n\right) P(n=1⋃∞En)=n=1∑∞P(En)
容斥恒等式:容斥恒等式说明了事件的和可以从每个事件的概率和每个事件的交集求得
P ( E 1 ∪ E 2 ∪ ⋯ ∪ E n ) = ∑ i P ( E i ) − ∑ i < j P ( E i E j ) + ∑ i < j < k P ( E i E j E k ) − ∑ i < j < k < l P ( E i E j E k E l ) + ⋯ + ( − 1 ) n + 1 P ( E 1 E 2 ⋯ E n ) \begin{aligned} \mathrm{P}\left(E_1 \cup E_2 \cup \cdots \cup E_n\right)= & \sum_i \mathrm{P}\left(E_i\right)-\sum_{i
条件概率公式
P ( E ∣ F ) = P ( E F ) P ( F ) \mathrm{P}(E \mid F)=\frac{\mathrm{P}(E F)}{\mathrm{P}(F)} P(E∣F)=P(F)P(EF)
这个式子在许多领域都有很多应用,例如机器学习时,如果样本为 i.i.d 即独立同分布的,从总体中抽取n个样本作为数据集 X X X 的概率即为
P ( X ) = ∏ i = 1 n P ( x i ) \mathrm{P}(X)=\prod_{i=1}^n \mathrm{P}\left(x_i\right) P(X)=i=1∏nP(xi)
有 r r r 个参赛人, 其中参赛人 i ( i = 1 , ⋯ , r ) i(i=1, \cdots, r) i(i=1,⋯,r) 在开始时有 n i ( n i > 0 ) n_i\left(n_i>0\right) ni(ni>0) 个 单位 (财富). 在每一阶段参赛人中的两个被选中比赛, 赢者从输者那里得到一个 单位. 任何参赛人, 当他的财富减少到 0 时就退出, 如此继续, 直至某个参赛人占 有所有的 n = ∑ i = 1 r n i n=\sum_{i=1}^r n_i n=∑i=1rni 个单位为止, 此参赛人就是胜利者. 假定相继比赛的结果 是独立的, 而且在每次比赛中两个参赛人等可能地获胜, 求参赛人 i i i 是胜利者的 概率.
解:
知识点 | 题目 | 3. |
---|---|---|
样本空间与事件 | 1,2,3,4,5,6,7,8 | |
使用R,G,B表示取出的星红、绿、蓝 球,样本空间为:
S = { ( R , R ) , ( R , G ) , ( R , B ) , ( G , G ) , ( G , B ) , ( G , R ) , ( B , B ) ( B , G ) , ( B , R ) } S={\{(R, R),(R, G),(R, B),(G, G),(G, B),(G, R),(B, B)(B, G),(B,R)\}} S={(R,R),(R,G),(R,B),(G,G),(G,B),(G,R),(B,B)(B,G),(B,R)}
所有样本等概, 故样本空间每一个点的概率为 1 9 \frac{1}{9} 91
∗ { }^* ∗ 2. 在取第二个弹球前不放回第一个弹球时, 重做习题 1.
抛掷一枚硬币直至正面接连地出现两次. 此试验的样本空间是什么? 如果硬币是均匀的, 问 抛掷次数恰为 4 的概率是多少?
设 E , F , G E, F, G E,F,G 是三个事件. 求 E , F , G E, F, G E,F,G 的下列事件的表达式.
(a) 只有 F F F 发生.
(b) E , F E, F E,F 都发生, 但是 G G G 不发生.
© 至少一个事件发生.
(d) 至少两个事件发生.
(e) 三个事件都发生.
(f) 三个事件都没有发生.
(g) 至多一个事件发生.
(h) 至多两个事件发生.
*5. 一个人在拉斯维加斯使用下面的赌博方法, 他下注 1 美元于轮盘赌的红色. 如果他歆了, 他 就离开. 如果他输了, 他再赌一次红色并下注 2 美元. 然后不管什么结果, 他都离开. 假定 他每次下注赢的概率都是 1 / 2 1 / 2 1/2. 他回家时是樂家的概率是多少? 为什么这一赌博方法并未 被每个人采用?
5. 证明 E ( F ∪ G ) = E F ∪ E G E(F \cup G)=E F \cup E G E(F∪G)=EF∪EG.
6. 证明 ( E ∪ F ) c = E c F c (E \cup F)^{\mathrm{c}}=E^{\mathrm{c}} F^{\mathrm{c}} (E∪F)c=EcFc.
7. 若 P ( E ) = 0.9 \mathrm{P}(E)=0.9 P(E)=0.9 且 P ( F ) = 0.8 \mathrm{P}(F)=0.8 P(F)=0.8, 证明 P ( E F ) ⩾ 0.7 \mathrm{P}(E F) \geqslant 0.7 P(EF)⩾0.7. 一般地, 证明
P ( E F ) ⩾ P ( E ) + P ( F ) − 1 \mathrm{P}(E F) \geqslant \mathrm{P}(E)+\mathrm{P}(F)-1 P(EF)⩾P(E)+P(F)−1
这称为邦费罗尼不等式(Bonferroui’s inequality).
∗ { }^* ∗ 9. 如果 E E E 中的每个点都在 F F F 中, 我们就说 E ⊂ F E \subset F E⊂F. 证明:若 E ⊂ F E \subset F E⊂F, 则
P ( F ) = P ( E ) + P ( F E c ) ⩾ P ( E ) \mathrm{P}(F)=\mathrm{P}(E)+\mathrm{P}\left(F E^c\right) \geqslant \mathrm{P}(E) P(F)=P(E)+P(FEc)⩾P(E)