概率论与数理统计(一)

本文主要讲了什么是事件,事件与概率的关系,事件常见的分类,事件的基本关系及运算,什么是条件概率以及由条件概率引出的事件独立性,由事件独立性引出来的概率0乘法定理,概率的三条公理。

文章目录

      • 事件与概率
      • 概率的三条公理
      • 事件的关系与运算
      • 条件概率与事件的独立性

事件与概率

当我们讲概率呢,我们得首先明确概率的对象,即什么东西拥有概率,纵观各种概率论教科书,第一章都是先从事件讲起,比如“明天下雨”这一事件发生的概率是多少呀?即概率描述的对象一般都是事件。
在概率论中,什么是事件呢?事件就是对某种情况的描述,比如我可以这样描述明天的天气:明天会下雨,明天会出太阳,明天会刮风等等。
我们可以这样对事件进行分类,如果某一事件可能发生也可能不发生,那么我们可以称它为随机事件,如掷骰子得到1点;如果某一事件一定会发生,那么我们称之为必然事件,如掷骰子得到不超过6的点数;如果某一事件不可能发生,那么我们称之为不可能事件,如掷骰子得到7点。
我们还可以这样根据事件的结果将事件分为基本事件和非基本事件,基本事件就是具有单一的实验结果,如掷骰子得到1点;我们可以把若干基本事件合在一起得到一个新的事件,如掷骰子得到的点数不超过3,该事件包含三种结果,掷骰子的点数分别为1,2,3。
通过对事件的概率认识,我们对概率论有了一个基本的了解。

概率的三条公理

那么我们接下来引入概率的三个公理:
首先我们引进一个抽象的集合 Ω \Omega Ω,其元素 ω \omega ω称为基本事件。我们考虑由 Ω \Omega Ω的子集构成一个集合 F \mathcal{F} F,那么 F \mathcal{F} F的一个元素就是一个事件,每个事件都有一个概率,换句话说,概率是事件的函数。我们引入一个定义在 F \mathcal{F} F上的函数 P P P,对 F \mathcal{F} F中的任一成员 A A A P ( A ) P(A) P(A)的值理解为事件 A A A的概率。
公理一: 0 ≤ P ( A ) ≤ 1 0 \le P(A)\le1 0P(A)1
公理二: P ( Ω ) = 1 , P ( ∅ ) = 0 P(\Omega) = 1,P(\empty)=0 P(Ω)=1P()=0
公理三: 加法公理,若干个互斥事件之和的概率等于各个事件概率的和,即 P ( A 1 + A 2 + … ) = P ( A 1 ) + P ( A 2 ) + P ( A 3 ) + … P(A_1+A_2+\ldots)=P(A_1)+P(A_2)+P(A_3)+\ldots P(A1+A2+)=P(A1)+P(A2)+P(A3)+
第一条公理很好理解,即每个事件的概率不大于1,不小于0。第二条公理即必然事件概率为1,不可能事件概率为0。第三条公理特别关键。
古典概率和几何概率就不讲了,没什么必要。

事件的关系与运算

对数字进行运算特别简单,如常见的加减乘除。对事件如何进行运算呢?只要理清了事件的特质,那么对事件进行运算也就很简单了。

常见事件的关系如下:

  1. 包含关系:若A发生则B必发生,可以说B包含A。
  2. 相等关系:若A与B的由相同的实验结果构成,则A与B相等。
  3. 互斥关系:若A与B不可能同时发生,则A与B互斥。
  4. 对立关系:若B={A不发生},则称A与B为对立关系。

因为事件也是在一个集合中的,所以事件的运算就是集合中的运算,如集合的并交补差。

事件的运算:

  • 事件的和(并):A+B=C,则C={A发生或B发生}
  • 事件的积(交):AB=C,则C={AB都发生}
  • 事件的差:A-B=C,则C={A发生但B不发生}

条件概率与事件的独立性

定义1: 设有两个事件A,B,且 P ( B ) ≠ 0 P(B) \neq 0 P(B)=0,则“在给定B发生的条件下A的条件概率”,记为 P ( A ∣ B ) P(A|B) P(AB),定义为:
P ( A ∣ B ) = P ( A B ) / P ( B ) ( 1 ) P(A|B)=P(AB)/P(B) \quad\quad(1) P(AB)=P(AB)/P(B)1
关于条件概率的理解可以自己在古典概率的情况下思考,不是很难理解。

定义了条件概率之后,我们可以使用条件概率来描述事件的独立性。什么是事件的独立性呢?直观上看,若A的无条件概率 P ( A ) P(A) P(A)与给定B下A的条件概率 P ( A ∣ B ) P(A|B) P(AB)有差别,那么我们可以认为在给定B之后,A的概率发生了变化,即A与B有一定的关联,即A与B不独立。

定义2: P ( A ∣ B ) = P ( A ) P(A|B)=P(A) P(AB)=P(A),则 A 与 B A\text{与}B AB独立。将 P ( A ∣ B ) P(A|B) P(AB)展开,得到
P ( A B ) = P ( A ) P ( B ) ( 2 ) P(AB)=P(A)P(B) \quad\quad(2) P(AB)=P(A)P(B)(2)

通过独立性我们就得到了概率的乘法定理
定理1: 若两个事件A,B独立,则A,B的积AB的概率 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)

在实际的应用中,我们一般不会使用(2)式来判断两个事件是否独立,一般是已知两个事件独立,使用(2)式去计算概率。

在数学中,我们知道了2,通常要知道3,4,5,以及无穷。这句话的意思就是我们要学会推广,即我们可以推广乘法定理到多个独立事件中去。

多个事件独立的定义
定义3: A 1 , A 2 , … A_1, A_2, \ldots A1,A2,为有限或无限个事件,如果从中任取有限个事件,都成立
P ( A i 1 , A i 2 , A i 3 , … , A i m ) = P ( A i 1 ) ∗ P ( A i 2 ) ∗ … P ( A i m ) P(A_{i_1},A_{i_2},A_{i_3},\ldots,A_{i_m} ) = P(A_{i_1})*P(A_{i_2})*\ldots P(A_{i_m}) P(Ai1,Ai2,Ai3,,Aim)=P(Ai1)P(Ai2)P(Aim)
则称事件 A 1 , A 2 , … A_1,A_2,\ldots A1,A2,相互独立。

注意:相互独立与两两独立不同,两两独立不可以推出相互独立,相互独立可以推出两两独立。

你可能感兴趣的:(数学,机器学习)