叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布

国立台湾大学叶丙成《机率》课程学习-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布

    • 4.1 随机变量
        • 4.1.1 随机变量(random variable,R.V.)定义
        • 4.1.2 随机变量的本质
        • 4.1.3 随机变量的种类
        • 4.1.4 随机变量的函数
    • 4.2 累积分布函数(cumulative distribution function,CDF)
        • 4.2.1 何谓CDF?
        • 4.2.2 CDF用处?
        • 4.2.3 CDF的性质
    • 4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)
        • 4.3.1 什么是PMF
        • 4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)
    • 4.4 离散概率分布(discrete probability distributions)
        • 4.4.1 Bernoulli概率分布(伯努利分布)
        • 4.4.2 Binomial概率分布(二项分布)
        • 4.4.3 Uniform概率分布(均匀分布)
        • 4.4.4 学这些概率分布有什么用

视频地址1(需科学上网,有需要可以留言要云分享)
视频地址2-B站

4.1 随机变量

4.1.1 随机变量(random variable,R.V.)定义

随机变量(random variable,R.V.)定义:是一个用来把实验结果(outcome)数字化的表示方式。
存在的意义:可以让概率的推导更数学,更简明
:随机变数通常使用大写英文字母表示

4.1.2 随机变量的本质

随机变量的本质?函数
随机变量其实是一个函数,给 X X X一个outcome,就返回一个对应的数字。数学上的表示法: X : S → ℜ X:S\to \Re X:S(映射)

4.1.3 随机变量的种类

  1. 离散随机变量(Discrete R.V.)
    EX1:店员的微笑: X ( 笑 ) = 1 , X ( 不 笑 ) = 0 ⇒ X = 0 , X = 1 X(笑)=1,X(不笑)=0\Rightarrow X=0,X=1 X()=1,X()=0X=0,X=1
    EX2:小美的三个司机: X ( 明 ) = 0 , X ( 华 ) = 1 , X ( 圆 ) = 2 ⇒ X = 0 , X = 1 , X = 2 X(明)=0,X(华)=1,X(圆)=2\Rightarrow X=0,X=1,X=2 X()=0,X()=1,X()=2X=0,X=1,X=2
    EX3:小明告白多少次才能成功: X ( 0 次 ) = 0 , X ( 1 次 ) = 1 , X ( 2 次 ) = 2 , ⋯ ⇒ X = 0 , X = 1 , X = 2 , … X(0次)=0,X(1次)=1,X(2次)=2,\dots\Rightarrow X=0,X=1,X=2,\dots X(0)=0,X(1)=1,X(2)=2,X=0,X=1,X=2,
    :离散随机变量并不代表只有有限多个case(可以是可数无穷多个)。
  2. 连续随机变量(continuous R.V)
    EX1:幸运之轮: X X X可以说 [ 0 , 1 ] [0,1] [0,1]之间的任意数字
    :连续随机变量的值是有无穷多个,而且是不可数的无穷多个。
  3. 什么是可数的,什么是不可数的?
    • 可数的:一个集合如果是可数的,这代表它包含的东西是可以一个个被数的,不管用什么方法数它里面的东西,它里面的任意一个东西,总是会被数到的。
      EX:正偶数集合 { 2 , 4 , 6 , 8 , 10 , …   } \{2, 4, 6, 8,10,\dots \} {2,4,6,8,10,}是可数的,从中随意取一个数字,总是可以数到的。
    • 不可数的:一个集合如果是不可数的,这代表它包含的东西是无法可以一个个被数的,不管用什么方法数它里面的东西,它里面一定有一样东西是你没数到的!
      EX:0到1之间的所有数字的集合是不可数的!
    • 扩展-无穷多的世界:
      - EX1:正整数的集合和正偶数的集合相比,哪个集合里面的东西比较多?答案是一样多,正整数的集合中的值乘2即可和正偶数集合产生一一对应关系。
      - EX1:“长度为1的线段上的点”与“边长为1的正方形平面上的点”,这两个集合,哪一个点的数量比较多?答案是一样多。
      - :在无穷多的世界里面,评价两个集合相等,不能使用“你中有我,我中有你”。而是使用是否可以找到一个方法(映射),使两个无穷集合可以找到一个一一对应关系,如果有,两无穷集合是相等的。

4.1.4 随机变量的函数

阿宅若看到店员微笑,就会点200的套餐。如果店员不笑,他就点15的饮料。请问阿宅的消费金额 W W W是随机变量嘛?
解:店员表情可以由随机变量 X X X代表: X ( 微 笑 ) = 0 , X ( 不 笑 ) = 15 X(微笑)=0,X(不笑)=15 X()=0,X()=15
W W W X X X的函数: W ( X ( 微 笑 ) ) = 200 , W ( X ( 不 笑 ) ) = 15 W(X(微笑))=200,W(X(不笑))=15 W(X())=200W(X())=15
所以 W W W也是喂outcome吐数字!因此, W W W也是一个随机变量!
注:随机变量的函数,也是个随机变量

4.2 累积分布函数(cumulative distribution function,CDF)

4.2.1 何谓CDF?

对任一个随机变量 X X X,我们定义其 C D F CDF CDF
F X ( x ) = def P ( X ≤ x ) F_X(x) \overset{\text{def}}{=} P(X \leq x) FX(x)=defP(Xx)
注:含等号
EX:幸运之轮
F X ( 0.5 ) = P ( x ≤ 0.5 ) = 1 2 F_X(0.5)=P(x\le 0.5)=\frac{1}{2} FX(0.5)=P(x0.5)=21

4.2.2 CDF用处?

  1. 最有用的用途
    计算 X X X落在某范围内的概率
    EX1:如图计算 P ( 3 < X ≤ 5 ) P(3<X\le5) P(3<X5)的概率
    叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第1张图片
    可以将其转化为两个 C D F CDF CDF相减,
    P ( 3 < X ≤ 5 ) = P ( X ≤ 5 ) − P ( X ≤ 3 ) P(3<X\le5)=P(X\le5)-P(X\le3) P(3<X5)=P(X5)P(X3)
    EX2:对比 P ( 3 < X ≤ 5 ) P(3<X\le5) P(3<X5) P ( 3 ≤ X ≤ 5 ) P(3\le X\le5) P(3X5)区别(差一个等号):
    P ( 3 ≤ X ≤ 5 ) = P ( X ≤ 5 ) − P ( X ≤ 3 ) + P ( X = a ) P(3\le X\le5)=P(X\le5)-P(X\le3) + P(X=a) P(3X5)=P(X5)P(X3)+P(X=a)
  2. 离散随机变量的 C D F CDF CDF长什么样?(阶梯状)
    EX: X X X为骰子的点数,故 P ( X = 1 ) = P ( X = 2 ) = P ( X = 3 ) = P ( X = 4 ) = P ( X = 5 ) = P ( X = 6 ) = 1 2 P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=\frac{1}{2} P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6)=21
    解: C D F : F X ( x ) = P ( X ≤ x ) CDF:F_X(x)=P(X\le x) CDF:FX(x)=P(Xx)
    • F X ( 0.3 ) = P ( X ≤ 0.3 ) = 0 F_X(0.3)=P(X\le 0.3)=0 FX(0.3)=P(X0.3)=0
    • F X ( 1 ) = P ( X ≤ 1 ) = P ( X ≤ 1.3 ) = 1 F_X(1)=P(X\le 1)=P(X\le 1.3)=1 FX(1)=P(X1)=P(X1.3)=1
    • F X ( 2.3 ) = P ( X ≤ 2.3 ) = P ( X ≤ 2.9 ) = 2 F_X(2.3)=P(X\le 2.3)=P(X\le 2.9)=2 FX(2.3)=P(X2.3)=P(X2.9)=2
      叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第2张图片
  3. 连续随机变量的 C D F CDF CDF长什么样?
    EX: X X X为幸运之轮所停下的数字, x ∈ [ 0 , 1 ) x \in [0,1) x[0,1),
    解: C D F : F X ( x ) = P ( X ≤ x ) CDF:F_X(x)=P(X\le x) CDF:FX(x)=P(Xx)
    • F X ( − 0.1 ) = P ( X ≤ − 0.1 ) = 0 F_X(-0.1)=P(X \le -0.1) = 0 FX(0.1)=P(X0.1)=0
    • F X ( 0.1 ) = P ( 0 ≤ X ≤ 0.1 ) = 0.1 F_X(0.1)=P(0 \le X \le 0.1) = 0.1 FX(0.1)=P(0X0.1)=0.1
    • F X ( 0.5 ) = P ( 0 ≤ X ≤ 0.5 ) = 0.5 F_X(0.5)=P(0 \le X \le 0.5) = 0.5 FX(0.5)=P(0X0.5)=0.5
    • F X ( 1 ) = P ( 0 ≤ X ≤ 1 ) = 1 F_X(1)=P(0 \le X \le 1) = 1 FX(1)=P(0X1)=1
    • F X ( 1.7 ) = P ( 0 ≤ X ≤ 1.7 ) = 1 F_X(1.7)=P(0 \le X \le 1.7) = 1 FX(1.7)=P(0X1.7)=1
    • P ( 0.3 < x ≤ 0.5 ) = F X ( 0.5 ) − F X ( 0.3 ) = 0.5 − 0.3 = 0.2 P(0.3< x \le 0.5) = F_X(0.5)-F_X(0.3)=0.5-0.3=0.2 P(0.3<x0.5)=FX(0.5)FX(0.3)=0.50.3=0.2
    • P ( 0.3 < x < 0.5 ) = F X ( 0. 5 − ) − F X ( 0.3 ) = 0.5 − 0.3 = 0.2 P(0.3< x < 0.5) = F_X(0.5^-)-F_X(0.3)=0.5-0.3=0.2 P(0.3<x<0.5)=FX(0.5)FX(0.3)=0.50.3=0.2
    • 0. 5 − 0.5^- 0.5表示无限接近 0.5 0.5 0.5的一个点

叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第3张图片

4.2.3 CDF的性质

  1. 离散随机变量之 C D F CDF CDF
    F X ( x + ) = F X ( x ) F_X(x^+)=F_X(x) FX(x+)=FX(x)
    F X ( x − ) = F X ( x ) − P ( X = x ) F_X(x^-)=F_X(x)-P(X=x) FX(x)=FX(x)P(X=x)
    注1: x + x^+ x+表示比 x x x大一点,但无限接近 x x x的一个值(参考《数学分析》极限定义中的 ϵ \epsilon ϵ)
    注2: x − x^- x表示比 x x x小一点,但无限接近 x x x的一个值
  2. 连续随机变量之 C D F CDF CDF
    F X ( x + ) = F X ( x ) = F X ( x − ) F_X(x^+)=F_X(x)=F_X(x^-) FX(x+)=FX(x)=FX(x)
  3. 共同性质
    F X ( − ∞ ) = P ( x ≤ − ∞ ) = 0 F_X(-\infty)=P(x\le-\infty)=0 FX()=P(x)=0
    F X ( + ∞ ) = P ( x ≤ + ∞ ) = 1 F_X(+\infty)=P(x\le+\infty)=1 FX(+)=P(x+)=1
    0 ≤ F X ( x ) ≤ 1 0 \le F_X(x)\le 1 0FX(x)1

4.3 概率质量函数(probability mass function,PMF)(离散随机变量特有)

4.3.1 什么是PMF

  1. 对任一个整数值的离散随机变量 X X X,我们定义其 P M F PMF PMF为函数:
    p X ( x ) = def P ( X = x ) p_X(x) \overset{\text{def}}{=} P(X = x) pX(x)=defP(X=x)
  2. EX: X X X为公平骰子之点数
    p X ( 3 ) = P ( X = 3 ) = 1 6 p_X(3)=P(X=3)=\frac{1}{6} pX(3)=P(X=3)=61

4.3.2 PMF与CDF的关系(离散随机变量通常只使用整数)

  1. F X ( 2.5 ) = P ( X ≤ 2.5 ) = P ( X = 2 ) + P ( X = 1 ) + P ( X = 0 ) + P ( X = − 1 ) + ⋯ = ∑ n = − ∞ 2 = ∣ 2.5 ∣ P ( X = n ) F_X(2.5)=P(X\le2.5)=P(X=2)+P(X=1)+P(X=0)+P(X=-1)+\dots=\sum_{n=- \infty}^{2=|2.5|}P(X=n) FX(2.5)=P(X2.5)=P(X=2)+P(X=1)+P(X=0)+P(X=1)+=n=2=2.5P(X=n)
  2. 对任何 x x x
    F X ( x ) = ∑ n = − ∞ ∣ x ∣ P X ( n ) F_X(x)=\sum_{n=-\infty}^{|x|}P_X(n) FX(x)=n=xPX(n)
  • 注: ∣ x ∣ |x| x表示取整
  1. 相互转化EX1: P M F → C D F PMF\to CDF PMFCDF
    叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第4张图片
    叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第5张图片
  2. 相互转化EX2: C D F → P M F CDF \to PMF CDFPMF
    叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第6张图片
    阶梯前后的值相减
    P X ( x ) = F X ( x + − x − ) P_X(x) = F_X(x^+-x^-) PX(x)=FX(x+x)
    叶丙成-概率-chapter4-随机变量-累积分布函数CDF-概率质量函数PMF-伯努利分布-二项分布-均匀分布_第7张图片
  3. 概率分布(probability Distribution)
    任何一个 P M F PMF PMF或是之后介绍的 P D F PDF PDF都当作是一种概率分布(将总和为1的概率分布在点上)

4.4 离散概率分布(discrete probability distributions)

丢硬币:非正即反,正面概率为0.5
阿宅告白:非成功,即失败,成功概率为0.7
出门天气:非晴天即雨天,晴天概率为0.6
相似点:1次实验,两种结果。
只在意某一种结果是否发生 ⇒ \Rightarrow Bernoulli概率分布

4.4.1 Bernoulli概率分布(伯努利分布)

  1. 举例
    1. PMF:若实验成功几率为0.6,做一次实验, X X X代表成功次数。记为 X ∼ B e r n o u l l i ( 0.6 ) X\sim Bernoulli(0.6) XBernoulli(0.6)
      p X ( x ) = { 0.6 , x = 1 , 0.4 , x = 0 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} 0.6 \quad &,x=1, \\ 0.4 \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right. pX(x)=0.60.40,x=1,,x=0,,otherwise.
    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)
      F X ( x ) = { 0 , x < 0 , 0.4 , 0 ≤ x < 1 , 1 , x ≥ 1. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 0.4 \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right. FX(x)=00.41,x<0,,0x<1,,x1.
  2. 一般化
    1. PMF:若实验成功几率为 p p p,做1次实验, X X X代表成功次数。记为 X ∼ B e r n o u l l i ( p ) X\sim Bernoulli(p) XBernoulli(p)
      p X ( x ) = { p , x = 1 , 1 − p , x = 0 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} p \quad &,x=1, \\ 1-p \quad & ,x=0, \\ 0 \quad & ,otherwise. \end{aligned} \right. pX(x)=p1p0,x=1,,x=0,,otherwise.
    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)
      F X ( x ) = { 0 , x < 0 , 1 − p , 0 ≤ x < 1 , 1 , x ≥ 1. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<0, \\ 1-p \quad & ,0\le x<1, \\ 1 \quad & ,x \ge 1. \end{aligned} \right. FX(x)=01p1,x<0,,0x<1,,x1.

4.4.2 Binomial概率分布(二项分布)

EX1:阿宅鼓起勇气搭讪10人,若每次搭讪成功几率为0.6,10次成功8次的概率为?
EX2:艺洲五天午餐在某一餐厅就餐,若每次上菜超时的概率为0.9,5天中有3天超时的概率为?
共同点:做n次实验,同一个概率,只关注n次实验出现某结果k次之概率 ⇒ \Rightarrow Binomial概率分布

  1. 举例
    1. PMF:若实验成功几率为0.6,做10次实验, X X X代表成功次数。记为 X ∼ B I N ( 10 , 0.6 ) X\sim BIN(10,0.6) XBIN(10,0.6)
      p X ( 8 ) = P ( X = 8 ) = ( 10 8 ) 0. 6 8 ( 1 − 0.6 ) 10 − 8 p_X(8)=P(X=8)=\binom{10}{8}0.6^8(1-0.6)^{10-8} pX(8)=P(X=8)=(810)0.68(10.6)108
    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)
      F X ( x ) = ∑ m = − ∞ ∣ x ∣ ( 10 m ) 0. 6 m ( 1 − 0.6 ) n − m F_X(x)=\sum_{m=-\infty}^{|x|}\binom{10}{m}0.6^m(1-0.6)^{n-m} FX(x)=m=x(m10)0.6m(10.6)nm
  2. 一般化
    1. PMF:若实验成功几率为p,做n次实验, X X X代表成功次数。记为 X ∼ B I N ( n , p ) X\sim BIN(n,p) XBIN(n,p)
      p X ( x ) = P ( X = x ) = ( n x ) p x ( 1 − p ) n − x p_X(x)=P(X=x)=\binom{n}{x}p^x(1-p)^{n-x} pX(x)=P(X=x)=(xn)px(1p)nx
    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)
      F X ( x ) = ∑ m = − ∞ ∣ x ∣ ( n m ) p m ( 1 − p ) n − m F_X(x)=\sum_{m=-\infty}^{|x|}\binom{n}{m}p^m(1-p)^{n-m} FX(x)=m=x(mn)pm(1p)nm

4.4.3 Uniform概率分布(均匀分布)

EX1:丢一个公平的骰子:1-6各点出现的概率均等
EX2:混哥考试,作答A,B,C,D的概率均等
EX3:狡兔三窟,出现在三个窟的概率均等
共同点:一次实验,n种结果,个结果概率均等,关注某结果是否发生 ⇒ \Rightarrow Uniform概率分布

  1. 举例
    1. PMF:如果 X X X等于 3 , 4 , 5 , 6 , 7 3, 4,5,6,7 3,4,5,6,7的概率均等。记为 X ∼ U N I F ( 3 , 7 ) X\sim UNIF(3,7) XUNIF(3,7)
      p X ( x ) = { 1 7 − 3 + 1 , x = 3 , 4 , 5 , 6 , 7 , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} \frac{1}{7-3+1} \quad &,x=3,4,5,6,7, \\ 0 \quad & ,otherwise. \end{aligned} \right. pX(x)=73+110,x=3,4,5,6,7,,otherwise.

    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)

F X ( x ) = { 0 , x < 3 , ∣ x ∣ − 3 + 1 6 , 3 ≤ x < 8 , 1 , x ≥ 8. F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<3, \\ \frac{|x|-3+1}{6} \quad & ,3\le x<8, \\ 1 \quad & ,x \ge 8. \end{aligned} \right. FX(x)=06x3+11,x<3,,3x<8,,x8.

  1. 一般
    1. PMF:如果 X X X等于 a , a + 1 , … , b a,a+1,\dots,b a,a+1,,b的概率均等。记为 X ∼ U N I F ( a , b ) X\sim UNIF(a,b) XUNIF(a,b)
      p X ( x ) = { 1 b − a + 1 , x = a , a + 1 , … , b , 0 , o t h e r w i s e . p_X(x)=\left\{ \begin{aligned} \frac{1}{b-a+1} \quad &,x=a,a+1,\dots,b, \\ 0 \quad & ,otherwise. \end{aligned} \right. pX(x)=ba+110,x=a,a+1,,b,,otherwise.

    2. CDF: F X ( x ) = ∑ n = − ∞ ∣ x ∣ p X ( x ) F_X(x)=\sum_{n=-\infty}^{|x|}p_X(x) FX(x)=n=xpX(x)

F X ( x ) = { 0 , x < a , ∣ x ∣ − a + 1 b − a + 1 , a ≤ x < b , 1 , x ≥ b . F_X(x)=\left\{ \begin{aligned} 0 \quad &,x<a, \\ \frac{|x|-a+1}{b-a+1} \quad & ,a\le x<b, \\ 1 \quad & ,x \ge b. \end{aligned} \right. FX(x)=0ba+1xa+11,x<a,,ax<b,,xb.

4.4.4 学这些概率分布有什么用

  • 很多事物背后概率模型是未知的

  • 对事物的运作方式、本质清楚后,若跟某概率分布的本质相同或是接近,我们便可采用该概率分布来近似、模拟该事物的运作

  • 在这近似、模拟的概率模型上,便可以开始估算各式各样事件的概率。

  • 视频地址在上方(有需要可以留言要云分享)

  • 如有不妥,请指示正,谢谢阅读!
    作者:togetlife

你可能感兴趣的:(概率论)