条件概率我知道,但什么是条件期望?--草稿

目录

1 目标问题: 什么是条件期望

2 条件期望,全期望公式

3 条件期望,全期望公式 和 条件概率,全概率公式的区别和联系

4 有什么用

4.1 例题1:

4.2例题2


1 目标问题: 什么是条件期望

这次先不说目标

先引用一个小学数学题

1班平均分是93,2班平均分是95,两个班的平均分怎么算

错误算法,(93+95)/2=94

  • 除非两个班的学生数量一样,否则就是错的

正确算法

  • 假设1班学生数量n1,平均分A1=93
  • 假设2班学生数量n2,平均分A2=95
  • 根据平均分的定义
  • A0 = 总分数/总人数
  •     = (A1*n1 + A2*n2)/(n1+n2)
  •     = n1/(n1+n2)*A1 + n2/(n1+n2)*A2
  •     = 系数1*A1+系数2*A2
  •     = 权重比例1*A1+权重比例2*A2
  • 而权重 = 本班人数/ sum(所有班级人数和)

从这里引出了一个问题

Q1: 我们想知道总体的平均值,当然可以直接用总体的数计算,比如A0 = 总分数/总人数。但是如果我们已经知道了 总体的每个部分的平均值,是否可以根据这些算出总体的平均值呢?

A1: 前面已经看到是可以的,总体均值= Σ部分均值*权重比例

Q2: 如果这个总体不是确定的,而是一个随机变量,比如我们要求 这个随机变量的期望

A2: 那么权重比例就变成了随机变量的概率

因此,引出了我们要讨论的主题:

  • 类比: 总体均值= Σ部分均值*权重比例
  • 条件期望可以这么看
  • E(X) = ΣPI*E(X|Yi) 和上面是一个表达方式
  • E(X) = P1*E(X|Y1) + ..... +Pk*E(X|Yk) = ΣPI*E(X|Yi)
  • E(X) = E(E(X|Y)) = ΣPI*E(X|Yi) = P1*E(X|Y1) + ..... +Pk*E(X|Yk)  ,其中i属于(1,k)

2 条件期望,全期望公式

E(X) 是一个具体的数,数学期望,概率加权平均值

条件期望

  • E(X|Y=y1) = x1*P(x1|Y=y1)
  • 概率 p
  • P*E(X|Y=y1)

随机变量

E(X|Y) =Σ xi*P(xi|Y=yi) =  x1*P(x1|Y=y1) +  x2*P(x2|Y=y2) + ... + xk*P(xk|Y=yk) 

全期望公式

E(X) = E(E(X|Y)) = ΣPI*E(X|Yi) = P1*E(X|Y1) + ..... +Pk*E(X|Yk)  ,其中i属于(1,k)

看下面的图理解

图是知乎的,参考   zhuanlan.zhihu.com/p/612709393

条件概率我知道,但什么是条件期望?--草稿_第1张图片

3 条件期望,全期望公式 和 条件概率,全概率公式的区别和联系

  • 条件概率:     P(A|B) =  P(AB) / P(B)
  • 全概率公式:  P(A) =  P(AB1) * P(B1) +P(AB2) * P(B2) + ......+P(ABn) * P(Bn)
  • 条件期望:     E(X|Y=y1) = x1*P(x1|Y=y1)
  • 全期望公式: E(X) = E(E(X|Y)) = ΣPI*E(X|Yi) = P1*E(X|Y1) + ..... +Pk*E(X|Yk)  ,其中i属于(1,k)

4 有什么用

用处很大

4.1 例题1:

  • 一个矿工被困矿井里,面前可以打开3个门,均等概率,1个门回到外面花费3小时,1个门回到现在地方花费5小时,1个门回到现在地方花费7小时,求问矿工回到外面平均需要时间?
  • 设置X为矿工出去要花的时间
  • E(X) = 1/3* 3+  1/3* (E(X)+5)+1/3* (E(X)+7)
  • 3 E(X) = 3+  E(X)+5 +E(X)+7
  • E(X) = 15

求次数,求时间都可以用 条件期望,全期望公式等

求次数,用各种分布求,解方程求,用条件期望/全条件期望算

求概率,用马尔可夫可以解

用概率没法求

      1/3* 3+  1/3* (E(X)+5)+1/3* (E(X)+7)

4.2例题2

如果丢硬币

假设成功概率p, 失败概率1-p,问直到成功1次的次数是多少---几何分布几何分布

pdf=p*(1-p)^n

期望次数=1/p

也可以用 条件期望和全期望公式

令n为出现1次正面的次数,而Y表示

E(N) =P*E(N|Y=1) + (1-P)*E(N|Y=0)
E(N) =P*E(N|Y=1) + (1-P)*E(N|Y=0)

显然 E(N|Y=1) =1
因为 Y=1了,那么N也就=1

而因为Y=0了,已经多了1次,而每次试验都是独立了又开始重新试验E(N)
所以E(N|Y=0) =1+E(N)
这就是递归的规律

E(N) =P*1 + (1-P)*(1+E(N))
E(N) =P +(1-P)+ (1-P)*E(N)
E(N) =1+ (1-P)*E(N)
E(N) =1/p

这也是一个递归的问题

你可能感兴趣的:(算法)