根据上一节概率图模型基础(2)——贝叶斯网络中的因果关系,在节点的独立性方面,可以得出什么结论呢?
在学生成绩的例子中:在给定父节点Grade的情况下,Letter与图中其他节点都独立。有 P ( L ⊥ I , D , S ∣ G ) P(L \perp I,D,S|G) P(L⊥I,D,S∣G)成立。
这一节概念有点抽象?(至少我是这么觉得,所以后面后回来重新修改了。)
首先我自己先瞎BB几句:
当我们在实际应用中面对一系列的数据的时候,一般来说会从下面两个方面理解:
- 观察数据(其实就是观察数据的分布),从一堆变量中找出相互独立的变量(I、G)以及在某些条件下独立的变量(类似G、I、S),根据观察结果绘制图。这一些列的动作,就是由条件概率分布作注释的图,这个图通过链式法则为贝叶斯网定义了一个联合分布。
- 贝叶斯图其实就是好几堆独立性变量组合在一起的可视化结果。
这就是图与分布之间的关系,认清这个关系对后文的理解非常重要。
P P P是 χ \chi χ上的分布, I ( P ) I(P) I(P)定义为 P P P中满足独立性的集合。
I-map:记贝叶斯网络为 G G G,概率分布为 P P P,若 G G G中表现出的独立性的集合是 P P P中表现出的独立性的集合的子集。则 G G G是 P P P的一个I-map。比如
先看Graph:
再看分布P:
所以三个图都是P的I-map。
所以只有 G X → Y , G Y → X G_{X\rightarrow Y},G_{Y \rightarrow X} GX→Y,GY→X是P的I-map。
上图中的(a,b,c),虽然网络结构不同,但是都体现了相同的独立性假设: ( X ⊥ Y ∣ Z ) (X \perp Y|Z) (X⊥Y∣Z)。
熟悉贝叶斯公式的人都清楚,不管啥网络结构(以学生成绩为例),
上图的联合分布必然能写成:
P ( I , D , G , L , S ) = P ( I ) P ( D ∣ I ) P ( G ∣ I , D ) P ( L ∣ I , D , G ) P ( S ∣ I , D , G , L ) (2.1) P(I,D,G,L,S)=P(I)P(D|I)P(G|I,D)P(L|I,D,G)P(S|I,D,G,L) \tag{2.1} P(I,D,G,L,S)=P(I)P(D∣I)P(G∣I,D)P(L∣I,D,G)P(S∣I,D,G,L)(2.1)
有了I-maps之后,就可以简化一些因子:
所以公式2.1可以简化为
P ( I , D , G , L , S ) = P ( I ) P ( D ) P ( G ∣ I , D ) P ( L ∣ G ) P ( S ∣ I ) (2.2) P(I,D,G,L,S)=P(I)P(D)P(G|I,D)P(L|G)P(S|I) \tag{2.2} P(I,D,G,L,S)=P(I)P(D)P(G∣I,D)P(L∣G)P(S∣I)(2.2)
公式2.2正好满足《概率图模型基础(2)——贝叶斯网络中的因果关系》中贝叶斯网络表达式的书写规律。
另外,多一句嘴,所谓分布的表达,其实就是因子分解。
最小I-map与给定的节点顺序有关。
我又来瞎BB了:这个其实就是给定条件下的I-Maps
d − s e p G ( X , Y ∣ Z ) d-sep_G(X,Y|Z) d−sepG(X,Y∣Z):在概率图中,在给定结点 Z Z Z的条件下,结点 X X X和结点 Y Y Y存在有效迹(只要是结点连着的,不管方向对不对就称为迹),若结点 X X X和结点 Y Y Y相互独立,则可以表示为 d − s e p G ( X , Y ∣ Z ) d-sep_G(X,Y|Z) d−sepG(X,Y∣Z)
示例:
若G为不观测变量则S与D的关系可表示为:
d − s e p G ( S , D ∣ I ) d-sep_G(S,D|I) d−sepG(S,D∣I)
具体如何判断 d-分离,请参考《概率图模型基础(2)——贝叶斯网络中的因果关系》文中第 3.2 结:贝叶斯网络中各节点如何相互影响?
扩展:
与d-separate 相对应的独立性的集合用 I ( G ) I(G) I(G)表示:
I ( G ) = { ( X ⊥ Y ∣ Z ) : d − s e p G ( X ; Y ∣ Z ) } I(G)=\left \{ (X \perp Y | Z): d-sep_G(X; Y | Z) \right \} I(G)={(X⊥Y∣Z):d−sepG(X;Y∣Z)}
思路
在寻找之前,确保有:观测变量 Z Z Z的集合;贝叶斯网络图结构。
1.从下到上,从叶子结点到根的遍历图结构,标记 Z Z Z及其后代的所有节点。
2. 使用广度优先遍历,遇到如下情况停止,说明不存在d-sep,否则,说明存在d-sep:
a. 节点在v-结构中间,但在第一步中未被标记。
b. 节点不在v-结构中间,但是在第一步中被标记了。
P-Map 的一个直观解释:能够完全刻画分布 P P P的最小I-Map。
Coursera——Probabilistic Graphical Models