概率图模型-原理与技术 第三章 贝叶斯网表示 学习笔记(二)

概率图模型-原理与技术 第三章 贝叶斯网表示 学习笔记(二)

概率图模型-原理与技术 总目录

http://blog.csdn.net/icefire_tyh/article/details/54026071#t3

3.图中的独立性

3.1 d-分离

  • 有效迹


    对于上图a,b,c,当节点Z已知时候,节点X与Y条件独立。
    对于d,当节点Z未知时候,节点X与Y独立。

    由此可以定义有效迹:

      对于一条迹 XZY ,如果影响[非独立性]可以经过Z从X流向Y,那么称这条迹是有效的。

对于图a,b,c:当Z未知时迹有效
对于图d:当Z或者Z的一个后代已知时迹有效[特别的,对于d中的结构,称为v结构]

d-分离:
  假设 X,Y,Z 是图 G 上的节点集合,如果给定 Z ,假设任何节点 xX yY 之间不存在有效迹,那么称 X,Y 在给定 Z 时是 d 分离的。

  • d 分离的可靠性与完备性
    如果将 d 分离看作是确定独立性的一种方法,那么需要保证该方法的两点性质:
      可靠性:给定某个Z时,找到两个节点X,Y是 d 分离的,那么可以保证,在给定Z时他们是条件独立的。
      完备性: d 分离可以检测出所有的完备性。

      完备性在这里存在一些疑问, d 分离是作用在图结构上的,而图所蕴含的独立性 I(G)I(P) ,那么显然 d 分离无法描述分布的所有独立性。

      然而分布中没有被检测出的独立性是偶然发生的,也就是说,如果所有满足图G独立性[能在G上因子分解]的分布P均匀分布,那么有额外独立性的分布所占比例也趋近于0(测度为0)。

  • d 分离算法
      通过上面的描述知道 d 分离可以较为准确的描述能在G上因子分解的分布P的独立性,那么如果确定一个图的 d 分离就十分关键了。

[具体算法参考习题3.14]

3.2 I 等价

  单纯地从图蕴含的独立性来看,不同的贝叶斯网络实际上是可以等价的,因为他们蕴含了完全相同的独立性断言。比如上图的a,b,c三个结构,都蕴含了独立性假设 (XY|Z) ,那么如果两幅图 G1,G2 ,如果它们蕴含了相同的独立性断言,则称它们是 I 等价的

  • 骨架
      将图G中所有的有向边改成无向边,那么称这个无向图G’是G的骨架。
      定义:具有相同骨架和v结构的两幅图,称他们是 I 等价的。然而这样的说法并不完全,因为有些没有相同骨架的图也是 I 等价的,比如书上说的完全图,他们都没有蕴含任何独立性假设,所以他们是 I 等价的。
      非正则结构:对一个v结构 xzy ,如果x,y不存在边,则称之为非正则结构。
      更好的定义: 具有相同骨架和非正则结构的两幅图,称他们是 I 等价的。
    [具体算法参考习题3.16,3.17]

4.从分布到图

本节主要考虑,如果给出一个分布P,能否构建出一个能描述P中独立性的图G?
[虽然这一点并不是太现实,由于多维的联合概率分布太过庞大,无论存储计算都是问题]

4.1 最小 Imap

  • 最小 Imap
      如果仅仅用分布P的 Imap 来描述P的独立性,那么可以使用一个完全图,因为它是任何分布的 Imap 。然而这样的描述没有意义,它没有包含任何独立性。
      那么定义最小 Imap :如果图G是分布P的 Imap ,如果再去掉任何一条边,图G不再是分布P的 Imap ,那么称G是P的最小 Imap
      [显然对于一幅图,边越少独立性就越强]
      错误的观点:简单看上去最小 Imap 似乎能描述P的所有独立性,然而这个观点是错误的,它依然只能描述分布P部分独立性。

      如上图所示,通过不同节点顺序会导出不同的最小 Imap ,而这些最小 Imap 描述了不同的独立性。

4.2 Pmap

  • Pmap
    定义:对于分布 P ,如果图 G 的独立性集合 I(G)=I(P) ,则称 G P 的一个 Pmap
    Pmap 描述了分布P完整的独立性集合,那么需要考虑的是:
      1:是否每个分布都有 Pmap [并不成立]
      2:分布存在 Pmap ,如何找出它的 Pmap
      
  • 发现 Pmap
      从上面 I 等价的概念可以看出,同一个分布的 Pmap 也可能会有不同的结构,也就是说同一个分布的 Pmap 可能有多个,但是它们全部是 I 等价的。
      如何识别一个存在 Pmap 的分布的 Pmap
      1.识别无向的骨架
         根据 I 等价的定义,可以先识别出满足分布独立性集合的无向图
      2.识别非正规结构
         然后识别出非正规结构,为部分无向边赋予方向
      3.为剩下的无向边赋予方向 
         由于要生产有向图,所以要将所有无向边赋予方向,同时要保证不能产生新的非正规结构和圈。
     [具体算法参考习题3.19-3.24]    

你可能感兴趣的:(概率图模型)