第三章:关联和因果关系在图中的流动

目录

1、Graph terminology 图的基本术语

2、Batesian networks and casual graphs 贝叶斯网络和因果图

3、The basic building blocks of graphs 图的基本构建模块

4、The flow of association and causation 关联和因果关系的流动

总结

1、Graph terminology 图的基本术语

 第三章:关联和因果关系在图中的流动_第1张图片

第三章:关联和因果关系在图中的流动_第2张图片 

 第三章:关联和因果关系在图中的流动_第3张图片

 第三章:关联和因果关系在图中的流动_第4张图片

2、Batesian networks and casual graphs 贝叶斯网络和因果图

在因果图中我们主要研究有向无环图DAG。 而如果给定这样一个有向无环图,我们想求有向无环图中的分布关系,我们就需要先定义有向无环图对应的分布情况。

第三章:关联和因果关系在图中的流动_第5张图片Bayesian Networks 贝叶斯网络,一个概率图模型,因果图就是根据它产生的,因此先介绍它,贝叶斯网络的职责是将概率和图模型结合起来,使得我们能直接利用图表示概率关系,而想用图模型来表示概率关系,需要先提出两个假设。

我们先不谈因果,来看一个统计模型:联合分布分解,条件概率的乘法定理/链式法则:

假设n = 4,x取值是二进制,得到如下图所示。 因此先提出一个最基础的假设: DAG中相邻的点是依赖关系。 但这样每加一个变量,参数数量就会指数级上升, 如下图所示。 因此光是一个依赖假设还是不够,我们需要 引入独立假设,进行简化,减少不必要的计算量。

第三章:关联和因果关系在图中的流动_第6张图片

 附:乘法定理证明:

第三章:关联和因果关系在图中的流动_第7张图片

 假设一:局部马尔可夫假设第三章:关联和因果关系在图中的流动_第8张图片

则贝叶斯网络分解的公式如下:

 

由此可知,贝叶斯网络分解和局部马尔可夫假设是等价的(充要条件)

第三章:关联和因果关系在图中的流动_第9张图片

 假设二:最小假设第三章:关联和因果关系在图中的流动_第10张图片

第三章:关联和因果关系在图中的流动_第11张图片

 第三章:关联和因果关系在图中的流动_第12张图片

到目前为止,我们可以得到如下流程图: 

 第三章:关联和因果关系在图中的流动_第13张图片

理论上,知道这两个假设就可以求出所有的因果关系,但在实际中,当因果关系复杂起来 就很难分析,因此我们需要构建一些基本的块block。 

3、The basic building blocks of graphs 图的基本构建模块

第三章:关联和因果关系在图中的流动_第14张图片 当我们同时将X2作为条件, Chain 和 Fork 就拥有相同的独立关系,X1和X3的关联被X2 blocked(阻断了),X1和X3就会变成相互独立的两个节点。证明如下图,我们得到了:给定X2时,X1和X3的联合概率等于他们各自的概率相乘。

第三章:关联和因果关系在图中的流动_第15张图片 用条件概率公式可以得到上面计算过程 

 第三章:关联和因果关系在图中的流动_第16张图片

(collider是对撞结构,也就是immorality不道德结构 )

附:什么是边缘化?

边缘化是一种方法,它要求对一个变量的可能值求和,以确定另一个变量的边缘贡献。边缘化告诉我们只要把一些变量累加起来就可以得到所需概率量。

具体可以看一篇blog:(26条消息) 概率论入门:边缘化_Lemonbr的博客-CSDN博客_边缘化概率

4、The flow of association and causation 关联和因果关系的流动

但当以X2为条件的时候,X1和X3就不独立了。

用一个例子说明当以X2为条件时,X1和X3不独立:

第三章:关联和因果关系在图中的流动_第17张图片

节点 X1与节点 X3 以共同效应 X2 作为条件时,这两个独立变量为什么就变得相互依赖了呢?

这是因为,当我们以 X2 作为条件时,我们限定了 X2 取相同值时的情况。由于 X2 的值依赖于 X1 和 X3,因此 X1 值的任何变化必须通过 X3 值的变化来补偿,否则 X2 值也会改变。

举一个例子:X2 = X1 + X3,且 X1 和 X3 是独立的变量,有以下推理:如果已知 X1 = 1,我们无法得知有关于 X3 可能值的任何信息,因为两个变量时独立的;但倘若已知 X2 = 3,那么再告知我 X1 = 1 时,我就立马能够确认 X3 只能是 2,即给定 X2 = 3 的条件下,X1 与 X3 是相互依赖的。

最后,我们还可以根据Immorality/collider的性质延伸出一种情况,如下图所示,如果我们以x2的子孙X4为条件,也会产生关联,这个关联流向为x4->x2->(x1,x3)。

第三章:关联和因果关系在图中的流动_第18张图片

 第三章:关联和因果关系在图中的流动_第19张图片

d-separation:

基于blocked path,我们定义d-separation: 如果X(中的任何节点)和Y(中的任何节点)之间的所有路径都被Z阻塞,则两(组)节点X和Y被一组节点Z 分隔。 给定p满足关于图G的马尔可夫假设,如果在Z条件下,X和Y在G中是 d-separation 的,则在Z条件下,X和Y在分布P中是条件独立的。 

第三章:关联和因果关系在图中的流动_第20张图片

我们称之为全局马尔可夫假设。

local Markov assumption,global Markov assumption 和 Bayesian network factorization是不同角度的理解,他们三者是完全等价的 对于一个DAG(有向无环图),d-separation方法可以快速的判断出两个节点之间是否是条件独立的。

总结

第三章:关联和因果关系在图中的流动_第21张图片

这一章我们详细探讨了因果图中点与点之间关系,并学习了如何分辨关系以及使其独立的方法。但在因果推理中,我们希望得到的是因果关系,而不是独立关系,这需要一些方法能够抛开非因果关联,只留下因果关联,如上图所示,只考虑蓝色线(T是Y的因,看箭头方向)。然后计算因果效应。也就是屏蔽掉混淆关系。association≠causation。

ps:刚入门因果推断,有什么错误欢迎批评指正,也欢迎对这一方向感兴趣的大家一起交流,学习进步。

参考:

(26条消息) 因果推理(三):关联和因果在因果图中的流动_一千克欣喜的博客-CSDN博客

《因果推理导论》课程(2020) by Brady Neal_哔哩哔哩_bilibili

你可能感兴趣的:(因果推理,人工智能)