2018-10-14 智能的基础-因果模型

最近听了万维钢介绍朱迪亚珀尔的新书《为什么:因果关系的新科学》,其中介绍到的三种因果发现思维很受启发。

人类探究因果关系的思维方式主要有三类,分别是观察、干预和想象。

观察是通过大量的现象寻找变量之间的相关性,是一种经验积累。AlphaGo下围棋,其实就是在线下学习的时候,得到了再一种态势下走某一步会得到好的结果概率更大,并不理解某一步棋有什么用,也就是在这步棋和双方博弈影响之间没有构建因果,只是一种经验的映射。想起一个心理学实验:
把五只猴子放进一个大笼子里,在笼子外猴子们触手可及的地方放了一个香蕉。猴子们看到香蕉,自然都想去拿。但是,每当有一只猴子伸手去够香蕉时,生物学家们就对五只猴子全部加以电击,以示惩罚。反复数次后,猴子们都老实了,谁都不去碰那个香蕉。因为任何一只猴子试图去碰香蕉,五只猴子都会遭殃被电。生物学家们看到猴子们都老实了,于是从笼子里拿走一只猴子,再放进一只新猴子,姑且称之为新猴A,新猴A发现香蕉,马上伸手去拿。生物学家们这次没有电击,但没成想,还没等新猴A拿到香蕉,四只老猴子马上对新猴A拳打脚踢,阻止新猴A去碰香蕉。新猴A不甘心,过了一会儿,又试图去拿香蕉,结果又挨了四只老猴一顿胖揍。终于,新猴A老实了。
这时,生物学家们再从笼子中取走一只老猴,放入一只新猴B。新猴B看到香蕉,也想去拿。结果被三只老猴和新猴A一顿揍。这次,打的最起劲儿,就是新猴A。(这就叫老兵欺负新兵 )几次反复后,新猴B也老实了,不去碰那个香蕉了。
依次轮替,生物学家们最后把所有五只老猴都取走了,笼子里是从新猴A到新猴E的五只新猴。
奇迹发生了,没有电击,但是五只新猴都不去碰那个香蕉,因为它们知道,碰香蕉会被别的猴子打。但至于为什么会被打,它们谁也不知道。
于是,一个新传统形成了——香蕉是不能碰的!但为什么不能碰?没有猴子知道。
这些新猴子通过观察构建的因果模型- 香蕉不能碰,碰了会被打,看似合理,而已经和真实的因果想去甚远。

干预就是通过变量的改变去预判结果。通过在变量和结果之间的多次试验,来发现变量和结果之间的因果关系。

想象就是对以前发生的事情进行反思。操作的过程就是如果当时那样做了会怎样,在博弈论中也叫做反事实分析。比如,你没有当程序员,但是你可以想象如果你当了程序员会怎样的,通过反思的过程,则可以得到一些不需要干预实验或者无法进行干预实验的因果关系。

这三种方法在人工智能领域也可以类比。观察相当于目前流行的深度神经网络,不知道原因,在变量和结果之间学习映射。干预则可以利用强化学习,agent通过行动对环境进行干预,目前是通过反馈优化网络,其实可以通过反馈得到因果。第三种类似博弈的反事实网络,通过博弈树的不同方向反事实计算,得到最优的变量,可以看做是分析得到的因果关系。

你可能感兴趣的:(2018-10-14 智能的基础-因果模型)