2018-10-14 智能的基础-因果模型

最近听了万维钢介绍朱迪亚珀尔的新书《为什么：因果关系的新科学》，其中介绍到的三种因果发现思维很受启发。

人类探究因果关系的思维方式主要有三类，分别是观察、干预和想象。

观察是通过大量的现象寻找变量之间的相关性，是一种经验积累。AlphaGo下围棋，其实就是在线下学习的时候，得到了再一种态势下走某一步会得到好的结果概率更大，并不理解某一步棋有什么用，也就是在这步棋和双方博弈影响之间没有构建因果，只是一种经验的映射。想起一个心理学实验：
把五只猴子放进一个大笼子里，在笼子外猴子们触手可及的地方放了一个香蕉。猴子们看到香蕉，自然都想去拿。但是，每当有一只猴子伸手去够香蕉时，生物学家们就对五只猴子全部加以电击，以示惩罚。反复数次后，猴子们都老实了，谁都不去碰那个香蕉。因为任何一只猴子试图去碰香蕉，五只猴子都会遭殃被电。生物学家们看到猴子们都老实了，于是从笼子里拿走一只猴子，再放进一只新猴子，姑且称之为新猴A，新猴A发现香蕉，马上伸手去拿。生物学家们这次没有电击，但没成想，还没等新猴A拿到香蕉，四只老猴子马上对新猴A拳打脚踢，阻止新猴A去碰香蕉。新猴A不甘心，过了一会儿，又试图去拿香蕉，结果又挨了四只老猴一顿胖揍。终于，新猴A老实了。
这时，生物学家们再从笼子中取走一只老猴，放入一只新猴B。新猴B看到香蕉，也想去拿。结果被三只老猴和新猴A一顿揍。这次，打的最起劲儿，就是新猴A。（这就叫老兵欺负新兵）几次反复后，新猴B也老实了，不去碰那个香蕉了。
依次轮替，生物学家们最后把所有五只老猴都取走了，笼子里是从新猴A到新猴E的五只新猴。
奇迹发生了，没有电击，但是五只新猴都不去碰那个香蕉，因为它们知道，碰香蕉会被别的猴子打。但至于为什么会被打，它们谁也不知道。
于是，一个新传统形成了——香蕉是不能碰的！但为什么不能碰？没有猴子知道。
这些新猴子通过观察构建的因果模型- 香蕉不能碰，碰了会被打，看似合理，而已经和真实的因果想去甚远。

干预就是通过变量的改变去预判结果。通过在变量和结果之间的多次试验，来发现变量和结果之间的因果关系。

想象就是对以前发生的事情进行反思。操作的过程就是如果当时那样做了会怎样，在博弈论中也叫做反事实分析。比如，你没有当程序员，但是你可以想象如果你当了程序员会怎样的，通过反思的过程，则可以得到一些不需要干预实验或者无法进行干预实验的因果关系。

这三种方法在人工智能领域也可以类比。观察相当于目前流行的深度神经网络，不知道原因，在变量和结果之间学习映射。干预则可以利用强化学习，agent通过行动对环境进行干预，目前是通过反馈优化网络，其实可以通过反馈得到因果。第三种类似博弈的反事实网络，通过博弈树的不同方向反事实计算，得到最优的变量，可以看做是分析得到的因果关系。

2018-10-14 智能的基础-因果模型

你可能感兴趣的:(2018-10-14 智能的基础-因果模型)