【中文翻译】Explaining Visual Cortex Phenomena using Recursive Cortical Network(RCN网络论文二)

Explaining Visual Cortex Phenomena using Recursive Cortical Network

使用rcn介绍视觉皮层中的现象

    在看numenta公司的HTM时,发现还有一个公司——Vicarious,也在研究人脑来创建神经网络,不同的是它实力更雄厚,已有硅谷大佬们上亿美元的融资。它的代表作是RCN(Recursive Cortical Network)递归皮层网络。这篇论文主要不是说技术的,而是向大家展示用rcn这个模型可以解释为什么人类视错觉的原因(本来这里没有颜色,为什么人眼会看到有颜色,而且大脑v1层的反应还和真的有一样)。我已经研究了很久人脑皮层的结构和神经网络,希望能通过这个论文,将两者更好的联系起来,所以翻译了一下。(因为还没搞懂rcn,所以有部分没翻译完全,回头改一下)我们有一个研究皮质算法的Q群:515743445,有兴趣可以加入(就3个人。。。)。


摘要

    视觉皮层的连通性和信息通路得到了很好的研究,正如观察到的生理现象一样,但用于解释视觉皮层过程的内聚模型仍然是一个悬而未决的问题。为了全面理解,我们需要建立能够提供和真实性能一样强大的视觉皮层模型,同时还能够解释心理物理和生理观察。为此,我们演示了递归皮层网络(George et al。,2017)如何用作计算模型来重现和解释主观轮廓,霓虹色扩散,遮挡与删除以及观察到的边界归属竞争现象在视觉皮层。


介绍

    为了全面理解,我们需要建立能够提供和真实性能一样强大的视觉皮层模型,同时还能够解释心理物理和生理观察。一种研究途径将识别,分割,推理等任务视为对生成模型的查询(Lee&Mumford,2003)。许多视觉错觉也可以被理解为生成模型中的最佳贝叶斯推断,并且它们通常提供对视觉感知潜在机制的见解。在最近的一篇出版物中(George et al。,2017),我们引入了递归皮层网络(RCN),这是一种视觉生成模型,并展示了它的真实性能。在这里,我们表明RCN可以重现和解释众所周知的心理物理实验和生理观察:(1)主观轮廓效应(Kanizsa,1976),(2)和霓虹色扩散 (3)边界归属反应(borderownership response),和(4)遮挡对比删除效果(occlusion versus deletion effect)。所有这些现象都被解释为在为解析视觉场景1而构建和学习的模型中进行推理的副产品。我们认为这些视觉现象是模型所采用的因子分解的必要副作用,以实现强大的泛化。


递归皮层网络(RCN)

    RCN是一种用于视觉的结构化概率图模型(PGM  probabilistic graphical model ),由与外观画布相互作用的特征的轮廓层次组成(图1A)。轮廓层次(contour hierarchy)被学习为特征检测器,池化和横向连接的交替层(图1B)。在图1B中,每个填充的循环节点是二进制随机变量,开放循环节点是分类随机变量,矩形是编码兼容性(compatibility)的因子。池化提供局部变形的不变性,类似于卷积神经网络中的池化。学习池之间的横向连接,图1B和C中的灰色方形“因子节点”以强制相邻池(adjacent pool)中的选择之间的轮廓一致性。图1C显示了矩形的层次分解,从底部的简单线段到更高层次的更复杂的特征,图1D显示了轮廓和面之间相互作用的细节。有关详细信息,请参阅George et al。,(2017)。

通过使用预定的max-prop信念传播(scheduled max-prop belief propagation)(Pearl,1988)进行近似MAP推理(推断最佳解释)来实现解析场景。受生物学启发的消息传递时间表(message passing schedule)如下。包括了短程横向传播的快进传递( fast forward pass)来识别极有可能获得证据的节点。传播用于组合近似MAP解决方案,该解决方案产生输入场景的完整分段。



图1:RCN生成模型。有关详细信息,请参见


结果

    我们解释的视觉现象有一些共性。 它们需要前馈,反馈和横向连接的互操作。 其中三个涉及轮廓和表面的表示。 所有这些都可以理解为RCN中近似最优推断的结果。


主观轮廓

    在主观轮廓错觉中,人们会看到一条实际上并不存在的线条。在图2中,人们在圆圈之间的空白区域中感觉到三角形的微弱轮廓,即使没有边界的局部证据。生理学结果报告了V1中神经元响应虚幻轮廓的证据,尽管与响应真实轮廓的神经元相比有延迟(Lee&Mumford,2003)。图2第1列和第3列显示了各种各样的图像,其中感知了虚幻的轮廓。在第2和第4列中,我们展示了如何训练RCN识别这些视觉刺激中规则形状“幻觉”的虚幻轮廓。在这些图像中显示的是在网络的最低级别的“对最佳解释的推断”(MAP推断)解决方案,其是如前所述的消息传递的结果而获得的。这些图像中的黄色部分表示自下而上的证据,蓝色星是“回溯”,是网络发现的全球MAP解决方案的一部分。回溯表明网络期望将空白空间中的轮廓视为全局解决方案的一部分。


图二:主观轮廓


    尽管缺乏当地证据,但是为什么RCN会因推理而产生这些幻觉?原因是根据模型,图像其余部分的局部证据足以支持对象的全局感知。由于MAP推断找到最能解释图像中证据的配置,因此它将打开作为全局感知一部分的所有特征。

    从消息传播的时间表中可以容易地理解神经元对主观轮廓的反应的时间动态(Lee&Mumford,2003)。在前向传递期间,特征仅具有局部证据,因此空白空间中的神经元不响应。一旦前向传递识别出潜在的全局感知,该信息将在自上而下的消息中向下流动,以影响较低级别节点中的信念,从而打开先前关闭的某些功能。


边境归属回应

    封闭物体的边界被认为属于它们(von der Heydt,2011)。已知V1和V2中的几个神经元对其边界归属敏感。这些细胞更喜欢给定的图形位于边界的一侧或另一侧,但是不可能从细胞的经典感受野内的局部线索确定给定的轮廓是否属于表面(Tyler 2011)。特别是,在对刺激的反应的早期阶段,这两个同样激活,并且在响应的后期阶段,只有具有正确表面选择性的神经元保持响应(von der Heydt,2011)。


图3:RCN的边界归属实验。(A)PGM示意图,(B)具有相同RFs但边界所有权偏好对立的两个轮廓选择性细胞的激活的演变过程  

与(von der Heydt,2011)中提出的结果一致,RCN模型具有每个轮廓神经元的两个副本,每个代表边界归属一侧。然而,它们在PGM中的相互作用的确切性质决定了它如何到达解决方案。图3A显示了对应于该相互作用的RCN的PGM片段。该特征复制具有相同的轮廓,但不同的表面边缘偏好与轮廓节点相互作用而没有偏好(“非选择性”)在嘈杂的“V”结构中。

????????????????????????

(The feature copies with identical contours, but different side-ofsurface preferences interact with the contour-node with no preference (‘unselective’) in a noisy-OR ‘V’ structure.)


    非选择性节点直接连接到渲染图像。在通过V型结构的第一次向前传递中,自下而上的证据由于缺乏对它们中任何一个的先前偏好而同等地流向父母。前馈传播导致顶层的全局感知仅与父亲中的一个一致。然后,后向消息传达这些偏好。由于MAP推理的目标是“解释”证据,其中一个父母开启'解释'了另一个父母开启的必要性。图3B示出了边界所有权节点的对数似然作为消息传递迭代次数的函数。这再现并解释了实验观察到的效果。


霓虹色传播

某些刺激,如图4(左)所示,会引起人类虚幻表面的幻觉,这种效应被称为霓虹色扩散(Bressan et al。,1997)。 这些影响背后的建议机制是边界完成和视觉皮层表面填充之间的相互作用(Grossberg&Yazdanbakhsh,2005)。 值得注意的是,虚幻表面的填充尊重虚幻轮廓的边界。

图4:RCN的霓虹色扩散实验证明了神经填充机制。 给定输入刺激(Bressan等,1997)(左),表面信息在模型V1中顺序传播(右,从左上角顺时针)。


    霓虹色扩散效应是RCN中MAP推理动力学的自然副产物。要理解这一点,请考虑图1A和1D中所示的PGM片段。建模为条件随机场(CRF)的表面鼓励相邻表面节点之间的连续性,除非插入的轮廓节点被打开。如George等人(2017)所述,通过该模型的正向通过产生近似的边缘和表面响应。基于在轮廓层次的顶层选择最活跃的假设的向后传递将在表面CRF上强制执行相应的轮廓不连续性。图4(左)中所示的刺激具有足够的局部边缘证据来支持圆作为RCN轮廓层次中的顶层假设 - 这部分推断与前面描述的主观轮廓的情况相同。轮廓的自上而下的部分MAP配置(圆圈)会影响CRF中的传播。然后,自上而下轮廓施加的不连续性将在CRF中传播,并进一步传递消息以创建填充效果。

遮挡与删除

    心理物理学实验表明,人类在遮挡物体方面要比删除遮挡区域的相同物体(保持相同的可见部分)更好(Johnson&Olshausen,2005)。在George et al。,(2017)中,我们证明了关于闭塞的推理导致RCN中的识别率显着提高。



图5:在RCN中的遮挡与删除之间的检测。与人类心理物理学研究结果类似,反映信心的RCN检测分数(右上角)在物体完全可见(左)时最高,其次是当它被遮挡(中间)时。


    阻塞与删除背后的原因很容易理解为RCN生成模型。删除对象的部分是缺少这些部分的证据。当由于遮挡而丢失那些相同的部分时,该模型可以解释缺少证据作为遮挡。从机制上讲,如果没有遮挡来解释他们的缺席,被删除的部分将为整体假设提供负面证据。在遮挡推理期间进行解释会将这些负面证据转换为“不确定证据”(log-likelihood = 0)。图5显示了与完整正方形(左列)相比,当缺失证据被视为遮挡(中间列)与删除(右列)时,“正方形”假设获得的对数似然得分。

讨论

    我们描述了在RCN中使用循环信念传播的近似贝叶斯推断的动力学如何解释几个众所周知的心理物理和生理结果。 与专门用于解释孤立现象的模型相比,所有这些观察结果都被解释为在解析视觉场景时学习的模型中“对最佳解释进行推理”的自然副产品。 神经和认知科学研究指导了RCN中的代表性选择和推理算法,并且这些算法对于在几个真实世界的基准测试中以极少的训练数据实现最先进的性能至关重要。 我们希望RCN还可以用作神经科学和认知科学实验的工具,以进一步了解视觉皮层回路中的计算。

你可能感兴趣的:(【中文翻译】Explaining Visual Cortex Phenomena using Recursive Cortical Network(RCN网络论文二))