脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架

A Framework for Intelligence and Cortical Function Based on Grid Cells in the Neocortex

摘要

新皮层是如何工作的还是个谜。在这篇论文中,我们提出了一个新的框架来理解它的功能。网格细胞是内嗅皮层中的神经元,代表动物在其环境中的位置。最近的证据表明网格细胞样神经元可能也存在于新皮层中。我们认为网格细胞存在于整个新皮层,在每一个区域和每一个皮层柱中。他们为大脑皮层如何运作定义了一个基于位置的框架。尽管内嗅皮层中的网格细胞代表了一件事物的位置,即身体相对于它所处的环境的位置,我们认为皮质网格细胞同时代表了许多事物的位置。体感皮层的皮层柱跟踪触觉特征相对于被触摸物体的位置,视觉皮层的皮层柱跟踪视觉特征相对于被观察物体的位置。我们提出,内嗅皮层和海马体中用来学习环境结构的机制,现在被新皮层用来学习物体的结构。在每个皮层列中都有位置的表示,这表明了新皮层如何表示物体的组成和物体的行为的机制。这导致了一个假设,即新皮层的每个部分学习完整的物体模型,每个物体的模型分布在整个新皮层。在所有皮质区域观察到的电路的相似性是一个强有力的证据,证明即使是高水平的认知任务也是学习的,并在基于位置的框架中表示。

关键词: 新皮层,网格细胞,新皮层理论,层次,物体识别,皮层柱

简介

人类的大脑皮层会学习一个极其复杂和详细的世界模型。我们每个人都能识别1000个物体。我们知道这些物体是如何通过视觉、触觉和听觉出现的,我们知道这些物体在我们与它们互动时的行为和变化,我们知道它们在世界上的位置。人类的新大脑皮层也学习抽象物体的模型,那些物理上不存在或我们不能直接感知的结构。大脑皮层的回路也很复杂。了解大脑皮层的复杂回路如何学习世界的复杂模型是神经科学的主要目标之一。

弗农·蒙特卡斯尔(Vernon Mountcastle)是第一个提出新皮层的所有区域从根本上是相同的。他认为,一个区域与另一个区域的区别主要是由对该区域的输入决定的,而不是由固有电路和功能的差异决定的。他进一步提出,一个小体积的皮质,一个皮质柱,是复制的单位(Mountcastle, 1978)。

这些都是令人信服的想法,但很难确定一个列能做什么足以解释所有的认知能力。今天,最普遍的观点是,新皮层以一系列分层步骤处理感官输入,提取越来越复杂的特征,直到物体被识别(福岛,1980;Riesenhuber和Poggio, 1999)。尽管这一观点解释了感官推断的某些方面,但它未能解释人类行为的丰富性,我们如何学习物体的多维模型,以及我们如何了解当我们与物体交互时,物体本身是如何变化和行为的。它也没能解释大部分新大脑皮层的回路在做什么。在本文中,我们提出了一个新的基于位置处理的理论框架,解决了这些缺点。

在过去的几十年里,神经科学中一些最令人兴奋的进展都与“网格细胞”和“位置细胞”有关。这些神经元存在于哺乳动物的海马体复合体中,这是一组区域,对人类来说,它的大小和形状大致相当于手指,位于大脑的两侧。网格细胞结合位置细胞学习世界地图(O 'Keefe和Dostrovsky, 1971;Hafting et al., 2005;Moser et al., 2008)。网格单元格表示动物的当前位置相对于那些地图。海马体的建模工作已经证明了这些神经表征在情景和空间记忆方面的力量(Byrne等人,2007;Hasselmo等人,2010;Hasselmo, 2012)和导航(Erdem和Hasselmo, 2014;Bush et al., 2015)。还有证据表明网格细胞在更抽象的认知任务中发挥作用(Constantinescu et al., 2016;Behrens et al., 2018)。

最近的实验证据表明网格细胞可能也存在于新皮层中。使用功能磁共振成像(Doeller et al., 2010;Constantinescu等,2016;Julian etal ., 2018)在新皮层的前额叶和顶叶区域发现了网格细胞样放电模式的特征。在人类中使用单细胞记录(Jacobs等人,2013年)在额叶皮层中发现了网格细胞的更直接证据(Long和Zhang, 2018年),使用多个四极管记录,发现了在大鼠S1中显示网格细胞、位置细胞和结膜细胞反应的细胞。我们的团队提出,新皮层对感觉输入的预测需要在整个新皮层的感觉区域中呈现一个以物体为中心的位置,这与网格细胞样机制一致(Hawkins等人,2017)。

我们认为网格细胞样神经元存在于新皮层的每一列中。内侧内嗅皮层(MEC)中的网格细胞主要代表一个物体的位置,即身体,我们认为皮质网格细胞同时代表多个物体的位置。体感皮层中接受来自身体不同部位输入的柱状结构表示这些输入在被触摸物体的外部参考框架中的位置。同样地,视觉皮层的皮层柱从视网膜的不同斑块接收输入,代表视觉输入在被观察物体的外部参照系中的位置。网格细胞和位置细胞通过身体的运动学习环境模型,我们提出皮质网格细胞结合感觉输入通过学习物体模型
传感器的移动。

尽管人们对MEC中网格细胞的感受场特性以及这些细胞如何编码位置已经有了很多了解(Rowland等人,2016年),但导致这些特性的潜在机制尚不清楚。实验结果表明网格细胞具有独特的膜状和树突状特性(Domnisoru et al., 2013;Schmidt-Hieber et al., 2017)。有两个主要的候选计算模型,振荡干涉模型(O 'Keefe和Burgess, 2005;伯吉斯等人,2007;Giocomo等,2007,2011;和连续吸引子模型(Fuhs和Touretzky, 2006;Burak和Fiete, 2009)。本文提出的框架假设“皮层网格细胞”在MEC中表现出与网格细胞相似的生理特性,但该框架不依赖于这些特性是如何产生的。

在本文中,我们提到了“皮层列”。我们使用这个术语类似于Mountcastle,来表示一个小区域的新皮层,它跨越所有层次的深度和足够的横向范围,以捕获所有类型的细胞和感受野反应。在本文中,皮质列不是一个物理上有标记的实体。这是一种方便的命名方法。我们通常认为一个柱大约是一平方毫米的皮质区域,尽管这个大小不是关键,而且可能因物种和地区而不同。

网格单元格如何表示位置

为了理解我们的提议,我们首先回顾了内嗅皮层中的网格细胞是如何被认为代表空间和位置的,如图1所示。尽管网格单元功能的许多细节仍然未知,但在以下原则上存在普遍的共识。网格细胞是在环境中的多个位置变得活跃的神经元,通常是在网格状或平铺的三角形晶格中。“网格单元模块”是一组网格单元,激活时网格间距和方向相同,但在环境中的位置发生了变化(Stensola等人,2012年)。当动物移动时,网格单元模块中的活动网格单元会发生变化,以反映动物的更新位置。即使动物处于黑暗中,这种变化也会发生,这告诉我们网格细胞是使用内部或“传出”的运动命令副本更新的(Hafting et al., 2005;McNaughton et al ., 2006;莫泽等人,2008年;Kropff et al., 2015)。这个过程被称为“路径整合”,它具有一个理想的特性,即不管移动的路径是什么,当动物返回到相同的物理位置时,模块中的相同网格单元将是活动的。

由于平铺,单个网格单元模块不能表示唯一的位置。要形成一个独特位置的表示,需要查看多个网格单元模块中的活动单元,其中每个网格单元模块的瓦间距和/或相对于环境的方向不同,如图1C、D所示。例如,如果一个网格单元格模块在重复之前可以表示20个不同的位置,那么10个网格单元格模块在重复之前可以表示大约2010个不同的位置(Fiete et al., 2008)。这种表示位置的方法有几个可取的属性:
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第1张图片
(1)表现能力大:

一组网格单元格模块可以表示的位置数量很大,因为它随模块的数量呈指数增长。

(2)路径集成可以在任何位置工作:

无论网络从什么位置开始,路径集成都可以工作。这是泛化的一种形式。对于每个网格单元模块,必须学习一次路径集成属性,然后应用到所有位置,甚至是动物从未去过的地方。

(3)每个环境的位置都是独特的:

每一个学习环境都与一组独特的位置相关联。实验记录表明,在进入一个学习过的环境后,内嗅网格细胞模块以不同的方式“锚定”(Rowland and Moser, 2014;Marozzi等人,2015)。(术语“锚”指的是选择每个模块中的哪些网格单元格应该在当前位置激活。)这表明,动物在该环境中的当前位置和所有可以移动到的位置,具有高度确定性,具有该环境特有的表征(Fiete et al., 2008;Sreenivasan和Fiete, 2011)。

结合这些属性,我们现在可以大致描述网格单元格如何表示一个环境,如房间,如图2A所示。环境由一组通过路径集成相互关联的位置表示组成(也就是说,动物可以在这些位置表示之间移动)。集合中的每个位置表示对该环境都是惟一的,不会出现在任何其他环境中。一个环境包括动物可以在其中移动的所有位置,包括没有被访问过,但可以访问的位置。与一些位置表示相关联的是可观察的地标。

新皮层中的网格细胞

现在让我们考虑一个接收来自指尖输入的新皮层的补丁,如图2B所示。我们的推测是,在那片皮层中的一些神经元代表了指尖在探索物体时的位置。当手指移动时,这些皮层网格细胞通过运动传出复制和路径集成更新其位置表示。物体,如咖啡杯,有一组相关的位置,就像环境,如房间,有一组相关的位置一样。与一些物体的位置相关联的是可观察到的特征。接收来自指尖输入的皮层区域在物体的位置空间中跟踪来自指尖的感觉输入的位置。通过运动和感觉,指尖皮质区学习物体的模型,就像网格细胞和位置细胞学习环境的模型一样。内嗅皮层跟踪身体的位置,而新皮层的不同区域独立地跟踪每个可移动感觉斑块的位置。例如,体感皮层的每个区域都追踪来自其相关身体部位的感觉输入的位置。这些区域并行运行,构建对象的并行模型。同样的基本方法也适用于视觉。视网膜的斑块类似于皮肤的斑块。视网膜的不同部位观察物体的不同位置。每一块接受视觉输入的皮层都会在被观察物体的位置空间中跟踪其视觉输入的位置。当眼睛移动时,视觉皮层列感知物体上的不同位置,并学习被观察物体的平行模型。

脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第2张图片我们现在已经讨论了我们建议的最基本方面:

(1)每个皮层柱都有执行类似网格细胞功能的神经元。这些皮层网格细胞的激活模式代表了柱输入相对于外部参考框架的位置。位置表示通过电机传出复制和路径集成进行更新。

(2)皮层列学习世界中物体的模型,类似于网格细胞和位置细胞学习环境的模型。通过皮层列学习的模型由一组对每个对象都是独特的位置表示组成,其中一些位置具有可观察到的特征。

一个基于位置的皮质计算框架

我们的提议表明,皮层列比之前假设的更强大。通过将输入与网格单元格派生的位置表示配对,单个列可以学习世界上复杂的结构模型(另见Lewis等人,2018)。在这一节中,我们将展示基于位置的框架如何让神经元学习我们所知道的新皮层能够做的丰富模型。

组合性对象

对象是由以特定方式排列的其他对象组成的。例如,通过记忆咖啡杯上每个位置的感觉来学习咖啡杯的形态是低效的。学习杯子的效率要高得多,因为它是以前学习过的物体的组成,如圆柱体和把手。考虑一个带有标志的咖啡杯,如图3A所示。商标存在于世界上的多个地方,它本身就是一个学习的“对象”。为了用标识来表示杯子,我们需要一种方法将一个对象(“标识”)与另一个对象(“杯子”)在相对位置关联起来。成分结构存在于世界上几乎所有的物体中,因此皮质列必须具有一种神经机制,将新物体表示为先前学习过的物体的排列。如何实现这种功能?
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第3张图片
我们提出,每个对象都与一组位置相关联,这些位置对对象来说是唯一的,并围绕对象组成一个空间。如果手指触碰带有标识的咖啡杯,那么代表手指位置的皮层网格细胞可以在某一刻代表手指在咖啡杯空间中的位置,在重新锚定后的另一刻代表手指在标识空间中的位置。如果标识附加到杯子上,那么在标识空间中的任何点和杯子空间中的等效点之间存在固定的、一对一的关系,如图3B所示。可以通过创建一个“位移”向量来实现在杯子上表示标识的任务,该向量将杯子空间中的任何点转换为标识空间中的等效点。

确定两个物体之间的位移类似于之前研究过的导航问题,具体来说,就是动物如何知道如何在环境中从a点到达b点,图3C。解决导航问题(确定同一空间中两点之间的位移)的机制也可以解决对象组合问题(确定两个不同空间中两点之间的位移)。

位移细胞

已经提出了几种使用网格单元解决点到点导航问题的解决方案。一类解决方案检测跨多个网格单元模块的两组活动网格单元之间的差异(Bush等人,2015年),另一类解决方案使用线性向前看探针,使用网格单元规划和计算轨迹(Erdem和Hasselmo, 2014年)。我们建议一个替代的但相关的解决方案。我们的建议还依赖于检测两组活动网格单元之间的差异,然而,我们建议这是在一个网格单元模块一个网格单元模块的基础上完成的。我们将这些细胞称为“置换细胞”(参见补充材料获得更详细的描述)。位移单元格类似于网格单元格,它们不能单独表示一个独特的位置。(在补充材料示例中,表示“向右2向上1”位移的位移单元格也会表示“向右5向上4”。)然而,多个位移单元格模块中的单元格活动表示唯一的位移,就像多个网格单元格模块中的单元格活动表示唯一的位置一样,如图3D所示。因此,一个单一的位移矢量可以代表咖啡杯上的标识在特定的相对位置。注意,位移矢量不仅表示两个物体的相对位置,而且是两个物体所独有的。复杂的物体可以用一组位移向量来表示,这些位移向量定义了物体的组成部分以及它们之间的相对排列方式。这是一种表示和存储对象结构的高效方法。

这种表示对象的方法允许分层组合。例如,杯子上的标志也是由子对象组成的,如字母和图形。将标识隐式地放置在杯子上的位移矢量携带了标识的所有子对象。该方法还允许递归结构。例如,标识可以包含一个带有标识的咖啡杯的图片。层次和递归构成不仅是物理对象的基本要素,也是语言、数学和其他智能思维表现形式的基本要素。其关键思想是,两个之前学习过的对象,甚至是复杂对象的身份和相对位置,都可以用一个位移向量有效地表示出来。

网格单元格和位移单元格执行互补操作

网格单元格根据当前位置和位移向量(即移动)确定新位置。位移单元确定从当前位置到达新位置所需的位移。

网格单元格:(位置1 + 位移 => 位置2)
位移单元格:(位置2 - 位置1 => 位移)

如果两个位置在相同的空间中,那么网格单元格和位移单元格对导航很有用。在本例中,网格单元根据起始位置和给定的移动预测新位置。位移单元格表示从位置1到位置2所需的移动。

如果两个位置位于不同的空间中(相对于两个不同的物体,这是相同的物理位置),那么网格单元格和位移单元格用于表示两个物体的相对位置。网格单元格根据给定的位移将一个对象空间中的位置转换为第二个对象空间中的等效位置。在这种情况下,位移单元格表示两个物体的相对位置。

我们认为所有皮层柱中都存在网格细胞和位移细胞。它们在基于位置的皮层处理框架中执行两种基本的和互补的操作。通过交替使用单个物体空间中的位置表示和两个不同物体空间中的位置表示,新皮层可以使用网格细胞和位移细胞来学习物体的结构,并生成操作这些物体的行为。

内嗅皮层中网格细胞的存在是有充分证据的。我们认为它们也存在于大脑皮层的所有区域。本文介绍了位移单元的存在预测。我们认为位移细胞也存在于新皮层的所有区域。考虑到位移细胞对网格细胞的补充作用,可能位移细胞也存在于海马复合体中。

对象的行为

物体可以表现出行为。例如,考虑图4中的订书机。订书机的顶部可以升起和旋转。这个动作改变了订书机的形态,但不会改变它的特性。即使订书机的整体形状发生了变化,我们也不会将打开和关闭的订书机视为两个不同的物体。物体的一部分相对于物体的其他部分的运动是物体的一种“行为”。物体的行为是可以学习的,因此它们必须在皮层柱的神经组织中表现出来。我们可以在基于位置的框架中表示行为,同样使用位移向量。订书机的上半部分和下半部分是订书机的两个组成部分。顶部和底部的相对位置用位移矢量表示,方法与标识和咖啡杯的相对位置相同。然而,与咖啡杯上的标志不同,订书机的两半可以相对移动。当订书机顶部向上旋转时,订书机顶部到底部的位移发生变化。因此,订书机顶部的旋转由一系列位移向量表示。通过学习这个序列,系统将学习对象的这种行为。
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第4张图片

打开和关闭订书机是不同的行为,但它们由相同的位移元素组成,只是顺序相反。这些有时被称为“高阶”序列。之前我们描述了一种在神经元层中学习高阶序列的神经机制(Hawkins和Ahmad, 2016)。这种机制,如果应用到位移模块,将允许学习、推断和回忆对象的复杂行为序列。

"what"和"where"处理

感觉处理发生在两个平行的新皮层区域,通常被称为“什么”和“哪里”通路。在视觉方面,“what”通路或腹侧通路的损伤与视觉识别物体能力的丧失有关,而“where”通路或背侧通路的损伤则与视觉识别物体能力的丧失有关,即使它已经被视觉识别。在其他感觉模式中也观察到类似的“what”和“where”通路,因此这似乎是皮质组织的一般原则(Goodale和Milner, 1992;Ungerleider和Haxby, 1994;改变路线,2015)。“what”和“where”的皮层区域有着相似的解剖结构,因此我们可以假设它们的工作原理相似。
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第5张图片

基于位置的皮层功能框架既适用于“是什么”处理,也适用于“在哪里”处理。简单地说,我们提出,“什么”区域和“哪里”区域之间的主要区别是,在“什么”区域,皮质网格细胞表示在物体的位置空间中非中心的位置,而在“哪里”区域,皮质网格细胞表示在身体的位置空间中以自我为中心的位置。图5显示了如何在“什么”和“哪里”区域生成代表运动的位移向量。所有人都知道的基本操作是,一个区域首先处理一个位置,然后再处理第二个位置。位移单元将决定从第一个位置移动到第二个位置所需的移动向量。在“what”区域(图5C)中,这两个位置位于一个对象的空间中,因此,位移向量将表示手指从对象上的第一个位置移动到对象上的第二个位置所需的移动。在这个例子中,“what”区域需要知道手指相对于杯子的位置,但它不需要知道杯子或手指相对于身体的位置。在“where”区域中,如图5B所示,这两个位置位于身体的空间中,因此,位移向量将表示如何从一个自我中心位置移动到第二个自我中心位置。“where”区域可以执行这个计算,而不知道第二个位置的对象可能是什么,也可能不是什么。更详细地讨论“where”区域中的处理超出了本文的范围。我们只想指出,通过假设不同的位置空间,可以使用类似的机制来理解“是什么”和“在哪里”处理。

重新思考等级制度,智力的千脑理论

新皮层的区域按等级组织(Felleman和Van Essen, 1991;Riesenhuber和Poggio, 1999;Markov et al., 2014)。人们普遍认为,当感官输入进入新皮层时,第一个区域会检测到简单的特征。这个区域的输出被传递到第二个区域,第二个区域将简单的特征组合成更复杂的特征。这个过程不断重复,直到在层次结构的多个级别上,单元格响应完整的对象(图6A)。新皮层作为特征提取器的层次结构的这种观点也是许多人工神经网络的基础(LeCun et al., 2015)。
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第6张图片
我们认为皮质柱比目前认为的更强大。每个皮质列学习完整对象的模型。他们通过将输入与网格单元派生的位置相结合,然后对移动进行集成来实现这一目标(参见Hawkins等人,2017;刘易斯等人,2018年了解详情)。这就提出了对皮层层次结构的修正解释,即在每个层次层次学习完整的对象模型,并且每个区域包含多个对象模型(图6B)。

区域之间的前馈和反馈投射通常连接到层次结构的多个层次(图6中只显示了一个层次的连接)。例如,视网膜投射到LGN中的丘脑中继细胞,然后投射到皮层的V1、V2和V4区域,而不仅仅是V1。这种形式的“关卡跳过”是规则,而不是例外。因此,v1和V2都在某种程度上对视网膜输入起作用。从LGN到V2的连接更加发散,说明V2在不同的空间尺度上学习模型。我们预测,V2中皮层网格细胞的空间尺度同样会比V1中更大。输入到一个区域的收敛水平,与其网格单元的空间尺度相匹配,决定了该区域可以学习的对象大小的范围。例如,想象一下识别字母表中的印刷字母。在V1中,且仅在V1中可以识别最小大小的字母。直接输入到V2将缺乏所需的特征分辨率。但是,较大的打印字母在V1和V2中都可以识别,甚至更大的字母在V1中可能太大,但在V2中可以识别。分层处理仍然存在。我们所建议的是,当一个区域(如V1)将信息传递给另一个区域(如V2)时,它不是传递未分类特征的表示,而是传递完整对象的表示,如果可以的话。如果像Hawkins等人(2017)提出的那样,用人口编码来表示对象,这将很难在经验上观察到。单个神经元会参与许多不同的物体表征,如果单独观察,它们似乎代表感官特征,而不是物体。皮质列可以学习的对象数量很大,但有限(Hawkins et al., 2017)。不是每一列都能学习到每一个对象。系统容量的分析需要对层级流有更深入的理解,这超出了本文的范围。

有许多皮质-皮质投影与纯分层处理不一致(图6B,绿色箭头)。例如,在左右半球的区域之间有长距离的投射(Clarke和Zaidel, 1994),在不同感觉模式的区域之间有无数的连接,甚至在层次结构的最低水平(Schroeder和Foxe, 2005;Driver和Noesselt, 2008;Suter和Shepherd, 2015)。这些连接可能不是分层的,因为它们的轴突终止于与前馈或反馈输入相关的细胞层外的细胞。据估计,实际存在的所有可能的区域间联系中有40%是存在的,这比纯层次结构所暗示的要大得多(Felleman和Van Essen, 1991)。这些远程非等级连接的目的是什么?在Hawkins等人(2017)中,我们提出在柱的某些层(如L4和L6)中的细胞活性随着每一个新的感觉而变化,而在其他层(如L2/3)中,代表观察到的“对象”的细胞活性在变化的输入中是稳定的。我们展示了“对象”层中的远程关联连接如何允许多个列对它们当前观察的对象进行投票。例如,如果我们看到并触摸一个咖啡杯,就会有许多柱同时观察杯子的不同部分。这些列将在视觉和躯体感觉层次的多个层次。每一列都有独特的感官输入和独特的位置,因此,代表位置和输入的细胞之间的远程连接是没有意义的。然而,如果列正在观察相同的对象,那么对象层中单元格之间的连接允许列快速停留在正确的对象上。因此,如果两个区域经常同时观察同一物体,那么任何两个区域之间的无等级连接,甚至是不同感觉模式下的主感觉区和次感觉区之间的无等级连接是有意义的(详见Hawkins et al., 2017)。

关于知觉的一个经典问题是,新皮层如何将不同的感官输入融合到一个感知对象的统一模型中。我们认为新皮层实现了一种分散的传感器融合模型。例如,没有一个单一的咖啡杯模型包含了杯子的感觉和外观。相反,一个杯子有上百种型号。每个模型都是基于不同感觉模式下的一个独特的感觉输入子集。将会有基于视觉输入的多个模型和基于体感输入的多个模型。每个模型都可以通过观察相关传感器的运动输入来推断杯子。然而,远程非层次连接允许模型快速地就底层对象的身份达成一致,通常是在单一的感觉中。

仅仅因为每个区域学习对象的完整模型并不排除分层流。主要观点是,大脑皮层有100个,可能是1000个,世界上每个物体的模型。观察到的特征的集成不仅发生在层次结构的顶部,它发生在层次结构的所有级别的每一列中。我们称之为“智力的千脑理论”。

讨论

克里克(1979)写了一篇题为“思考大脑”的文章。他在书中写道:“尽管我们不断积累详细的知识,但人类大脑是如何工作的仍是一个非常神秘的问题。”他假设,在未来几年里,我们无疑会积累更多关于大脑的数据,但这可能并不重要,因为“我们对这类问题的整个思考方式可能是错误的。”他的结论是,我们缺乏一个“理论框架”,在这个框架中,我们可以解释实验结果,也可以应用详细的理论。克里克写了这篇文章近40年后,他的观察在很大程度上仍然有效。

可以说,我们在建立理论框架方面取得的最大进展是基于海马复合体中的位置细胞和网格细胞的发现。这些发现为动物如何学习环境地图以及它们如何使用这些地图在世界中导航提供了一个框架。这个框架的成功引起了人们对内嗅皮层和海马体研究的兴趣。

在这篇论文中,我们提出了一个理解新皮层的理论框架。我们提出的皮层框架是由网格细胞和位置细胞建立的框架的衍生物。用于学习环境结构的机制现在被应用于学习对象的结构。用来追踪动物在其环境中的位置的机制,现在被应用于追踪肢体和感觉器官相对于世界上物体的位置。这个类比能走多远还不确定。在海马体、下丘脑和内嗅皮层形成的回路中,有网格细胞(Hafting等人,2005)、位置细胞(O 'Keefe和Dostrovsky, 1971;O 'Keefe和Burgess, 2005),头部方向细胞(Taube等,1990;Giocomo等,2014;Winter等人,2015年)、边界细胞(Lever等人,2009年)、对象载体细胞(Deshmukh和Knierim, 2013年),以及其他,以及许多表现出这些组合特性的结合体细胞(Sargolini等人,2006年;布兰登等,2011;Stensola等,2012;Hardcastle et al ., 2017)。我们目前正在探索的想法是,新皮层包含的细胞具有与海马体复合体中发现的各种细胞相同的功能。这些细胞的特性只有在一个清醒的、积极感知学习对象的动物身上才能被检测到。Long和Zhang(2018)最近的工作表明这可能是正确的。

方向

在内嗅皮层和大脑的其他地方,发现了头向细胞(Taube et al., 1990;Sargolini等人,2006;布兰登等,2011;Giocomo等,2014;温特等,2015;Raudies等人,2016)。这些细胞代表了动物相对于环境的异心定向。通过感觉推断你的位置,预测你移动后的感觉,以及决定如何移动以到达一个新位置,这些都需要了解你当前相对于环境的方向。在sselmo(2009)和Hasselmo等人(2010)回顾的模型中,头部方向单元对于在空间位置之间的精确过渡是至关重要的。同样的定向需求存在于整个大脑皮层。例如,只知道手指在咖啡杯上的特定位置是不够的。手指也有相对于杯子的方向(它旋转的方式和接触时的角度)。预测手指接触杯子时的感觉,或者到达杯子上的新位置需要什么动作,除了需要知道手指的位置之外,还需要知道手指相对于杯子的方向。因此,我们预测在每个皮质柱中都有一个方向的表征,它执行类似于海马复合体中的头部方向细胞的功能。定向在大脑皮层中是如何表现的尚不清楚。可能有一组定向细胞,每个细胞都有一个偏好的方向,类似于头部定向细胞,但我们没有发现任何证据。或者,方向可以通过人口编码表示,这将更难以检测。例如,在体感区域,定向可以通过激活自我中心定向探测器的稀疏子集来表示(Hsiao等人,2002;Bensmaia等人,2008;Pruszynski和Johansson, 2014)。定向是如何表示的,以及如何与皮层网格细胞和位移细胞相互作用,这在很大程度上是未知的。这是我们正在积极研究的一个领域。

预测

皮质功能的许多理论背后一个长期存在的原则是预测(Lashley, 1951;Rao和Ballard, 1999;Hawkins和Blakeslee, 2004;洛特等人,2018)。通过表示传感器的位置,皮质柱可以在每个物体的位置空间中关联感官信息,类似于位置细胞将感官信息与位置关联的方式(O 'Keefe and Nadel, 1978;Komorowski et al., 2009)。这使专栏能够构建强大的预测模型。例如,当你的手指从杯子底部移动到顶部时,不管杯子如何相对于传感器旋转,它都可以预测感觉。使用位移单元格表示复合对象使列能够归纳和预测感觉,即使在遇到新对象时也是如此。例如,假设我们看到一个有熟悉标志的杯子(图3A),而标志的部分是模糊的。一旦一个列识别了标识和杯子,它就可以预测整个标识与杯子的关系,即使这个组合对象是新的。如果没有明确的位置表示,构建这样的预测模型将会困难得多。在之前的论文中,我们提出了可以作为预测网络神经基础的树突机制(Hawkins和Ahmad, 2016;Hawkins等人,2017)。总的来说,预测是本文讨论的大部分框架的基础。

注意力

基于位置的大脑皮层处理框架的一个关键元素是大脑皮层区域在物体空间之间快速切换的能力。要知道咖啡杯上有一个标志,我们需要在杯子和标志之间交替注意。随着注意力的每一次转移,皮质网格细胞会重新锚定到新参与的物体的位置空间。这种转移到一个新的对象空间是必要的,以表示两个对象之间的位移,如标识和杯子。不断地在周围的物体之间转移注意力是很正常的。对于每一个新参与的对象,皮质网格细胞在新对象的空间中重新锚定,而位移细胞表示新对象相对于先前参与的对象的位置。注意力的变化与传感器的运动、网格细胞的重新锚定,以及人们普遍认为的丘脑的反馈信号密切相关(克里克,1984;McAlonan et al., 2006),大概是为了选择一个输入子集进行处理。人们对这些元素如何协同工作知之甚少,这是一个有待进一步研究的领域。

位置代码的唯一性

我们的建议是基于这样一种想法:一组网格单元模块可以编码大量的惟一位置。有一些观察表明,网格细胞本身可能无法形成足够的唯一代码。例如,因为每个网格单元在相当大的物理空间区域显示活动(Hafting等人,2005年),网格单元模块中细胞的激活不是非常稀疏。稀疏性有助于创建易于识别的惟一代码。稀疏性的缺乏可以通过对更多网格单元模块的活动进行采样来克服,但我们对网格单元模块的大小以及有多少可以实际采样还知之甚少(Gu等人,2018年)已经表明,网格单元模块是由独立激活的更小的子单元组成的,这也将增加网格单元的表示能力。另一个影响能力的因素是结膜细胞。内嗅皮层的结膜细胞多于单纯的网格细胞。结膜细胞表现出某种“网格”+定向和/或其他因素的组合(Sargolini et al., 2006)。连接细胞可能比纯网格细胞具有更稀疏的激活,因此将是形成一组唯一位置代码的更好基础。如果新皮层有类似结膜细胞的细胞,它们也可能在位置编码中发挥作用。对于网格细胞、定向细胞和连接细胞是如何协同工作的,我们还没有足够的知识来说明位置是如何在新皮层中编码的。随着我们对大脑皮层中位置编码的了解越来越多,记住这些可能性是很重要的。

新皮层中的网格细胞和位移细胞在哪里?

新皮层通常分为六层,与表面平行。有几十种不同的细胞类型,因此,每一层都包含多种细胞类型。一些证据表明,皮层网格细胞位于L6[特别是L6皮质-皮质神经元(Thomson, 2010)],而位移细胞位于L5(特别是L5厚簇神经元)(图7)。
脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第7张图片脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架_第8张图片L4和L6之间不寻常的连通性是证明L6中存在皮层网格细胞的一个证据。L4是主要输入层。然而,前馈输入在L4细胞上形成的突触不到10% (Ahmed et al., 1994,1997;Sherman和Guillery, 2013),而L4细胞上约45%的突触来自L6a皮质-皮质神经元(Ahmed et al., 1994;Inzegger et al., 2004)。类似地,L4细胞在相同的L6细胞上产生大量的突触(McGuire et al., 1984;宾辛格等人,2004;Kim et al., 2014)。此外,L6和L4之间的联系在传播上相对狭窄(Binzegger et al., 2004)。L6和L4之间的狭窄连接让人联想到MEC中的网格细胞和海马中的位置细胞之间的拓扑对齐的双向连接(Rowland et al., 2013;Zhang et al., 2013)。我们之前展示了L6和L4之间的互易连接如何通过传感器的运动来学习物体的结构,如果L6代表物体空间中的一个位置(Lewis et al., 2018)。对于以这种方式学习物体结构的柱,需要接收感官输入的细胞和表示位置的细胞之间的双向连接。L6a是已知的唯一一组满足这一要求的细胞。此外,网格单元使用电机输入来更新它们的表示,以实现路径集成。实验显示L6有明显的运动投影(Nelson et al., 2013;Leinweber et al., 2017)。不幸的是,目前关于新皮层中网格细胞存在的实验证据无法说明哪些皮层层包含网格细胞。在不久的将来,应该可以通过实验来确定这一点。我们预测他们会在L6。

位移细胞存在于L5的主要证据还是连通性。L5细胞的一个子集(被称为“L5厚簇细胞”),据我们所知,存在于所有的皮层区域,投射到与运动行为有关的大脑区域的皮层下。(例如,视觉皮层的L5细胞投射到控制眼球运动的上丘。)这些L5细胞是大脑皮层的运动输出细胞。然而,同样的L5细胞将轴突的一个分支发送到丘脑中继核,然后投射到等级较高的皮层区域(Douglas and Martin, 2004;Guillery和Sherman, 2011;Sherman和Guillery, 2011)。很难理解为什么相同的L5单元可以同时作为电机输出和前馈输入到其他区域。Guillery和Sherman提出的一种解释是,L5细胞代表运动指令,前馈L5投影可以被解释为运动指令的传出副本(Guillery和Sherman, 2002,2011)。

我们提供了另一种可能的解释。L5细胞是位移细胞,它们交替表示运动(通过皮层下发送),然后表示合成物体(通过丘脑中继细胞发送到更高的区域)。如上所述,当比较同一空间中的两个位置时,位移单元格将表示一个移动向量,当比较两个不同空间中的两个位置时,位移单元格将表示复合对象。这两个快速变化的表示可以在它们的目的地消除歧义
通过振荡周期的相位或生理放电模式(Burgess等人,2007年;Hasselmo, 2008;Hasselmo和Brandon, 2012)。尽管我们还远远没有完全理解不同的细胞层是做什么的以及它们是如何一起工作的,但基于位置的框架提供了一个重新审视大量皮质解剖学和生理学文献的机会,并在这个问题上取得进展。

基于位置的高水平思维和智力框架

我们已经用感官推理的例子描述了我们的基于位置的框架。考虑到所有皮层区域的解剖结构都非常相似,很有可能新皮层所做的一切,包括语言和其他高级思维形式,都将建立在相同的基于位置的框架之上。为了支持这一观点,目前关于网格细胞存在于新皮层的经验证据是从执行所谓的“认知任务”的人类身上收集的,它是在远离直接感觉输入的皮层区域被检测到的(Doeller et al., 2010;Jacobs等,2013;Constantinescu et al., 2016)。

基于位置的框架可以应用于物理结构,如杯子,和抽象概念,如数学和语言。皮层列基本上是一个学习预测模型的系统。模型是从导致输入变化的输入和运动中学习的。成功的模型是能够根据当前状态和预期运动预测下一个输入的模型。然而,皮质柱的“输入”和“运动”不必与物理实体相对应。对一列的“输入”可以来自视网膜,也可以来自大脑皮层的其他区域,这些区域已经识别了一个视觉对象,如一个单词或一个数学表达式。“运动”可以表示眼睛的运动,也可以表示抽象的运动,如动词或数学运算符。

成功学习预测模型需要发现对象空间的正确维度,学习运动如何更新该空间中的位置,并将输入特征与对象空间中的特定位置联系起来。这些属性既适用于感官知觉,也适用于高级思维。想象一下,一根柱子试图通过视网膜的视觉输入和手指的运动输入来学习一个杯子的模型。这将会失败,因为手指所穿过的位置不会映射到物体的特征空间上,这是由眼睛输入的变化所证明的。类似地,当你试图理解一个数学问题时,如果你使用一个算子来处理一个方程,你可能会失败,而使用另一个算子则会成功。

大脑皮层中的网格细胞表明,所有的知识都是在位置和位置空间的背景下学习和存储的,而“思考”就是在这些位置空间中移动。在了解大脑皮层如何执行认知功能的细节之前,我们还有很长的路要走。然而,我们相信,基于位置的框架不仅将是解决这些问题的核心,而且将提供解决方案。

结论

人们有时说神经科学“数据丰富,理论匮乏”。这一概念在大脑皮层中尤其正确。我们缺乏的不是经验数据,而是一个理论框架,可以弥合感知、认知和智力的异质能力与新皮层中观察到的同质回路之间的差距。目前我们所拥有的最接近这种框架的是分层特征提取,但这被广泛认为是不够的。

发展新皮层功能理论的一种方法是基于详细的解剖数据建立皮质柱的硅内模型(Helmstaedter等人,2007;Markram等,2015)。该方法从解剖学入手,希望通过模拟皮质柱来发现理论原理。我们用了不同的方法。我们从一个我们知道的新皮层执行的详细功能(如感觉运动学习和推理)开始,我们推导出执行这些功能所需的神经机制(如代表位置的细胞),然后将这些神经机制映射到详细的生物数据上。

基于这种方法,本文提出了一个新的框架来理解新皮层是如何工作的。我们认为网格细胞在大脑皮层中无处不在。皮层网格细胞在被观察物体的参考坐标系中追踪输入到新皮层的位置。我们提出了一种新的神经元——位移细胞的存在,它是网格细胞的补充,并且同样存在于整个新皮层中。这个框架展示了一小块大脑皮层如何能够表现和学习物体的形态,物体是如何组成其他物体的,以及物体的行为。该框架也导致了对新皮层如何整体工作的新解释。新大脑皮层不是通过一系列特征提取步骤来处理输入,从而在层次结构的顶端识别物体,而是由1000个模型组成,并行地、分层地运行。

自省有时可以揭示被更客观的实验技术遗漏的基本真相。在我们每天的生活中,我们会感知到成千上万的物体,比如树木、印刷的和口语的文字、建筑物和人。一切都在一个位置被感知。当我们注意到每一个物体时,我们感知到我们与这些物体之间的距离和方向,我们感知到它们彼此之间的相对位置。位置和距离的感觉是知觉固有的,它的发生无需努力或延迟。不言而喻的是,当我们连续注意物体时,大脑必须对物体的位置和物体之间的距离有神经表征。我们的主张的新奇之处在于,这些位置和距离是在新皮层的任何地方计算出来的,它们是皮层功能、知觉和智力的主要数据类型。

作者贡献

JH与ML、MK、SP和SA一起构想了神经科学的总体理论和映射。JH和SA一起完成了大部分的手稿。ML、MK和SP参与了手稿的撰写、编辑和修改。

资金

Numenta是一家私人控股公司。它的资金来源是独立的投资者和风险投资家。

致谢

我们感谢审稿人的许多有用的和详细的评论,这些评论大大改进了整个稿件。我们感谢David Eagleman、Weinan Sun、Michael Hasselmo和Mehmet Fatih Yanik对本文的反馈和帮助。我们还要感谢Numenta多年来的众多合作者,特别是Donna Dubinsky、Christy Maver、Celeste Baranski、Luiz Scheinkman和Teri Fry。我们还注意到,本文的一个版本已发布到预印本服务器bioRxiv (Hawkins等人,2018年)。

补充材料

本文的补充材料可以在网上找到: https://www.frontiersin.org/articles/10.3389/fncir.2018.00121/full#supplementary-material

参考文献

Ahmed, B., Anderson, J. C., Douglas, R. J., Martin, K. A., and Nelson, J. C. (1994).
Polyneuronal innervation of spiny stellate neurons in cat visual cortex. J. Comp.
Neurol. 341, 16–24. doi: 10.1002/cne.903410103



你可能感兴趣的:(人工智能,算法,人工智能,深度学习)