人类如何学习和表征网络?

人类以一系列离散的项目接收来自周围世界的信息——从语言中的单词或音乐中的音符到书籍和互联网网站中的抽象概念。为了模拟他们的环境,从年轻时起,人们就被要求学习由这些项目(节点)形成的网络结构以及它们之间的联系(边)。但是,当人类只经历单个项目的序列时,他们如何发现网络的大规模结构?此外,人们对这些网络的内部地图和模型是什么样的?在这里,我们介绍图形学习,这是一个不断发展和跨学科的领域,研究人类如何学习和表示他们周围世界的网络。具体来说,我们回顾了在理解人们如何发现项目序列背后复杂的关系网方面的进展。我们首先描述已建立的结果,这些结果表明人类可以检测到精细尺度的网络结构,例如项目之间转换概率的变化。接下来,我们将介绍直接控制转移概率差异的最新实验,证明人类行为关键取决于网络的中尺度和宏观尺度特性。最后,我们介绍了人类图形学习的计算模型,这些模型对网络结构对人的行为和认知的影响做出了可测试的预测。我们始终强调图形学习研究中的开放性问题,这些问题需要认知科学家和网络科学家的创造性见解。

简述

我们对世界的体验被离散的项目和事件打断,所有这些都被一个隐藏的力量、原因和关联网络联系在一起。正如导航需要一个人的物理环境的心理地图,预期、计划、感知和交流都取决于人们学习连接其环境中的项目和事件的网络结构的能力。

我们推断和表现复杂关系的能力也使人类能够构建一系列令人印象深刻的网络系统,从语言和音乐到社交网络、互联网以及构成艺术和科学的概念网络。此外,认知方面的个体差异,例如由学习障碍和年龄驱动的差异,会导致人们能够构建的网络结构类型的差异。因此,研究人类如何学习和表示网络,不仅会让我们了解我们是如何执行许多基本认知功能的,还会让我们了解我们周围世界中网络的结构和功能。

在这里,我们提供了图形学习领域的简要介绍,涵盖了最近开发的实验技术和基于网络的模型、理论和直觉,以研究网络结构对人类认知和行为的影响。鉴于该领域的高度跨学科性质——它借鉴了认知科学和语言学的实验方法,并建立在网络科学、信息论和统计学习的计算技术之上——我们旨在通过简单的激励性例子提供一个易于理解的概述。

我们特别关注理解人们如何揭示序列中项目之间的联系结构,如口语和书面语中的音节和单词,书籍和课堂讲座中的概念,或音乐发展中的音符。我们首先讨论实验结果,证明人类擅长检测项目之间转换概率的差异,以及这种转换如何连接和组合形成编码整个序列大规模结构的网络。然后,我们介绍了最近的实验,这些实验通过直接控制转移概率的差异来测量网络结构对人类行为的影响,随后描述了已经提出来解释这些网络影响的计算模型。最后,我们强调了一些源于图学习最新进展的开放研究方向,包括对现有图学习范式的重要概括和对理解现实世界网络的结构和功能的直接影响。

1. 学习转移概率

当人类在环境中导航并积累经验时,大脑的主要功能之一是推断支配因果的统计关系。给定一系列项目,也许是最简单的统计数据

对学习者来说,是从一个项目到另一个项目的转换频率。自然,致力于理解人类如何从环境中提取统计规律的统计学习领域主要集中在这些简单的统计上。例如,考虑口语,其中不同的音节在连续的流中从一个过渡到另一个,单词之间没有停顿或分界。人们如何分割这种连续的数据流,识别一个单词从哪里开始,另一个从哪里开始?正如研究已经有力地证实的那样,答案在于音节之间过渡的统计特性。

萨夫兰等人最初证明了在连续语音中检测单词的能力。让婴儿接触四个假词序列,每个由三个音节组成(图。1A)。每个单词内的音节顺序保持一致,单词内转换概率为1.然而,单词的顺序是随机的,单词之间的转换概率为1/3.婴儿能够可靠地检测到音节转换概率的这种差异,从而为语言习得过程中的单词识别提供了一种令人信服的机制。这种实验范式已经被推广到研究其他领域的统计学习,刺激范围从颜色和形状到视觉场景和物理行为。事实上,揭示转移概率变化的能力现在被认为是人类学习的一个核心和普遍特征。

图1 构词语言中音节之间的转移

2. 学习网络结构

虽然项目之间的个别连接提供了关于系统结构的重要信息,但它们并不讲述整个故事。连接还结合并重叠形成复杂的网络,表征我们环境的高阶结构。为了研究这些结构,科学家们越来越多地转向网络科学的语言,将项目概念化为网络中的节点,边缘定义了它们之间可能的联系。然后,你可以通过这个底层网络来表示一系列项目,例如口语中的音节流。这种观点在人工语法学习的研究中特别有用,其中人类受试者的任务是推断语法规则(即,字母和单词之间的转换网络)。

2.1 学习局部结构

网络最简单的属性是与单个节点和边相对应的属性,例如边的权重,它决定了两个节点之间的连接强度,以及节点的程度或其连接数量。

重要的研究现在已经证明,人们能够学习单个节点和边缘的局部网络属性,例如前一节中音节之间的转移概率。为了说明网络结构对人类行为的影响,我们考虑了最近开发的实验范式,同时注意到使用这种方法的变体也获得了类似的结果。具体来说,每个受试者都被显示为一系列刺激,刺激的顺序由底层过渡网络上的随机行走来定义(图。2A)。受试者被要求通过执行一个动作来对每个刺激做出反应(为了避免混淆,对网络中节点的刺激分配在受试者之间是随机的)。通过测量受试者对刺激的反应速度,可以推断出他们对网络结构的预期:快速反应反映了强烈预期的转变,而慢速反应反映了微弱预期(或令人惊讶)的转变。

直觉上,人们应该预期受试者对代表更可能的过渡的边缘的预期会增加(因此反应时间会减少)。为了检验这个预测,我们注意到,对于一个未加权的、无向的随机行走网络中,从一个节点i到相邻节点j的转移概率由Pij=1/ki给出,其中ki是节点i的度。与直觉一致,研究人员表明,人们的反应时间与先前刺激的程度呈正相关(图。2B)。

图2 人类行为取决于网络拓扑

2.2 学习中尺度结构

网络的中尺度结构反映了节点组和边组的组织特性。一个这样的属性是集群化,或者具有公共邻居的一对节点自己形成连接的趋势。这种趋势在社交网络中明显可见,有共同朋友的人本身更有可能成为朋友。

2.3 学习全局结构

除了它们的局部和中尺度特征之外,网络还具有依赖于节点和边缘的整个体系结构的全局属性。也许研究得最充分的全局属性是小世界结构,其中每个节点只需少量步骤就能连接到每一个其他节点。虽然小世界描述了整个网络的结构,但也有将单个节点与网络的全局拓扑相关联的度量,包括中心性(衡量节点在调解长距离连接中的作用)、可通信性(衡量连接一对节点的路径数量)和核心性(衡量节点在网络中嵌入的深度)。像这样的全球性措施最近被证明会影响人类的学习和认知,这表明人类对其环境中网络的全球结构很敏感。例如,在上述反应时间实验中(图。2A),人们反应更快,因此能够更好地预测低中心性的节点。

2.4 控制局部结构差异

为了将大规模网络结构的影响与局部结构的影响区分开来,最近的研究通过关注特定的网络族直接控制了转移概率的差异。为了确保所有的转移具有相等的概率,可以简单地关注具有恒定度但变化拓扑的图。例如,考虑图1所示的模图和点阵图。2C。由于两个网络都有恒定的度4(因此所有边的转移概率为1/4),网络不同部分之间或两个网络本身之间的任何行为或认知变化都必须源于网络的全局拓扑。这种方法证明了人们能够检测模块化图中集群之间的转换(图。2C)并且这些簇间转变相对于簇内转变产生不同的神经活动模式。回到反应时间实验(图。2A),结果显示受试者对簇内转变的反应比簇间转变更快(因此能够更好地预测)(图。2D)。此外,相对于点阵图,人们对模块图的反应时间总体上减少了(图。2D)。

这些结果,结合类似实验的发现,证明了人类对中尺度和全局网络拓扑的特征是敏感的,即使在控制了局部结构的差异之后。因此,正如最初在开创性的统计学习实验中所证明的那样,人类不仅能够学习个体转移概率(图。1),它们也能够揭示在我们的环境中发现的一些复杂结构。但是人们如何从过去的观察中了解网络的大规模特征呢?

3. 人体图形学习建模

跨越认知科学、神经科学、语言学和统计学习的实验已经证实,人类的行为和认知依赖于其环境中网络的中尺度和全局拓扑。为了理解人们如何检测到这些全局特征,并对人类行为做出定量预测,人们需要计算模型来描述人类如何根据过去的经验构建网络的内部表示。在这里,我们再次关注于理解人们如何学习观察到的项目序列背后的过渡网络,例如句子中的单词、书中或课堂讲座中的概念或音乐进程中的音符。有趣的是,人类系统地偏离了最准确,也可能是最简单的学习规则。

为了使这些想法具体化,考虑由转移概率矩阵P描述的项目序列,其中Pij表示一个项目i转移到另一个项目j的条件概率。给定观察到的项目序列,可以想象通过简单地将i转变为j的次数(用nij表示)除以i出现的次数来估计Pij。事实上,这不仅可能是最简单的估计,也是对过去观测的转移概率的最准确(或最大似然)估计。最大似然估计的一个重要特征是它给出了真实转移概率的无偏近似;也就是说,估计的转移概率Pij关于它们的真实值Pij均匀分布,与网络的大规模结构无关。然而,我们已经看到,人们的行为和认知系统地依赖于中尺度和全局网络属性,即使在转移概率为常数时。但是如何将不同距离的过渡结合起来,让人们了解网络的结构呢?

为了回答这个问题,考虑函数f (t)的不同选择是有帮助的。通常,假设f (t)正在减少,使得长距离关联对人的网络表示的贡献更弱。如果f (t)是以t =1为中心的δ函数(图。3A),然后学习者关注长度为1的过渡。在这种情况下,人们只需执行最大似然估计,从而得到真实过渡结构p的无偏估计。相反,如果f (t)在所有时间尺度t ≥1上是一致的,那么学习者同等地加权所有距离的转变(图。3C),并且该估计与真实的过渡结构p失去了任何相似性。然而,重要的是,对于在中间距离上组合过渡的学习者(图。3B),我们发现大规模的特征网络有机地成为焦点。

总之,这些结果表明,人们检测网络的中尺度和全局结构的能力不仅来自于他们学习个体边缘的能力,还来自于他们跨空间、时间和拓扑尺度关联项目的能力。

图3 中尺度和全局网络特征出现在长距离联系

4.  图形学习的未来

图形学习的过去和现在的进展激发了认知科学、神经科学和网络科学交叉的新研究问题。在这里,我们强调了一些重要的方向,在讨论图学习对我们理解现实世界过渡网络的结构和功能的影响之前,先从现有图学习范式的可能推广开始。

4.1 扩展图形学习范例

大多数图形学习实验,包括图1和图2中讨论的实验。参考图1和图2,向每个受试者呈现一系列刺激,这些刺激由(可能是加权和定向的)过渡网络上的随机行走定义。等效地,在随机过程的语言中,每个序列代表一个平稳的马尔可夫过程。尽管随机游走在图学习的研究中提供了一个自然的起点,但它们也受到三个主要假设的约束:1)底层的过渡结构随着时间的推移保持静态(平稳性),2)未来的刺激仅取决于当前的刺激(马尔可夫属性),以及3)序列是预先确定的,没有来自观察者的输入。未来的图学习实验可以通过系统地概括现有的图学习范式来测试这些约束的边界。

4.2 平稳性

虽然大多数图形学习实验集中在静态过渡网络上,但人类在现实世界中遇到的许多网络要么在时间上进化,要么与环境中的其他网络重叠。因此,未来的实验应该研究人类检测进化网络的动态特征的能力,而不是简单地调查人们学习单个网络的能力(图。4A)或区分多个网络的不同特征。早期的结果表明,当观察一系列从一个过渡结构转移到另一个过渡结构的刺激时,人们对第一个网络的习得表征会影响他们对第二个网络的反应,但这些影响会随着时间的推移而减弱。这种对网络结构的逐渐“忘却”为未来的研究提出了一个重要问题:与其研究网络属性如何促进学习——这一直是大多数图学习研究的焦点——我们能确定哪些属性使网络难以忘却吗?

图4 图学习算法的一般化

4.3 马尔可夫性

到目前为止,与大多数现有的图形学习研究保持一致,我们只关注下一个刺激只依赖于当前刺激的序列;也就是说,我们关注的是服从马尔可夫特性的序列。然而,现实世界中几乎所有的刺激或项目序列都涉及长程相关性和依赖性(图。4B)。因此,未来的研究可以探讨远距离关联的学习是否能够使人们在日常生活中推断序列的非马尔可夫特征。

4.4 信息搜索

最后,尽管人类观察到的许多序列是在没有观察者输入的情况下规定的,但也有一些环境,在这些环境中,人们有确定序列结构的权力。例如,在网上冲浪或追踪科学引文时,人们通过底层超链接和引文网络选择路径。这样,人们就能够寻找关于网络结构的信息,而不是简单地让信息呈现给他们(图。4C)。

4.5 研究现实世界的网络结构

除了揭示人类的行为和认知,图学习的研究也有望为现实世界网络的结构和功能提供见解。事实上,人类的认知和网络之间存在着密切的联系:当人们依赖网络系统来执行广泛的任务时,从使用语言进行交流(图。5A)和音乐,通过科学和互联网存储和检索信息(图。5B),这些网络中的许多已经与人类一起进化或由人类明确设计。因此,正如人类善于学习网络的结构一样,人们可能会怀疑某些网络是为了支持人类的学习和认知而构建的。

认知可能约束网络结构的观点最近揭示了一些现实世界网络的组织属性,包括语义和单词共现网络展示的小世界结构和幂律度分布)以及维基百科上概念之间连接的无标度结构。有趣的是,许多与人类互动的网络有两个明显的结构特征:1)它们是异质的(图。5C),其特征在于存在具有异常高度数的中枢节点,以及2)它们是模块化的(图。5D),其特征是存在紧密相连的簇。异构性和模块化共同代表了分层组织的两个决定性特征,现在已经在大量的人造网络中观察到了这一点。这些网络共有的结构特性会不会源于它们共同的功能目的:促进人类的学习和交流?

图5 真实转移网络呈现出层级结构

5. 结论

理解人们如何学习和表现支配他们环境的复杂关系仍然是人类认知研究中最大的开放问题之一。在数十年的认知科学和统计学习研究中,研究了人类如何检测单个项目的局部属性以及它们之间的联系,现在确凿的证据表明,人类的行为、认知和神经活动严重依赖于项目和联系的大规模结构。通过将我们环境中的项目和联系铸造成网络中的节点和边缘,科学家们现在可以在一个统一和有原则的框架中探索网络结构对人类认知的影响。

尽管该领域的实验和数值基础已经奠定,图形学习仍然是一个萌芽的研究领域,提供了丰富的跨学科机会。来自认知建模技术(图。3)现有实验范式的扩展(图。4)应用于现实世界网络的研究(图。5),图形学习已经准备好改变我们对人类认知、复杂网络以及它们相交的无数方式的思考方式。

你可能感兴趣的:(人类如何学习和表征网络?)