Human category learning 2.0

Human category learning 2.0

【总述】本文建立在人类具有多种类别学习系统(multiple category-learning systems)的基础上,总结了关于各系统之间如何交互、不同系统的神经网络介导、系统的自动化程度以及纹状体和皮层在类别学习中的作用。

【定义】人类的类别学习系统有四种:基于规则(rule-based,RB)信息集成(information-intergration,II)原型失真prototype-distortion)非结构化unstructured)的类别学习。RB是使用简单分类规则的系统(如长物体和短物体属于不同类),并可以通过逻辑推理来学习分类。II是需要整合不同刺激的知觉信息进行分类的系统,其策略不能用语言表达。原型失真的类别示例是通过将类别的原型随机变形创建的。非结构化的类别示例是任意定义的。它们依靠不同系统介导。本文主要探讨前两种。

COVIS理论假设了两个竞争学习系统——显式(RB)和程序化学习(II)。显式系统指类别学习中有可以用语言表达出来的规则,该系统由前额叶皮层,前扣带回,尾状核头部以及海马和其他内侧颞叶结构的神经网络介导。程序系统指有无法表达的内隐分类规则,通过不断反馈来强化分类学习依赖于纹状体和皮质-纹状体突触中多巴胺介导


1、系统之间的相互作用

【问题】探究系统之间(RB、II)的竞争是否存在以及处于什么阶段。

【假设】使用RB策略不会阻止同时进行的纹状体介导的II策略,但会限制II的应答。

【研究发现】内侧颞叶与纹状体的激活状态之间存在负相关,这与类别学习过程中RB、II系统之间的竞争关系相一致。数据表明,系统之间的竞争处于应答阶段,且使用一种系统不一定会抑制另一种系统的学习:海马体失活后,依赖海马进行分类的动物会立即表现出依赖纹状体的行为,依赖纹状体进行分类的动物在纹状体失活后会立即表现出依赖海马行为。

【解释】超直接路径hyperdirect pathway)假说:超直接途径始于从额叶皮层到丘脑下核的直接兴奋性投射,丘脑下核将该投射发送到苍白球(GPi),GPi的兴奋性输入抵消纹状体的输入,使纹状体活动难以影响皮层。因此,超直接途径可以控制纹状体的信号从而影响皮层。

【假说的证据】停止信号(stop-signal)任务:若出现一个刺激,被试需要尽快反应;若连续出现两个刺激,被试需要抑制反应行为。连续的第二个刺激在大脑皮层中产生了stop信号,该信号通过超直接途径传递给GPi,抵消了纹状体传输的go信号。

2、自动化

成年人每天进行的分类行为几乎都是自动的,即不需要很多注意的行为,新的初始学习的分类行为少得多,但研究重点在于初始学习。随着练习增多,人们会变得更快、更准确,行为变得自动化。

【行为结果】据研究,一项需要工作记忆的双重任务会干扰RB初始学习,而不干扰II学习;改变应答键的位置会影响II的初始学习,但不影响RB。

Helie等让被试进行RB或II任务,在20个试验后,RB和II存在明显差异,支持上述结果。但再继续试验后差异消失,可能的解释是练习之后RB和II都由初始学习的系统介导,或都由新的神经网络介导。

3、纹状体

【问题】纹状体是否参与了自动分类行为。

【概念】纹状体分为联想和感觉运动区。联想区包括所有尾状核和前壳核,从颞叶和前额叶皮层的感觉结合区域接收输入,并将投射通过内部背侧和腹侧前叶丘脑核主要发送到前额叶皮层。感觉运动区包括所有壳状核,从顶叶和运动前皮质接受输入,并通过腹侧丘脑外侧核主要向运动前和运动皮质发送投射。

【研究发现】联想和感觉运动区可能在学习和自动化中起不同作用。研究报告,联想在初学习过程是激活状态,且其活跃状态随训练的增加而降低;感觉运动区可能是自动行为表现和从初始学习到自动化的过渡所需要的,所以自动化的发展可能涉及从联想到感觉运动的转移

①Helie等检查了RB的变化,随练习次数增多,被试纹状体激活程度增加,但纹状体激活与行为表现之间的相关性在训练结束时减少到零。表明纹状体参与练习过程,而几乎不参与自动行为。

②如果纹状体参与自动化,由于苍白球连接了纹状体和丘脑,所以苍白球的失活会阻止纹状体的感觉运动区影响皮层,会破坏纹状体对自动化行为表达的介导,使得练习效应消失。但实验证明,苍白球的失活没有改变动物对行为的熟练。因此,纹状体感觉运动区对动作学习几乎无影响。

4、【每个系统的学习特点】本节回顾单个系统的研究。

【RB、II的不同阶段】RB学习包括两个单独阶段:刺激到标签的阶段(stimulus-to-label,把刺激和类别标签联系起来)、标签到应答的阶段(label-to-response,把类别标签和反应联系起来)。

Maddox等人在被试训练完II任务后,要么更改了刺激-类别映射,要么更改了类别-应答映射。发现与破坏类别-应答关联相比,破坏刺激-类别的关联会引起更多的干扰。

【正反馈和负反馈】反馈在RB和II学习中有不同作用。Ashby等认为II学习需要正确和错误两种反馈,而RB学习时被试仅需获得正确或错误的反馈。已知皮质-纹状体突触的可塑性是双向的,目前的理论认为正负反馈会修改相关的皮质-纹状体突触,但没有反馈的情况时变化不大。Ashby和O'Brien发现,在使用两种策略时,使用RB的正确率为78%,II策略的准确率为86%。8%的差异足以诱使被试采用II策略。

COVIS程序学习系统假设只有在满足以下三个条件时突触才会增强:突触前激活、突触后激活、多巴胺水平高于基线水平。在正反馈试验中,COVIS假定满足所有条件的突触将被增强,不满足的将减弱,没有激活的将不更改;在负反馈试验中,COVIS认为突触会减弱或保持不变。因此,COVIS程序学习系统预测正比负反馈更有效。而研究表明,在RB类别学习中,提供错误的反馈比正确反馈学习更快。

结论:人类拥有多种类别学习系统,这些系统在神经和认知水平上都是不同的。

你可能感兴趣的:(Human category learning 2.0)