【心理学与AI】你认为最好的学习方式?可能事实不是这样

Yan, V. X., Soderstrom, N. C., Seneviratna, G. S., Bjork, E. L., & Bjork, R. A. (2017). How should exemplars be sequenced in inductive learning? Empirical evidence versus learners’ opinions. Journal of Experimental Psychology: Applied, 23(4), 403.

摘要

学习一个分类或者概念的时候,学习材料呈现的顺序其实很重要。比如学习10种不同风格的画作,你觉得是一个风格先学习完再学下一个(blocked)比较好呢,还是全部混在一起学(interleaved)比较好?直觉上我们会觉得是前者,但实验室研究发现其实是后者的学习效果更好(e.g., Kornell & Bjork, 2008)。
前人认为blocked可以让人更好地学习类内的共性,而interleaved能更好地学习类间的差异。这篇文章探究了如果把这两种形式混合会怎么样。结果发现,mini- blocks , blocked-to-interleaved和纯interleaved差不多,blocked还是最差的。
文章还调查了被试自己的学习形式偏好,发现interleaved是最差的。即被试在实际学习效果差不多甚至更差的情况下,倾向于选择blocked的学习形式。

问题背景

不论是从实践经验来看,还是凭个人体验,似乎在学习分类的时候,一个个类别学好再学下一个是比较好也比较通用的做法。作为学生来说,比起全部混在一起学,也会更加偏好一类类学这种方法。

  • 鸟类分类(Tauber, Dunlosky, Rawson, Wahlheim, & Jacoby, 2013)
  • 画家风格分类(Kornell & Bjork, 2008; Yan, Bjork, & Bjork, 2016)
  • 钢琴旋律学习(Abushanab & Bishara, 2013)

“Spacing is the friend of recall, but the enemy of induction” (1977, personal communication, as reported in Kornell & Bjork, 2008)。很多实验室结支持了这个思想,他们认为对比的过程对于学习,迁移和形成更深的关系网络有着重要意义(Gentner & Namy, 1999; Gentner, Loewenstein, Thompson, & Forbus, 2009; Gick & Holyoak, 1983; Oakes & Ribar, 2005; Rittle-Johnson & Star, 2011)。

Kornell and Bjork (2008)。画家风格学习,每个画家6幅作品。发现interleaved更好。评价标准是在没看过的图片上对画作进行分类的正确率。这个研究被大量重复,在不同学习材料上都是一致的结果。

为什么Interleave学习效果更好呢?

有几种理论:

  • interleave有助于检测类间差异,block有助于检测类内共性
  • 对于已有研究中的测试任务来说检测类间差异更重要

Birnbaum et al. (2013) 发现如果在interleaved呈现形式下在图片间插入一些无关的问题要回答,会干扰被试进行对比的过程。

Kang and Pashler (2012) 的实验表明,在interleaved的情况下,一次呈现一张(中间又间隔时间)和一次呈现3张图片的效果一样好。

Day, Goldstone, and Hills (2010)学的是两种容易混淆的任务。Taylor and Rohrer (2010) demonstrated学的是四种数学问题。都得出一致的结论interleaved更好。

也有反面的证据。Carvalho and Goldstone (2014)认为学习的类本身如果很相似,类间的差异就更重要,更需要interleave。但如果类内不太相似,共性很难找,就更需要block。他们的实验是学习灯泡形状的刺激分类。一组类内类间差距小,一组差距大。前者interleave效果更好,后者block效果更好。

Zulkiply and Burt (2013)也发现如果类间差异小,interleave更好,vice versa。

混合型的学习形式会不会更好呢?

混合型的设计可以吸收两者的优点,会不会对学习效果更好呢?

如果不考虑效率的话,学习者会更喜欢哪一种形式呢?

Kornell and Bjork (2008)发现虽然Interleave在成绩上又更好的表现,但学习者们普遍认为他们用block学的更好。后面很多研究也重复出了一致的结果。

Tauber et al. (2013) 的鸟类分类实验中,让被试在每个试次之后都自主选择下一个试次(想看哪个分类的图片)。直到他们觉得都学会了。在4个不同的学习任务中,有78-100%的被试在一半的试次中连续选择同类的刺激材料3次以上。

在这些实验中,被试认为自己学的最好的方式,和实际上最好的方式刚好相反。但是有一种可能性是,在这些研究中范式和编码方式会影响被试的策略。比如Tauber et al. (2013)中被试平均连续选择类内的次数是3.7次,也就是他们采用了一种混合型的策略进行学习,这种学习会不会更好呢?
如果这种学习并不会更好,被试选择它的原因会不会是因为不知道interleave更好,如果告诉他们了是不是能改进他们的元认知呢。

因此在这篇文章的实验1和2中,作者首先探究了一下混合策略和单纯的block和interleave相比效果怎么样。在实验3和4中,考察了当类别中样例个数变化时被试策略的变化。

实验1和2

实验组设置

全组间,每组30多个人。

  • Blocked
  • Mini-blocks 几个类内的样例为一组,然后穿插呈现
  • Blocked-to-interleaved 先以block的形式呈现,再变成interleaved
  • Interleaved-to-blocked 先Interleaved再blocked
  • interleaved
    实验设计

实验材料和流程

The new artists were found using www.dailypainters.com。
12 artists 每个14张画。
实验1用了6 examplars per artist,测试随机选没学过的4张。
实验2 用了12 examplars per artist,测试用剩下的2张。
注意:所有的画都不会repeat

测试前会玩45秒俄罗斯方块,应该是为了降低近因效应。
测试就是看图片选对应的画家名字。
测试完之后还有个报告,就是告诉被试有这五种学习方法,他们认为哪种最好。

实验流程图

实验结果

主要结论1 mini-blocks和blocked-to-interleaved这两个组和interleaved的效果一样好。

这个结论和Proteau, Bladin, Alain, and Dorion (1994) 的运动学习实验的结果是一致的,这篇文章发现block学得更快,interleave学的更好,但是mini-block学的又快又好。(有点迷惑这里怎么可以比较两个学习时间不一样的组)

主要结论2 被试对interleave的学习效果的判断很不准确,但是对mini-blocks和blocked-to-interleaved的学习效果判断还比较准确。

如果只提供给被试两个选项,84%的被试都会选block。但是增加了混合选项之后,只有24%的被试选block,60%都选择了hybrid。

实验1(上)和实验2(下)测试中的正确率

实验3

这个实验的目的是探索被试自己的学习策略,即认为什么学习序列是更好的。

实验材料和设计

一开始所有的材料用flashcard的形式呈现出来,被试根据自己的偏好可以对这些flashcard进行重新的排列。flashcard有6组,每组6张,上面只写了作者的名字没有画。初始有两种随机状态,一种是便于改成blocked(每组6张是相同的作者),一种便于改成interleaved(每组6张是6个不同的作者)。以平衡被试想快点结束实验造成的偏差。(为啥不直接用完全随机)

被试要按照自己认为比较好的学习顺序给这些卡排序。做完之后完成一个事后调查,报告自己组合卡的策略,然后从主试提供的一些学习顺序里面选择自己觉得最好的。

实验结果

主要结论1 在卡牌排列中,24/29的被试都选择了完全的blocked。

主要结论2 在事后调查中,42%的被试选择了blocked-to-interleaved,29%选择了blocked。

实验4

作者认为,手动组织卡片的策略和事后报告认为最优的策略产生不一致,可能是因为6个画家太少了,被试觉得在少量的时候没比要那么混合。因此实验4改成20个画家,并且不再用卡片,而是直接在纸上写的形式进行卡片排序。

结果还是和实验3类似的,但是采取纯block的比例从83%降到了33%。

但是作者也觉得有两种可能性导致被试在给排序的时候没有用hybrid的策略。1)在排卡片的时候没想到;2)太麻烦了

但是在报告自己为什么要这么排列的时候,被试反映出的对block和interleaved的认识和科学家所提出的假设是一致的。

有18%的被试认为interleaved是一种比较好的自测的形式。

讨论

有可能在学习difference之前,应该先学习commonality。

混合的学习会让相同画家的画之间有spacing,相当于复习,不然后面就忘了。但是应该不是复习造成的差异,因为interleaved比block-to-interleaved复习次数要多很多但是并没有明显比它好。(也可能本来b2i有别的因素更好,因为复习次数拉低了)

未来应该在别的刺激形式上看这个现象是不是能重复。以及看一下长期来看这种优势会不会有变化。

很多被试在学习的后期用interleave来测试自己的学习效果,这个可能也是巩固的一种方式。

几个有意思的点

看正确率的话,在这人的实验中,interleave是50%,block是38%
机器学习,以Zeng et al.(2018) Context-dependent continual learning给出的数据为例,SGD-resnet152-imagenet,interleave (concurrent training) 是78%,block (continual)是4%。

Zeng et al.(2018)
  • 人的实验可能还没学到比较好的状态,学好了会不会不一样呢?(再关注一下元分析)
  • 为什么人会主观产生block这种倾向呢,明明学习结果没有更好。会不会因为单幅图片其实已经做了特征提取了,多个图是要确认这些特征是不是重要的,先把不重要的扔掉,不然存了太多了会觉得负担更重。
  • 神经网络里面怎么体现提取共性的过程呢。

你可能感兴趣的:(【心理学与AI】你认为最好的学习方式?可能事实不是这样)