学习——斯派克、汤姆和杰瑞

学习基于经验而导致行为或行为潜能发生相对一致的变化的过程。核心有三点:一是行为或行为潜能的变化。例如学习开车,你是行为发生了变化,而学习逻辑学,你的行为可能看不出直观变化,但你的行为潜能,你思考问题的逻辑性发生了变化。二是相对一致的变化,发生的变化需要保持一致性,例如学习了骑自行车,那么你在符合条件的场地就都能骑。三是基于经验的过程,学习是从经验得来的,武侠小说里面动不动传输你百八十年功力的不是学习。

而在行为主义的认知里:所有超出行为库的行为都可以被理解为简单的学习形式之产物。例如原来黑猩猩不懂得用石头砸开椰子,他们的行为库中没有这种行为,当他们懂得这个技能的时候,这个行为就是学习的产物。

巴甫洛夫的斯派克。

斯派克是猫和老鼠里面的狗,而巴甫洛夫的斯派克,在帮助巴甫洛夫得到1904年诺贝尔奖的同时,也打开了心理学中行为主义的大门——经典条件反射,尽管他不承认自己是心理学家。

巴甫洛夫的狗的实验是这样的,原来狗在见到食物的时候,会自动分泌唾液,而听到声音并不会分泌唾液。但通过不断在展示食物的同时听到声音,使狗能感知到声音与食物之间的关联,到最后,即使只听到声音,狗也能分泌唾液。

反射是类似唾液分泌、瞳孔收缩这种无需学习的反应。

无条件刺激是能引起反射的刺激。如实验中的食物。

无条件反应是由无条件刺激诱发的行为。如实验中的见到食物分泌唾液。

中性刺激是在反射中无任何意义的刺激。如实验开始的声音。

条件刺激是通过反复与无条件刺激匹配后的中性刺激,可以预言无条件刺激的出现。如实验后期的声音。

条件反应是进过几次匹配之后,条件刺激引发的行为。如实验中听到声音分泌唾液。

条件作用过程分为习得、消退、休息、自发恢复四个过程。

习得是条件反应首次被诱发并随着实验的重复不断增强其频率的过程。它的时间进程非常重要,从延迟条件(条件刺激后紧跟无条件刺激)、痕迹条件(条件刺激后一段时间跟无条件刺激)、同时性条件(条件刺激跟无条件刺激同时发生)、倒置条件(无条件刺激后跟条件刺激),习得效果变差。

消退是当条件刺激不再预示无条件刺激出现时,条件反应逐渐变弱的过程。

自发恢复是休息一段时间后,即使无条件刺激不再出现,条件刺激单独出现也会引起条件反应的现象。

节省是消退后再次训练习得,时间会非常短。

刺激泛化是一旦习得成立,某种条件刺激会引起条件反应,则该条件刺激的类似刺激会引起相同的条件反应。巴甫洛夫的狗训练得听到高频音乐会分泌唾液,则低频音乐也会让它分泌唾液。

刺激分化是通过不断强化指定条件刺激引起条件反应,且弱化类似刺激引起条件反应,则类似刺激将渐渐无法引起条件反应。巴甫洛夫的狗假如只听到天鹅湖后给它食物,听到其他所有声音都不给它食物,则最后只有天鹅湖能使它分泌唾液。

习得需要可靠的预期(条件刺激能可靠预料到无条件刺激的出现)以及信息性(在环境中要能被感知到)。

习得的信息性来源于这个实验:老鼠A听着音乐受到电击,然后听着音乐开着灯受到电击,这样老鼠A就只对音乐有恐惧,对开着灯没有恐惧,因为灯在老鼠A心中只是背景,不提供任何信息。而老鼠B没有老鼠A的第一步,它直接听着音乐开着灯受到电击,老鼠B就对音乐有恐惧,和开着灯都有恐惧。

经典条件反应建立了你的情绪和偏好、对药物产生抗药性、甚至还有心理神经免疫学(调节免疫功能)。

桑代克的汤姆猫

在巴甫洛夫对狗下毒手的同时,桑代克也对猫进行了实验,猫被锁在迷笼里,只有偶然摁到某些装置才能逃出迷笼。按照桑代克的分析,学习是情节中的刺激和动物学会做出的反应之间建立的一种联想:刺激——反应联结。跟随着满意结果的反应,概率会越来越大,不满意结果的反应,概率会越来越小。

而斯金纳对杰瑞老鼠下手了。他通过对老鼠的实验分析,发展了操作性条件作用。操作性行为指任何有机体自发的,能够按照它作用于环境可观察的记过来描述它的特点的行为。例如婴儿的哭泣可以使父母过来接触。老鼠被放在操作箱里面,实验者定义一种适当行为出现,如按压杠杆,机械装置便释放食物。

强化相倚是指某一反应和它产生的环境变化之间的一致性关系。

强化物即与行为相倚的——随时间的推移能增加行为出现可能性的任何刺激。

阳性强化。某一行为之后,伴随着喜爱刺激的出现。

阴性强化。某一行为之后,伴随着讨厌刺激的消失。

消退训练。操作性反应之后,无强化物相伴,反应速率降低。

阳性惩罚。某一行为之后,伴随着讨厌刺激的出现。

阴性惩罚。某一行为之后,伴随着喜爱刺激的消失。

强化物的特性。

初级强化物。其强化特性是由生物学因素所决定的,比如食物与水。

条件性强化物。随着时间的推移,其他中性刺激渐渐与初级强化物联合在一起。

普雷马克原则。更有可能发生的活动(通常正常情形下出现概率较高的行为)可以用来强化不太可能发生的活动。

强化程序表。

固定——比率程序表。强化物在有机体做出一定数目的反应后才出现。例如售货员。

可变——比率程序表。强化物之间的平均反应次数是预先设定了的。例如赌博。

固定——间隔程序表。强化物经过一个固定的时间间隔后,有机体第一次做出某反应时出现。按月支付薪水。

可变——间隔程序表。强化物之间的平均时间间隔是预先设定了的。临时的突然测试。

连续接近塑造法。你对任何连续接近并最终与预期反应相匹配的行为进行强化。

学习的生物制约性指的是物种的遗传天赋所带来的学习上的任何限制。

本能漂移。即使学会了进行完美的操作反应,随着时间的推移,习得的行为也会向着本能行为漂移。

个体仅仅是在观察到他人的行为被强化或被惩罚后才再后来,或者做出类似行为,或者抑制该行为,这就是观察学习。

你可能感兴趣的:(学习——斯派克、汤姆和杰瑞)