第七天:第7章学习和行为分析
从进化角度来看,基因在动物包括人类在特定的行为和环境交互作用中起非常小的作用,这便使学习具有更大的可塑性或者说是可变性。我们能够按照行为在环境中产生变化的方式进行学习,但我们只有学习的能力,能否实现还需要依赖于我们的个人经验。
学习可定义为是基于经验而导致行为或行为潜能的发生相对一致变化的过程。包括三个关键部分:行为或行为潜能的变化(注意在我们学到的和表现出来的外显行为存在着表现差异),相对一致的变化(不同场合表现相对一致,这种变化可以是永久的),基于经验的过程(通过体验才能发生,包含记忆影响的反应,体验包括吸收信息和作出反应影响环境)。
华生创立的行为主义的心理学派认为预测和控制行为是心理学的重要目标。斯金纳持激进行为主义的立场,他为每个物种都设立了一个行为库,库之外的行为就是学习形式的产物,他更关注行为原因的合理性,这也是其其理论的精神精髓所在。行为分析强调寻找学习和行为的环境决定因子。我们假定学习基本过程在物种演化中的被保留下来,这种具有可比性的学习过程使在非人类的动物研究领域变得重要,通过确定顺序性原则来研究行为与环境世界的关系。
经典条件反应的作用(一种有一个刺激或事件预示另一个刺激或事件之到时来的基本学习方式),由巴甫洛夫的意外观察得知,也称为巴甫洛夫条件作用。其核心就是反射反应,反射(由与有机体生物学相关的特定刺激自然诱发,无需学习的反应),无条件刺激UCS(能够自然诱发反射性行为的刺激,可诱发无条件反应UC)。人类天生就具有UCS-UCR的联结。经典条件作用创造了CS(条件刺激)与CR(条件反应)之间的联结,这便产生了学习。
CS与UCS的呈现需要在时间上有足够的接近,而且多次重现。时间上足够的联结可以使有机体知觉两个刺激是关联的(有四种模式:延迟条件作用(最有效,时间间隔依赖于CS的强度和被条件化的反应作用),痕迹条件作,同时性条件作用和倒摄条件作用)。CR可自发恢复,消退后的训练可以使CR迅速变得强大,(节省学习,再次习得某一反应比初次习得该反应所需要的时间要少)消退仅仅消除的是操作,据此可以与学习区分。类似的刺激也可能引出CR,这便是刺激泛化,刺激越相似泛化反应就越强。最初特定经验拓展可以习得泛化刺激范围有利于安全因素的建立。
刺激辨别是据CS不同的刺激的某些维度作出不同反应的过程,可以通过辨别训练加强。为能采取适应的反应便需要找到泛化与辨别之间的平衡。
在文章,作者介绍了斯金纳的狗恐惧试验,说明了相倚(CS与RCS出现时间靠近,而且CS能预期UCS出现)在经典条件反应起关键作用。而卡明的试验则证明了阻断可以用条件刺激的信息性解释,刺激越强与周围对比越强烈,越突出,条件作用形成就越快。
综上可见,一个有效的CS必须要有相倚性还要具有信息性。
经典条件反射在日常生活中很常见,最广泛的一个研究点是恐惧条件作用。华生与其同事通过小阿尔伯特害怕毛绒玩具说明,条件性恐惧可以理解为中性刺激与天然的能唤起恐惧的东西相配对的结果,这种条件性恐惧可以持续很多年,难以消退。同样,一些快乐和激动的反应也可以理解为经典条件反应(如广告的应用和故地重游)。强烈恐惧时条件作用在中性刺激与UCS仅匹配一次就可形成。同样因经典条件反应可以解释在不同情境(一种CS)中药物的用量是否能引发对抗药物的典型效应的生理反应(CR)。另外,习得联结也使经典条件反应影响了我们的免疫功能,神经免疫学就是利用条件反射来替代大剂量的药物治疗,(如安慰的使用)即使一次匹配既可以增强免疫功能而无需连续服药。
谈到操作性条件反应,不得不提及桑代克的效果律,他通过牢笼中的猫习得打开宠门的实验得出,S——R的联结学习可使刺激与满意结果的出现。斯金纳发展了桑代克的观念,试图通过系统的变化刺激条件来发现不同环境条件影响某一特定反应将来出现的方式。于是他发展的操作性条件作用程序,通过操作性行为(任何有机体自发的能够按照它作用于环境可观察的结果来描述它的特点的行为)考察对以后行为的影响。斯金纳研究了与强化相倚(某一反应和它产生的环境变化之间的一致性关系)对动物行为的影响。可分为阳性强化(行为之后出现喜爱刺激)和阴性强化(行为之后出现讨厌刺激),两者均可增强之间出现行为的可能性。相反惩罚(阴性和阳性惩罚)则用来降低某些行为反应概率。如此,强化与惩罚的四种基本方法便可用来改变生活中的行为。
斯金纳将辨别性刺激-行为-结果称为三相相倚,辨别性刺激出现时操作行为的结果可以对行为进行强有力的控制,这样可以将某一行为限定在某一特定背景下,当然辨别性刺激也会泛化到其他类似的刺激上。
行为分析学家认为认为任何的持续发生的行为都是强化所致,对某些非理性和古怪行为,我们可以通过它们的强化或报应是什么而得到理解。通过对儿童体罚的研究,作者给出的建议是:
惩罚应当迅速而短暂;反应出现后立即执行;在程度上也有限制;是对特定的令人讨厌的行为的反应,而决不能针对个人特点;在反应发生的情境上要有限制;包括罚款而不是给予皮肉之苦。
强化物改变和维持人的行为,他可以通过经验习得,也可以是活动。
某些中性刺激与初级强化物(强化特性由生物学因素决定)结合而成为条件性强化。刺激本身也可以成为强化的目标,教师和某些实验人员发现条件强化物更有效,而且更方便使用(如代币的使用)。普雷马克原则是用高频率的活动作为阳性强化物,有巨大的应用潜力,如课堂上,某些有价值的活动作为强化物来增加似乎不受重视的活动的概率。
斯金纳发现部分强化程序表中获得的反应比那些在连续强化中获得的反应更能抵抗行为的消退,这便是部分强化效应。有固定-比率FR强化表(比如售货员只有完成一定的销售额才能拿到报酬),可变-比率VR程序表(程序反应速率最高,抗消退能力最强,如赌博),固定-间隔FI程序表(反应速率单呈扇形,按月支付薪水),可变-间隔VI程序表(反应速率是中等的,稳定的,消退是渐进的)。
要让老鼠习得按压杠杆得到食物,必须用塑造法,对向目标前进的各个行为成分别进行定义,用差别强化推进,这便是连续接近塑法,这里作者列举了塑造法改变孤独儿童活动的例子。
学习的生物制约性型是指物种的遗传天赋所带来的学习上的任何限制,在这里介绍了本能漂移(遗传基因所决定的特定物种的行为淹没操作性条件作用作用所带来的行为改变,所以当目标反应与生物相关因素一致时,反射此时非常有效)和味觉-厌恶学习(加西亚第一个证实,CS和U CS结合在特定物种上可以是经典条件化,其他则不能,一次匹配即可)有机体的基因型对行为-环境关系的改变。因为某些反射不但依赖于刺激与行为之间的关系,而且依赖由遗传预先安排的对待环境刺激的方式,我们可以厌恶是通过经典条件作用机制而获得设计一些抗厌恶疗法如,替罪羊厌恶。
某些类型的学习无法用条件反射来解释,行为部分是认知过程的产物。动物认知,托尔曼的老鼠走迷宫的实验显示条件反射不仅涉及刺激情境之间或反应与强化物之间形成简单的连接段,包含着对全部行为背景的其他各方面的学习和表征(认知地图)。在概念性行为中,作者谈到了泛化的根基是新获得的概念结构而引起的认知相似性。
观察学习是更深层次的学习类型,通过观察他人的行为被强化或惩罚而习得某些行为。通过对榜样的学习可以学到亲社会或者是反社会的行为,榜样行为的影响很大:
观察到榜样的行为得到了强化的结果;
榜样被看成是正面的,令人喜爱和尊敬的;
榜样和观察者的相貌及特点具有可知觉的相似性;
观察者因注意榜样的行为而得到了奖赏;
榜样的行为可以看到并且很突出;
榜样作为清晰的形象,从与其相竞争的人物背景中显现出来;
榜样的行为是在观察者所能模仿的能力范围内。
(举例电视暴力行为的习得来说明)。观察学习说明了强化原则影响行为。而人类有能力运用认知过程,借助替代奖赏和替代惩罚而改变行为。