拆页五
来自《第二章 激进的行为主义》
P35
增强反应:负强化
与正强化不同的是,负强化是通过移去相依于反应的厌恶刺激而增强反应的。要注意正强化是在反应之后呈现令人满意的刺激。
负强化原理最初是在斯金纳箱中用老鼠做实验时发现的。这次老鼠学会按压杠杆不是为了得到食物,而是为了关掉通过笼子底部的棒施加的电击。这样,按压杠杆这种频率得到提高的行为,受到取消电击这种厌恶刺激的负强化。
找到负强化的例子要比找到正强化的例子难,结果导致其应用不明显。但请考虑系安全带背后的一条原理。在许多汽车上,只有当驾驶员系上了安全带,车内的铃或蜂音器才不响。系上安全带就关掉了声音(这种声音在我的车里是很恼人的)。这样就可以说,系安全带行为的增加受移去声音的负强化。
其他负强化的例子如学生尽量往前坐以便看清黑板上的字,儿童最终开始正常地刷牙以便他的母亲不再唠叨。在第一个例子中,坐在前边导致模糊视觉的消失。在第二个例子中,刷牙导致唠叨的停止。
负强化常与惩罚的行为原理(下边将要介绍)相混淆。这种混淆看来源于“负”一词的含叉。如果某种事物是负的、消极的,则它肯定是坏的,如果它是坏的,则它肯定会导致行为的减少而不是与真正的负强化相伴的行为的增加。这种混淆的一个典型例子出现在一篇关于拯救海龟的文章中。这篇文章发表在2003年11月29日的《塔拉哈西民主党人) Tallahassee Democrat)上,这篇文章报告说,自然资源保护论者在海龟巢的周围撒上了哈巴涅拉胡椒粉以阻挡捕食海龟的动物。…该州的海龟保护官员说,他们知道撒胡椒粉这一措施,而且这一措施看来不会影响海龟巢。他们将其描述为是对捕食者的“负强化”( Tallahassee Democrat,p.58).但这一策略不是增加某一行为,而是通过运用厌恶刺激来减少这种行为,这是一个对捕食者进行惩罚的典型例子,不是对捕食者的负强化。
「I,重述知识」负强化
1)请对照昨天拆页中的正强化,用一句话说明正负强化的典型区别。
——区分正负强化要看刺激和行为的先后顺序、刺激的类型,正强化是发生某种行为后会接收到正向积极的刺激,继而强化这种行为;负强化是接收到某种负面的刺激之后,为了终止这种刺激而采取的某种行动,重复接收到负面刺激,这种摆脱负面刺激的行动就被强化了。
2)负强化和惩罚容易混淆,用一句话表达他们之间细微区别。
——负强化是让行为反复发生,惩罚是让行为消退或终止,虽然二者都与负面、感受不好的刺激有关。
「A1,激活经验」生活&工作中的负强化
请例举不少于5个负强化,并采用下面这样的描述格式:
学生因为每天的家庭作业都完成得很好而被免除了每周的测验。
我家儿子初二时因为英语考试达到80分而被免除了寒假英语作业。
项目进展顺利,本周的分解任务已经完成而被免除了原本计划的周末加班。
——我暂时戒掉了咖啡和甜食,避免返流性食管炎发作。
——小红答应老妈去相亲,从而结束了老妈在电话里一直念叨她不努力想办法结婚。
——小蓝去图书馆看书,逃开了隔壁乱糟糟的装修声。
——小绿连续一周不吃晚饭,从而在拍集体写真的时候没有被闺蜜嘲笑穿不进公主裙。
——小黑说话打哈哈,不直接说问题症结,从而躲开了与他人的冲突。
拆页六
P40
(二)教会新的行为
前一部分讨论的原理涉及的是已在某种程度上出现于学习者行为库中的行为。
可以说学习者已经知道了行为;所习得的看来只是行为表现的频率。但有机体的行为库中没有的行为如何习得呢?例如,压杆并不是老鼠在其自然环境中会有的行为。同样,我们可以观察斯金纳箱中的鸽子很长一段时间但看不到它转一个完整的圆圈。在坦纳先生的课上,学生不可能自发地表现出狐步舞之类的复杂行为。如果学生、老鼠、鸽子从未表现出可获得强化的行为,那么这种行为如何获得呢?行为主义者已确定出了三条原理用于教会新的、在很多情况下是复杂的行为:塑造、连锁、消退。
1.塑造
塑造指对目标行为连续接近的强化。它涉及正强化,即强化物相依于预期的行为呈现,但在塑造中,只有每次接近目标行为时才对预期行为进行强化。而且对目标行为的连续接近也要求强化的呈现( Reynolds,1968)。为教会老鼠按压杠杆,我们可能首先强化趋近杠杆的行为,然后是抬起一只爪子,把爪子伸向杠杆,接触杠杆,最后是按压杠杆。一旦老鼠做出了正确反应—在这一例子中是按压杠杆则紧跟着的就是正强化原理,即每次按压杠杆的行为都受到强化,直到表现出预期的行为频率为止。
哈里斯、沃尔夫和贝尔( Harris,wof,&Baer,1967)演示了用塑造教会儿童新行为的效力。他们要塑造的行为是攀爬游乐架对象是一名从不花时间攀爬的小男孩。教师的注意是相依强化物。当小男孩走向游乐架时,教师首先注意他,然后当他接触、攀爬、最后是到处攀爬时再注意他。
摩洛哥餐馆的一名服务员在给甜点这道菜倒茶时,把茶壶高举过头顶然后把茶倒进放在矮桌子上的又高又窄的玻璃杯中,而就餐者则坐在地板的垫子上。他一滴茶也没洒出来。我们当然惊叹他的技能并问他怎样学会了以这种方式倒茶。他回答:“当然,一开始我还做不到用这种姿势倒茶而又不把茶洒出来。于是我尽力在稍高于玻璃杯的位置拿稳茶壶。当我能一滴不洒地倒茶时我就把茶壶向上移几英寸。我不断这样做,直到我能把茶壶举过头顶倒茶为止。”连续接近受到了强化,直到达到目标行为。在这一例子中,在一种接近水平做出反应的能力是尝试下一个接近水平的强化物。
上述例子还说明了对塑造的成功与否至关重要的一个因素。服务员在尝试较容易的接近之前,并未尽力尝试更难的接近。同样,在塑造任何新的行为时,要等到先前的接近牢固建立以后才能强化距目标更近的接近。如果期望学习者跨越的步子太大,则应将行为分解,可在学习者不断表现出成功的那点重新开始塑造。最后,塑造中确保强化的施加紧跟预期反应也很重要。延迟会导致某些随机行为受到强化并变得条件化。
「I,重述知识」塑造一个新行为的做法
梳理塑造一个新行为的步骤,以及注意事项。
——
1)将行为进行分解,使得每次进步一点点成为可能。注意跨度不要太大,逐步接近即可。
2)选择合适的正向刺激,在塑造的分阶段目标行为出现时进行正强化。注意只有在出现目标行为时才进行强化,但不能延迟,不然会影响强化效果。
3)在上一阶段的行为能够相对稳定之后,再提出下一阶段的行为目标,继续进行强化。
「A2,规划运用」
想一想你准备将塑造这种方法用在哪里,准备培养谁一个什么新行为,这个新行为教起来不是那么容易。
现在根据你梳理的步骤,做一个规划,以帮助你在未来的一个月内能实现目标。
这个新行为可能是你讲课时要传授给学习这的新技能,比如做好决定的6个步骤,情绪管理的ABC法则,计划执行的PDCA循环。
这个新行为也可能是你期待孩子能拥有的,比如给4岁孩子培养进出电梯先礼让他人,家里长辈下班回家递上拖鞋。
——我正在参加拆书训练营,为期一个月,我觉得课程设计就很有塑造的理念。第一周导师指定拆页,给出I便签,自己写a1、a2,完成作业及时反馈表扬;第二周导师指定拆页,自己写i、a1、a2便签;第三周导师制定5个拆页自选3个;第四周自选拆页;中间还有两次线下实践,逐步加码,相信通过这一个月我就能初步掌握ria便签法的技能了。
中间强化的东西除了导师给的,还有我自己的成就感,输出写东西本身就是一个成果,是一直想做而没有目标牵引的。参加拆书训练营和拆书每月输出群就找到了一个有很多同行者的社群,彼此激励。拆页本身就非常有质量,读完了,联系自身的工作和生活非常有收获,也是支持我自己坚持输出的动力之一。
补充阅读
2.连锁
塑造被用来教相对简单而本质上又连续的新行为,而连锁则适合建立由学习者已知的离散的简单的行为构成的复杂行为。连锁在人类行为中的一个典型例子是学习一种新舞蹈。每个舞步可通过塑造获得。但接下来,这些步骤会通过向前的或向后的连锁而按序串联在一起。换言之,可以先练习舞蹈中最后的一步,然后逐步加上它前面的步骤(向后的连锁)。或者也可以从第一步开始,逐渐加上它后面的步骤,直到能跳出整个舞蹈(向前的连锁)。
记忆很长的文章是向前连锁的另一个典型例子。连续地增加句子直到可以准确复述整篇文章。清洗武器后将武器重新组装是一个行为连锁,海军新兵训练中心的士兵可通过向前的连锁而习得。
3.渐退
正如它已应用到人类的行为上一样,渐退的概念指最初用于形成预期行为的辨别刺激的淡出( Sulzer& Mayer,1972)。换言之,随着辨别刺激线索的逐渐撤去,预期的行为仍不断受到强化。渐退用于教学的一个经典例子可参见斯金纳和克拉克沃( Skinner& Krakower,1968)的“有写有看的书写”教学方案。在这一方案中,儿童在一本本子上描写字母。慢慢地,字母的各部分(是作为辨别刺激以形成正确的形状)逐渐淡出,要求儿童自己写出来的部分越来越多,强化是通过儿童所用的笔和纸之间的特殊化学反应实现的。当儿童书写的字母正确时,线条是黑色的,但写错时,显现的是橙色。
渐退的其他例子如:学生执行一系列为幻灯片着色的程序时,实验室教员给出的言语线索逐渐减少;打高尔夫球的专家给新手示范如何执杆和挥杆时,给出的身体线索逐渐撤去。工作场景的工作辅助也是渐退的好例子。随着雇员对其职责更为熟练,他们越来越少地依赖辅助提供的线索。