行为心理学的认识-操作性条件作用

    想一想我们生活中一些有趣的现象,当你喜欢一个东西想要得到的时候,那么家里人说你只要怎么怎么着就能得到。然后就你照着做,最后得到了喜欢的东西。又比如说你喜欢得到老师的赞美,当你表现好时老师就会称赞,那么你就会表现好,以获得老师的称赞。

     那么这到底是怎么回事呢? 这就是操作条件作用的正强化学习,当然有正的就有反的。  基本的意思是,有一个事物可以刺激到你,是你感兴趣或者使你厌恶,但是你要想得到或者远离这个刺激就必须要满足一个条件,这样往复循环就会形成一种习惯。

   下面一一说下正反强化,先说正强化吧。

     正强化就是通过刺激来得到想要的东西,并且形成行为习惯;比如一个孩子发脾气,大哭大闹,家里人给予关注,安慰,重视。那么其实这样孩子心理就有了一个认知,只要大哭大闹家里人就会关注他,那么他之后为了获得家人的关注就会强化这种行为,因此就得到了他想要的“关注”这一刺激结果。

     负强化就是通过刺激来逃避自己不想要的东西,并且行为行为习惯;比如:我们让用户持续打开app多少天并且浏览多少时间,如果不这么做就会损失XX钱。那么用户为了不损失这么些钱,就会持续操作,避免不操作的行为导致金钱损失。

     这个理论的科学依据是什么呢? N年以前的美国行为心理学家大神斯金纳通过鸽子,老鼠等进行多次的实验,比如 让鸽子饿着,然后放笼子里偶尔摁住出食的按钮,出来了吃的,然后他就一直这样操作一直出食,之后就学会了饿了就按出食按钮。

    由以上可以看出操作性条件的强化物是关键核心,那么关于强化物这块有什么特征或者要求呢?

     这里边分为条件性强化物和反应剥夺。 条件性强化物是能让强化者产生兴趣的各种刺激,只要是他需要的想要的,但这个会引人而已;包括不限于:金钱、权利、荣誉、地位、赞美、认可、关注、成绩等等。 反应剥夺呢就是如果做某个行为将剥夺某种个体需要的刺激。  比如 作业不写完不能出去玩,连续打卡不够,不能领取奖金等等。

    说了这么多,那么这个强化学习到底有什么作用价值呢?以及都有怎样的操作模式呢?

    关键的关键是行为塑造、习惯行成。 比如我们想让消费者养成对产品的使用,那么给予一定的正向强化,比如 使用一次可以获得多少金钱,不断进行强化,最终使消费者形成了使用产品的习惯。

都有怎样的操作模式呢?

1、固定比率的强化;有机体做出一定次数的反应后给予强化,比如看10分钟小说给予一个金钱奖励;

2、可变比率强化;不断提升有机体做出次数的反应后给予强化,比如,一开始是看10分钟给奖励,慢慢逐步往上加15/20/25等;

3、固定比率强化;有一定的时间间隔,做出反应后会给予强化;比如:一开始是看10分钟给奖励,完了需咬要间隔3小时再看10分钟再给奖励

4、可变间隔强化;就是随机的会出现强化;比如:有可能是看10分钟会奖励,下次可能是20分钟也有可能是5分钟

    这里边有个关键点在于冷启动过程,就是需要循序渐进的,你想引导强化者达到某种行为,那么就通过强化物一步步的接近;比如:你想让用户看10分钟领奖励,那么就先打开APP给奖励,再点赞给奖励,再评论给奖励,再浏览5分钟给奖励,逐步往上加。 最终让用户按照你想要他做的行为而做到。

   那么它与经典条件作用有什么区别呢?两方面的区别,第一、刺激物不同  第二、刺激模式不同。

    刺激物:经典条件作用是有机体生物学层面的刺激物,美食,开心,愉快,兴奋等。 操作性更加宽泛,涉及社会,文化,信仰等多方面的,比如 金钱、权利、地位、荣誉、认可等

    刺激模式:经典条件作用是有条件和无条件的刺激在时间上是必须紧密连贯才可以的,而操作性在这方面没要求,只要最终能得到强化物的结果就好。

    学了这些我的感想是:真的生活、工作无处不再用强化学习的方法。  我们一开始运动不想做,但如果有诱人的金钱奖励呢? 为什么趣头条用的用户阅读激励模式之后被疯狂复制呢? 用户激励模式也就是一种强化学习。各种补贴为什么要持续进行呢,当然其中不乏有的是人家做什么自己学什么,没深入思考,但很多为什么依然在做,肯定是想要通过奖励来强化人的学习行为。

你可能感兴趣的:(行为心理学的认识-操作性条件作用)