《硅谷来信》读书笔记88

第245封信:AlphaGo的关键方法:强化学习

强化学习,就是在有正确反馈的前提下,做自主的学习。
之前在10000小时定律里面讲了,有一种10000小时的努力是无效的,就是每次产生错误之后都没有改正,即没有得到正确的反馈。

在这里我想起几个例子。

一个是我女儿,她现在1岁半,正式探索外部世界,学习语言的阶段。我每次会教她一些简单词,她会尝试着模仿,当她说的不对,或者不标准的时候,我会即使重复正确的发音,这就是反馈。平时在没教她的时候,她会观测大人说话,把学习到的词和当时的场景或者事物匹配上,渐渐自己明白这些词的意思,这就是自主学习。就比如她第一次看到狗,听到狗“汪汪”叫的时候,她就把“汪汪”和狗进行匹配。每次她看到狗的时候,会发出“汪汪”的发音,后来我明白了,她是在自主学习的时候,把狗这个概念等同于了“汪汪”的发音,于是我给她一个反馈——狗的正确发音是“gou”,它发出的声音才是“汪汪”。大家都知道小孩的语言学习是很高效的,正是因为他们不断地自主学习再加上有不断地反馈给他们。

由此我想到我们当时在学习英语的时候,一直是以各种教材为基础,属于被动的学习,教材准确、科学与否,我们掌握的是否准确,其实并没有及时、准确的反馈。因此很多人都读完大学了,英语水平还是一般。

在我上学的时候我的导师就说过“教就是最好的学。给从来都不懂的人讲懂了,那就说明你也理解了。”工作之后,在很多场合都体会到这一点。现在从学习与反馈的角度看,在反复给人讲的过程中,对方是一个对你所说的完全不懂的人,因此他会问你许多问题,在你根据这些问题(反馈)不断调整、整理你的思路的时候,你对你所掌握的知识的理解才会越来越深刻。因此“教就是最好的学。”

拆书帮里也是如此,每次拆书活动中收获最大的是“拆书家”,而不是学习者。

你可能感兴趣的:(《硅谷来信》读书笔记88)