经验的疆界

如今在AI大行其道,强化学习的发展是最被人们津津乐道。想当初,风起云涌,深度强化学习算法与众多围棋高手大战三回合,人处于不败之地。一时间,江湖人无人不知无人不晓。

那强化学习的独门秘籍究竟是什么呢?从经验中学习。判断智慧的标准:1.有效地适应环境 2.优雅地诠释经验

学习的方法分为两类,通过复制成功,通过故事和模型来学习,适应性学习(适应能否改进甚至最佳)。

复制成功:经由专家的系统观察和分析,然后经由权威传播,之后经过直接或者间接的实践验证。虽然适应是弱者的事,强者制定规则,让别人适应自己,但是乳沟霸主地位消失,适应你呢管理就会加速衰退。从原始经验中挖掘经验,观察行为和结果的联系,初步发现存在什么规律。

学习有两种模式,一种是低智学习,努力复制与成功相连的行动,还有一种是高智学习,努力理解因果结构并用其指导以后的动作。

复制成功有三种机制,第一种是亲自摸索,不断尝试;第二种是模仿,观察其他行动者的经验。复制成功行为,规避失败行为。第三种是天择,繁殖与成功相关属性,淘汰与失败相关属性,天择的规律相对固定。完成一个活动的绩效是由这个活动的潜力和胜任力所共同决定的,潜力固定,但是胜任力能够持续精进。当经验以让学习有效的方式呈现的时候,复制成功能够增长智慧,但是经验验 是复杂的,模糊的,充满随机变异的,样本量有限的,那么复制成功,不管是试误,还是模仿,或者天择,都只能导致次优状态。

高智学习的背后,本质是故事和模型的学习。模型需要变得尽量详尽,详尽到足以赞美人类智慧,又不会变得太过详尽,免得让人不能理解。所以故事和模型呈现,最大可理解复杂性。这也导致模型的构建会忽略二三阶效应,最小反馈效应,掩饰时滞变异。

组织故事:试图把经验转换为对组织盈利的理解。在类似神话故事中,例如马云神话,乔布斯神话中,往往具有四个共性:1,。强调理性行为,有因必有果 2.领导者个人举足轻重 3.层级式任务划分,功劳划分,忽略了相互之间复杂的网络结构,博弈过程 4.历史有效

在模型的构建中还必须遵循真善美。真,模型是否真的符合故事。 可惜的是故事和模型所反映的深层现实很难从日常经验中挖掘出来。由于真相的模糊和社会舆论的威力,以及盲目从众的危险更是增加了真理的难度。正义,对于组织来说,与其说模型在反映现实,不如说模型实际上在达成某种共识。共识是人类交流对话的基础,有助于行动者形成并实施正义的社会规范遵守社会契约。任何一种形式的在来自模型的形成需要是以人们可理解的故事形成。美的艺术价值丝毫不逊于真理价值和正义价值。美是被精心制造出来的,不能轻易被复制。制造并欣赏提高审美乐趣的事物,是智慧的重要目标。

创新是适应的敌人,因为复制成功导致选择趋向于稳定,特别是如果复制成功是找到一个选项然后坚持这个选项,而这个选项要求练习才能实现潜力的话。而创新会极大地增大不确定性。

那新事物优势如何存活下来呢?根据越轨理论:创造中的越轨和也许和偏离神智或者偏离社会规范的越轨具有很多共同点。造就天才的因素和早就罪犯的因素重叠。创新的出现:1.成功带来组织宽裕,避免想法早夭。新事物是宽裕的副产品,宽裕是高效的副产品。宽裕允许一定范围内的波动和创新 2.偏执自大的老板将会推动这类创新,他低估了风险3.对风险乐观   产生新事物,想办法从大量的新想法中尽早分辨出稀有的好想法。另一个就是在不损害好想法之收益的前提降低尝试新想法的成本。

因果关系复杂,练习机会较少的领域,经验不是好的老师,因为不能为绩效提供可靠的依据。然而和公认故事和神话结合,经验诠释促成共识,营造理解感,肯定人类智慧的重要性。

经验学习具有鲜活性(对于自我经历的看重),模糊性,诠释多样性。在经验学习中,提高对经验的因果关系的推导能力:多变量统计学结合简单的结果和大规模的数据库来深度接近现实。还有一个就是从小样本中获得对深层英国结构的有用理解。

你可能感兴趣的:(经验的疆界)