机器已会学习的时代需要怎样的知识观?

员工离职是企业经营过程中最令人头疼的事情之一,有没有办法可以预测员工会不会离职呢?美国一家汽车维修公司Calibre Collision,却通过机器学习的技术创建了有效的员工离职模型。

Calibre Collision公司长期以来一直存在员工频繁流动的问题,部分问题在于其维修工厂有时没有足够的汽车供工作人员修理,导致工资不稳定。Calibre公司从人力资源软件中提取员工数据,创建出一个模型,预测员工是否会考虑离职,并对其中可能要离职的员工进行干预。 

例如,如果员工的工资在几周内下降,公司区域经理可以确保他们获得更多的汽车进行维修;相反,如果员工看起来工作负担过重,公司会将一些工作分配给其他同事。结果是,Calibre公司每年可节省多达100万美元。

这是机器学习Machine Learning应用在商业中的一个典型案例。美国国防部在2017年成立一支特别的队伍叫做“战用多功能算法团队”(Algorithmic Warfare Cross-Functional Team),准备在军事上广泛应用机器学习算法,例如收集和处理海量的由无人机拍摄的照片和视频,以获得抓捕ISIS武装分子的线索。

那什么是机器学习?我们来看一个挑选西瓜的案例:

假设我们去买西瓜,都想挑最甜的西瓜,怎么挑呢?有经验的人说,你需要用手拍拍西瓜,听听响声。如果听到清脆的“咚咚”声,并且托瓜的手感觉到有些颤动,说明是熟瓜;听到类似“嗒嗒”闷响的声音,就有可能是生瓜。

普通的计算机算法是如何实现这个过程的呢?如果用计算机程序来帮你挑选西瓜,可以写出这样的规则:

if(敲瓜的响声是咚咚声音):

西瓜是熟的

else:

西瓜不熟

我们会用这些规则来挑选西瓜。但是如果在我们的西瓜实验中有了新的发现,我们就不得不手动修改这份规则列表。

比如在我们买回的西瓜中有些是不甜的,经过品尝各种不同类型的西瓜,我们发现那些敲起来有咚咚的响声,并且重量相对轻(生瓜水分重)的西瓜才是甜的。所以我们修改了规则:

if(敲瓜有咚咚的回声and重量相对轻):

西瓜是甜的

else:

西瓜是不甜的

我们会发现这个普通的计算机算法有个缺点,那就是:我们得搞清楚影响西瓜甜度的所有因素的错综复杂的细节。如果问题越来越复杂,我们就要针对所有的西瓜类型,手动地制定挑选规则就变得非常困难。

那如何解决克服这个缺点呢?机器学习算法可以解决这个问题。

机器学习算法是由前面的普通算法演化而来,通过自动地从数据中学习。

我们从市场上买的西瓜随机地抽取一定的样品(在机器学习里叫做训练数据),制作成一张表格,上面记着每个西瓜的物理属性,比如颜色,大小, 产地 等(这些属性称之为特征);还记录下这个西瓜甜不甜(这叫做标签)。

我们将这个训练数据提供给一个机器学习算法,然后它就会学习出一个关于西瓜的特征与它是否甜之间关系的模型。

下次我们再去市场买西瓜,面对新的西瓜(测试数据),然后将新的西瓜输入这个训练好的模型,模型会直接输出这个西瓜是甜的还是不甜。

有了这个模型,我们现在可以满怀信心地去买西瓜了,根本不用考虑那些挑选西瓜的细节。只需要将西瓜的属性输入这个模型就可以知道西瓜甜不甜。

更重要的是,我们可以让这个模型随着时间越变越好,当这个模型录入更多的训练数据,它就会更加准确,并且在做了错误的预测之后进行自我修正。

更厉害的是,我们可以用同样的机器学习算法去训练不同的模型,比如可以使用同样的算法来预测橙子、葡萄等甜不甜的模型。

机器学习的结果——模型,不管是员工离职的预测模型,还是判断西瓜甜度的模型,都属于我们熟悉的概念:知识。

知识的价值(1/2):减少不确定性

使用机器学习算法挑战西瓜的例子体现了知识最重要的价值之一:减少不确定性。

每个西瓜甜与不甜都各有50%的概率或者不确定性。西瓜店老板不可能每个西瓜都要用小刀切出一小块儿给你尝了再买。西瓜在买瓜者眼里是一个小黑箱。通过模型也就是学习得到的知识,可以对西瓜做出判断和区别。

心理学家认为:我们的大脑会对三种东西特别敏感:恐惧,不确定性,以及自我怀疑。合称 FUD 因素(Fear,uncertainty,doubt)。

为什么呢?因为 FUD 因素,在漫长的进化里,是对我们产生最大威胁的东西。恐惧,往往意味着直接的危险(比如猛兽、陷阱),会直接危及生命;不确定性,往往意味着大量消耗认知资源,挤压个体思考与处理其他问题的能力;自我怀疑,是对存在感和自尊的动摇,这会影响个体在群体中的地位。

不确定性意味着,你的大脑会不停进行思维的”反刍“:这个西瓜到底甜还是不甜?如果是甜的话,为什么瓜皮看起来颜色不够深呢?为什么这瓜拍起来声音不对劲儿呢?我是不是先挑一个小的瓜先试试?

假如是原始人走在丛林中,隐约看到一只有着花纹毛色的动物匍匐在草丛中并且离自己不远。如果他的大脑不是快速判断并决策跑还是不跑,而是不断地思考:到底是什么动物呢?怎么看起来像老虎,又不像?它对我会有威胁吗?它看到我了吗,如果是猛兽怎么还没有行动呢?极有可能的结果是,正当你还在解决面前的不确定性问题时,那只其实是一只猎豹的动物已经向你迅猛扑来。

2008年发表在《癌症护理》(Cancer Nursing)杂志上的一项研究发现,在疑似乳腺癌患者中,焦虑水平往往在诊断前而不是诊断后达到顶峰。研究发现,肿瘤活检后的不确定期是患者们最焦虑的时期。“有了检查结果,就有了可以关注的东西,会给人一种控制感。在某种程度上,这比不确定性更让人放心。”

知识的价值(2/2):减少对数据和信息的需求

英国著名现代派诗人托马斯·艾略特在名为《岩石》的诗中写道:

 Where is the knowledge we have lost in information?

我们在信息里失去的知识,到哪里去了?

Where is the wisdom we have lost in knowledge? 

我们在知识里失去的智慧,到哪里去了?

这段话比较诗意地展现了“信息”与“知识”、“知识”与“智慧”之间的关系。不过,什么是智慧很难定义和描述,我们暂且不作讨论。

如果说知识来自信息,那么信息来自哪里呢?信号-数据-信息-知识的模型较为清楚地展现了相互之间的关系。

信号Signal:

由事物传递或者与事物互动过程中,能够由人体的感觉器官或者传感器感知到的光线、色彩、声音、气味、温度、压力、触感等物理量。只要能传递信息,万事万物都可做作为信号。

信号可简单分为:模拟信号和数字信号。模拟信号分布于自然界的各个角落,如气温的变化,而数字信号是人为地抽象出来的、不连续的信号。

数据Data:

数据的英文单词data是datum的复数形式,它指出的通过观察和测量得到了关于事物的性质、状态或相互关系的描述。

数据可以是定量,也可以是定性,因此数据的形式并不仅仅是数字,还包括文字、图形、图像、音频、视频等。天气预报(阴、晴、下雨雨、刮风、雷电等)、户籍档案、电商订单等都是数据。

信息Information:

信息是主体从信号和数据中发现或提取出来的意义,用来减少不确定性。

夜空中突然亮起一只信号弹,它发出的光是信号,颜色和量度可以用数据来衡量。如果你是战斗中士兵,对于你来讲就是发起冲锋的信息;但是对于平民来讲,可能就没有意义。发送冲锋还是原地待命,存在不确定性(概率各为50%),信号弹所传递的信息可以将发送冲锋的概率提高到100%。

不过,信号及其包含的数据是否传递了信息,不止取决于信号,更重要的是接收者本身是否拥有相关的知识。如果一个目睹了信号弹的人脑袋中并没有“红色信号弹”代表发送冲锋的信息,那么信号弹无论发射多少颗对他来讲都没有意义。

知识Knowledge:

SDIK模型中的纵轴是秩序和结构化的程度,横轴代表的是人的主观程度。

从纵轴看,信号-数据-信息-知识,它们的秩序性或结构化程度是越来越高,反过来从知识-信息-数据-信号,越发表现出无序性或者随机和混乱的程度越高。

从横轴看,信号及其包含的数据更为客观,而是信息再到知识,主观程度越来越高。也就是说,一个信号对于主体来讲是不是信息,由主体决定;进一步,一个信息是不是知识,更是主体说了算。

一位母亲带着身体有些不适的小孩儿来到医院,医生摸了摸他发烫的额头,又看了看他的喉咙,还用听诊器听了听他的心跳。体温偏高、流鼻涕、扁桃体发红等都是信号。医生再用体温计测了小孩儿的腋下体温,39度——这是数据。因此,医生做出了上呼吸道感染导致发高烧的判断。

他从各种正常与不正常的体征中得到了信息,是否发烧?高烧还是低烧?不确定性减少了。医生根据专业经验(知识)给孩子的家长给出建议:先采用物理降温,继续观察,如果高烧没有缓解就立即使用退烧药。

知识可以减少对数据和信息的需求。试想如果医生没有关于感冒发烧的产生原理和治疗方案的知识,他势必要对病人的各种身体参数(体温、心率、血压、白细胞数量、大小便等)进行全面检测同时还要详细了解病人近期的饮食、运动和睡眠等生活情况才能做出分析和判断。换言之,他需要收集和处理大量的数据和信息才能确定病因。不但如此,还需要进行反复的测试才能知道哪种药适合治疗上呼吸道感染引起的发烧。

再例如“二十四节气”,是古代先辈们长期地观测天气和物候,发现并总结出一年中24个时间节点可能会反复出现的模式,以便做好耕种、祭祀等活动安排。一旦我们有了二十四节气的知识,就不用再持续地观察天气和物候变化并记录相关的数据。

收集、传递、加工和存储数据与信息都需要耗费时间和能量。如果有适当的信息,可以减少对数据的需求;进一步来讲,如果拥有相应的知识,就可以减少对信息的需要。

减少数据和信息的需求与处理,也就是在节约能量与时间。站在生物进化的角度,价值就在于可以提高生存的概率。

知识是“被确证的真信念(Justified True Belief)”

我们终其一生都在学习知识,但是很少思考过什么是知识及知识的概念。

何谓“知识”,柏拉图在其著作《泰阿泰德篇》中给出了一个经典的回答:知识是“被确证的真信念(Justified True Belief)”。

也即只有当同时满足以下三个条件时:

1.命题P为真。

2.S相信命题P为真。

3.S有确证的或合适的理由相信命题P为真。

“S知道P”这一命题才能为真,也即此时我们可以说“S具有知识P”。反之如果“S具有知识P”为真,则以上三个条件也必然为真。

简单举例:

1.周末会刮台风。

2.小王和别人打赌周末会刮台风。

虽然“周末刮台风”为真,而且小王相信周末会刮台风,但是小王并不具有一个“确证的”理由去相信“周末会刮台风”为真,换而言之对于小王而言,“周末会刮台风”这一信念是未得到辩护的,其中带有猜测的成分,所以在这种情况下我们并不能称“小王知道周末会刮台风”。

只有当:

1. 周末会刮台风。

2.小王相信周末会刮台风。

3.小王之所以相信周末会刮台风是因为看了天气预报。

这三个条件同时满足时,命题“小王周末会刮台风知道周末会刮台风”才为真。

柏拉图的JTB理论是西方哲学界影响最为深远的知识定义,虽然一直存在争议。我们在此并不细究知识的概念究竟应该如何定义。从JTB理论,我们至少确定的是,知识的最小单位是命题(Proposition)。由概念组成了命题,命题进一步扩展成为命题网络。

”地球是圆的“、”光的传播速度是30万公里/秒“、”达芬奇是文艺复兴时期的意大利人“等,这些命题有共同的特点是它们都是关于事物是什么(What)和为什么(Why)、可陈述的知识(Declarative Knowledge)。

如果说一个人会开车,我们一般称他掌握开车的技能;会炒菜,掌握了烹饪的技能;会跳舞,掌握了跳舞的技能。技能是关于怎么做(How)的知识,一般称之为:程序性知识(Procedural Knowledge)。

技能(知识)的最小单位不是命题,而是“产生式”(Production),大概的含义是:在具体情形(Condition)下,如要达到某个目标(Goal),需要执行或完成某一个动作行为(Aciton)。例如,站在电梯里,如要上到6楼,需要按下标有数字“6”的按钮。所谓技能,是若干步骤和具体行为的集合,或者说一组“产生式系统”(Production System)。比如计算1/4+1/5等于多少的过程:

知识最重要的价值之一是减少不确定性,作为程序性知识的技能当然也如此。陈述性知识所解决的认知上的不确定性,包括:判断、预测、推理和决策等。而程序性的知识所针对的是行为的结果或者成效的不确定性。

例如,煎出色香味俱全的太阳蛋是一种技能,包括了若干的行为步骤和对火候的把握。”色香味俱全“是行为的结果,如果缺少技能,可能就偏移了这个想要的结果,产生其他的可能性:煎过头了、蛋黄碎了甚至煎焦了等。同理,开车是一种技能,如果不会倒车,产生的可能性就有:撞到别人的车、把车停到车位以外甚至停不进车位等。

知识的“层级—网络模型”(HNM)

陈述性知识和程序性知识,两种类型的知识在大脑中有没有统一的模式或者使用统一的视角来分析这两类知识?

“层级—网络模型”(Hierarchical Network Model)可堪重任。

先来看陈述性知识,其最小的知识单位是命题,命题=概念+关系。

首先,概念有大小之分,大概念包含小概念,小概念嵌套在大概念中,表现为明显的层级性。同时,在同一层级内,概念与概念之间组成命题,命题与命题进一步组成了命题网络。

例如下面这四个命题:

维C预防感冒

维C促进白血球的生长

白血球消灭病毒

病毒引起感冒

大脑认知的主要任务是表征(Represent)现实世界。“表征”是心理学和认知科学的学术译法,如果使用“再现”来翻译更容易理解。陈述性的知识本质上是我们用来描述、解释以及预测世界,也就是在心智世界中再现现实世界。但是这种“再现”并非原封不动的高保真还原,而是提取和抽象出现实世界所拥有的结构:层级—网络结构。

如果陈述性知识的“砖块”是概念,那么程序性知识的“砖块”则是行动。同样地,行动有大小之分,一个行动向下可以拆分为小的操作,向上归属于大的步骤,呈现为明显的层级性。

在同一层级上,行为与行为衔接组成行为链,似乎组成的并非网络结构。不过我们试想一下:假设有四个行为步骤,行为a-行为b-行为c-行为d,如果a和d只有一种选择,而b可以有b1/b2/b3/b4,C有c1/c2/c3/c4等不同的选择,那么从a到b的可能性路径全部展现出来也是网络结构,只是在每个行为阶段都会做出唯一的选择,从而形成首尾相连的链条。

所以,不管是陈述性知识还是程序性知识,在结构上是同构的,它们都拥有一个层级化的网络结构。 网络结构并不仅仅体现在同一层级或一个层级的平面上,如果我们从这个模型的侧面来看,上层概念与下层概念之间,同样构成的是网络。

我们头脑中的知识就保存在这样的层级-网络结构之中。不过,一般我们不这样称呼它,而称其为:图式(Schema)。对于陈述性知识,图式又可称为模型(Model)或者模式(Pattern);对于程序性知识,可称作脚本(Script)。

语言的层级-网络结构

语言是我们沟通信息的媒介,也是大脑思维的工具。语言的语法结构和组合方式具有明显的层级-网络结构。

(一)微观层面:

从表面上看,我们说话或者写作所表述的句子是一个挨着一个的一串词,实际上,它的内部组织有层级的。字组成词,词与词构成词组,任何一个词组还可以与其他的词或词组再组合构成更大的词组。语言中的句子,不管多么复杂,是一层层嵌套起来组成的。

例如这句话:

每个住户都必须参加社区的核酸检测。

(二)中观层面:

句子——段落——章节——书籍(单册)——合辑(多册)

句子再往上组成了段落,段落组合构成了章节,章节与章节构成了一本书,而书与书可以组成一个主题下的合辑。

每个层级上的组成元素,彼此之间可以组成语义的网络,比如:“红色”这个形容词,可以与不同类别的名字组合:红色的汽车、红色的花朵、红色的房子等等。

我们在听人说话或者阅读文字时线性的顺序,但是在组合方式上是存在不同的可能性。例如,小说的不同章节可以按照时间先后进行组合,那就是顺序的记叙方式,也可以是倒叙,把本来发生最末的故事的章节放在最小说结构的最前面。

建构主义的知识观

在2006年之前的中小学课本中关于太阳系的介绍都是九大行星围绕太阳这颗恒星运动。但是,在2006年国际天文联会通过一项决议,将冥王星划为“矮行星 ”,从行星行列中除名,自此九大行星便变为八大行星(水星、金星、地球、火星、木星、土星、天王星和海王星)。

”地图并非疆域“(Map is not territory)这句名言在冥王星”降级“的事件中得到了诠释。太阳系运转着的星球数量和运行方式没有变化,但是太阳系拥有九大行星这个知识随着人类对太空和星球的认识的加深改变了。

如果我们把层级化的网络结构比作建筑,那么知识这座建筑是我们建构出(Construction)来的,并非原本就存在那里,一直等待我们去发现。在这个意义上,”发现真理“这句话是存在一定误导性的,它所表达的是,”真理“是好似一个藏在海底的宝物,需要我们去发现。

瑞士著名认知心理学家、儿童心理学家和教育家皮亚杰认为,人类的认知发展主要分为三种基本过程:同化、顺化和平衡。

同化(Assimilation)

同化原本是一个生物的概念,它是指有机体把外部要素整合进自己身体结构中。在认知发展理论中,同化是指个体对外部信息输入的过滤或改变。

个体在感受到刺激时,把它们纳入头脑中原有的图式之内,使其成为图式的一部分,就象消化系统就把营养物质吸收到身体中一样。

例如上图中,小孩儿把猫咪放入到狗狗的”图式“之中。

顺化(Accommodation)

顺化是与同化伴随而行的过程:当个体遇到不能用原有的图式来同化新的输入时,便要对图式加以修改或重构,以适应新环境。

小孩儿发现猫与狗还是有区别的,所以调整原有图式,建构出猫这个类别的图式。

平衡(Equilibration)

平衡是认知发展从一个平衡状态向另外一个较高平衡状态过渡的过程。个体每当遇到新的刺激,总是试图用原有图式去同化,若获得成功,便得到暂时的平衡。如果用原有图式无法同化环境刺激,个体便会作出顺化,即调节原有图式或重建新图式,直至达到认识上的新的平衡。同化与顺化之间的平衡过程,也就是认识上的适应,也就是人类智慧的实质所在。

"智慧行为依赖于同化与顺化这两种机能从最初不稳定的平衡过渡到逐渐稳定的平衡。”(皮亚杰,1980年)

结合层级化的网络结构模型,同化的过程就是使用知识结构来解释和预测(陈述性知识)现实世界或者控制和影响外部环境(程序性知识)。

顺化,则是当该知识结构不能很好地解释或控制环境,进行改变和调整乃至重构。同化是立,顺化是破,平衡就是先立而破,破而再立,知识结构随之迭代和升级。

这就是建构主义的知识观或者认知论(Constructivist Epistemology )。

知识的理解:“凡是我不能创造的,我就无法理解。”

著名物理学家、诺贝尔物理学奖获得者理查德·费曼在去世的那一年(1988年)在黑板上写下了一句话“凡是我不能创造的,我就无法理解。”(What I cannot create, I do not understand.)

比尔·盖茨称费曼不仅是卓越的物理学家,也是伟大的老师和教育家。他在临终之际,希望通过这句话告诉他的学生们,如果要想真正理解一个概念和理论或者现象,就需要在头脑中自己来搭建关于它的知识结构和网络,并且用自己最通俗的话来解释。

无独有偶,费曼的老师,著名理论物理学家约翰·惠勒曾经说到:”要想了解一个新的领域,就去开一门这个领域的课程……就写一本关于那个领域的书。大学里为什么要有学生?那是因为老师有不懂的东西,需要学生来帮助解答。““书”和“课程”都是关于这个“新的领域”的知识是如何构建和组织起来的。

美国认知心理学家丹尼尔·威林汉姆(《为什么学生不喜欢上学》作者)说:“理解其实是伪装起来的记忆。”人并非在“真空”中理解一个新的知识,而是要将长时记忆中旧的知识提取到工作记忆当中,与新的知识进行对比和联系,才能理解新的知识的意义。

类比就是重要的建立联系的方法。比如,如何让小学生理解欧姆定律(电流与电压成正比,与电阻成反比),他将电流到导体中的流动类比于水流在水管中的移动,水流的速度与水压成正比,与水管给水流带来的阻力成反比。

瑞士认知科学家、儿童心理学家皮亚杰(也是建构主义心理学理论的开创者)有句名言:“理解就是创造。”(To understand is to invent.)

对于幼儿来讲,他理解一个事物,需要亲自动手“操作”对象:移动、拆解、拼搭、组合等。随着认知的发展,这些操作的动作会内化为心理行为也就是我们的认知过程,因此我们理解一个新的知识,我们就需要在心智的“操作间”中对其结构和网络进行构建。

知识的应用:举一反三迁移知识

《论语·述而》:“举一隅不以三隅反,则不复也。”

有一天,孔子对他的学生说:我举出一个墙角,你们应该要能灵活的推想到另外三个墙角,如果不能的话,我也不会再教你们了。后来,大家就把孔子说的这段话变成了“举一反三”这句成语,意思是手工艺:学一件东西,可以灵活的思考,运用到其他相类似的东西上。

知识的高层次应用就体现为“举一反三”。世界变动不居,知识日新月异,“吾生也有涯,而知也无涯”。面对新的问题,一方面我们要学习新的知识,另一方面,也是更重要的方面,是要善于知识的迁移,灵活使用已有的知识去应对新的挑战。

从上面这个例子可以看出,知识之所以能够迁移并解决问题,是因为不同的问题存在相同或者相似的结构。不过,从知识的结构(层级-网络结构)出发,知识能够迁移,还在于处在更高层级的知识,特别是抽象程度较高的概念、原理和理论等,能够解释不同的现象。换句话说,不同的问题,虽然场景各异(行业、学科、专业等),但是它们的底层原理有共通之处。

专家与新手最大的区别之一在于,专家可以使用更高维度的知识来考察和分析不同的问题。在他们的眼里,万法归宗,纵然题面不一,但是解题的核心逻辑是一致的。

比如,折纸飞机的方法有千百种,对于高手而言(比如在全球折纸飞机大赛上有获奖),他们思考和设计纸飞机时首先考虑的不是造型、材料或折法上的技巧,而是从飞行器的基本原理上入手。如果希望飞得更高,如何才能提高升力?想要飞得更高,重量和阻力如何才能减小?

从知识的层级-网络结构上看,飞行器的原理是更高层级的知识,不同纸飞机的表现形态只是在较低层级上的体现。

知识的学习:概念驱动的学习方式

陈述性知识关于What 什么和Why为什么,属于内容知识。程序性知识是关于How怎么做,是技能。目前学校教授的知识基本是按照这样的二维结构来组织。

美国教育心理学家林恩·埃里克森提出了三维结构的课程设计和教学框架。在事实Fact和技能Skill之外引入了概念Concept这个维度。

IB课程体系是全球知名的四大课程体系之一,在它的小学+初中阶段(PYP)阶段的课程中开设六大学习科目:语言、数学、艺术、社会、科学、个人/社交教育和体育。在此之外,IB PYP 提出了八大核心概念,分别是:形式Form、功能Function、因果Causation、变化Change、联系Connection、视角Perspective、责任Responsibility和反思Reflection。这些大概念将贯穿所有的学科,帮助学生通过跨学科的思维模式认识真实的世界。

在知识的层级-网络结构之中,概念处于较高的层级,它是对不同事物和现象的概括和抽象。概念与概念组成的层级-网络结构,就像一张大网,能够将具体的知识内容和技能统筹起来。在结构的顶端是这个领域知识的核心原理和基本模型。

这样一种建构主义的学习观,不仅适用于K12教育,同样适合成年人的能力提升。例如,一家互联网平台针对如何提高收入(GMV)使用一个简洁的公式推论出核心的策略。如果你是该平台的运营总监,通过层级-网络结构的分析,就能快速捋出工作的思路。

知识的创建:溯因推理产生新知

一般认为,人类生成知识的方式主要是基于归纳和演绎两种推理形式。

归纳,从特殊到一般,从个体的特征抽象出总体上的属性。

例如,拿铁是萃取后的咖啡加牛奶,卡布奇诺是咖啡加牛奶,Flat White也是……进而推论,意式咖啡都是咖啡加牛奶。

演绎,从一般到特殊,从总体的属性这个大前提推演出个体的特征。

目前纯电动车的续航都没有达到1000公里,小鹏汽车是纯电动车,因此小鹏汽车的续航肯定不到1000公里。

但是美国现代哲学家、逻辑学家和符号学家皮尔斯提出第三种推理方式——溯因推理,并且他还认为人类的新知或者科学发现的基本逻辑是溯因推理。那什么是溯因推理呢?来看一个例子:

演绎推理:

  推理R:停在斑马线上的车子都会被开罚单

  P:这些车子停在斑马线

  Q:这些车子都会被开罚单

归纳推理:

  P:这些车子都停在斑马线上

  Q:这些车子都被开了罚单

  (可能性)推理R:停在斑马线上的车子都会被开罚单

溯因推理:

  Q:这些车子都被开了罚单

  (假定性)推理H:停在斑马线上的车子都会被开罚单

(可能性)P:这些车子都停在斑马线上

在这个溯因推理方法中,假定性推理(也称假说,Hypothesis)的内容就是:若P(车子停在斑马线上),则Q(车子会被开罚单)。一般而言,要去证实这项假说,可能大费周章;然而,却能轻易地从反面去”否证”或证伪它。

这也就是俗称的”假说-证伪”思维方法。例如,停在斑马线上的车子,发现了其中一辆或多辆车子没被罚,就否定掉该项假定性推理了。

皮尔斯认为,只有溯因推理才是唯一能够生成新的知识。他认为,归纳只是对于经验现象的总结和概化,这种扩充性仅仅限于外显特征的描述性总结;演绎是分析性的推理,所有的信息都已经蕴涵在前提假设当中了,这个过程中没有新知识的生成,只能推断出必然的结论。

皮尔斯还认为,这三种推理合在一起共同构成一个完整而动态的循环,推动了科学知识的进步:

第一阶段:

通过从结果到前因的溯因推理提出或想象性地“猜测”(nothing but guessing)出某种可能的(plausible)因果解释假说。

第二阶段:

运用定理式的演绎推理来得到新推论、构造新实验以验证该假说。

第三阶段:

从实验结果中收集更多新的事实,以归纳推理来完成对新推论的检验,包括探明这些新的事实是否与原先经验相一致,进行分类并搞清楚这些假设在多大程度上得到了证实等。

此时,如果出现了更多“新奇的事实”,那么就需要新的一轮溯因推理来寻求解释,依此循环。

关于归纳、演绎和溯因三种推理形式的区别以及之所以溯因可以产生新知,我们可以用层级-网络结构来解释。

归纳推理:

从下层的元素总结和概括出共通的特征、属性或者规律、模式等。处于上层的概念又可以进一步总结和概括出更上一层的概念。

例如,无脊椎动物、爬行动物、两栖动物、鸟类、哺乳动物等的上层概念是动物,而动物与植物、细菌等又是生物的下层概念。

演绎推理:

上层概念是低一级概念的抽象,因此可以由上层概念推理出位于下层的元素的特征、属性或者规律、模式。

纯电动车使用电动马达驱动车轮前进,特斯拉是纯电动车,因此特斯拉使用的是电动马达。进一步来讲,凡是电动马达,都需要电池提供能量,因此特斯拉的车肯定有电池。

可以看出,归纳是自下而上的推理,演绎是自上而下的推理。而溯因推理以及皮尔斯提出的科学探究过程是一种反复循环的环状过程:

先从下一层的事物得出一种假说来解释观察的现象,这个假说处于现象的上层,这个过程是自下而上。这个假说是否成立,需要以其为大前提做出推论,并在现象层面寻找例证尤其是反证。

如果找到或者经由实验得出不支持推论的例证,那么这个假说就被证伪。如果没有发现反例或者没有被证伪,我们说该假说暂时就是成立的。证实或证伪是自上而下的过程。

Learn—Unlearn—Relearn

著名的战斗机飞行员、军事思想家和战略家约翰·博伊德(John Boyd)是著名的OODA 环的创立者。他有一个思想实验,:

一艘摩托艇

一辆坦克

一辆自行车

还有一个滑雪者(踩着滑雪板)

假如这个滑雪者有以上的器械,他如何才能在雪地里以更快的速度行进?方案是,把它们拆解开来:

摩托艇的外壳和发动机

滑雪板

坦克的履带

自行车的轮子、把手和齿轮等

这样就可以组合和装配出来一辆可以高速飞驰的雪地摩托车,当然前提是你的头脑中先要构造出雪地摩托的概念。

博伊德的思想体系对美国战斗机的设计和空战思想有巨大的影响,他的核心理念也是OODA环的内核思想浓缩在他的一篇文章中:DESTRUCTION AND CREATION(《破坏和创造》)。

破坏就是解构,创造就是建构。Structure建构, Unstructure解构, Restructure重组, Unstructure解构, Restructure重组……这是一个辩证的循环过程,没有止境,迭代升级。

      OODA LOOP


著名未来学家托夫勒有一句名言:””21世纪的文盲不是不会阅读和写作,而是不会学习(Learn)、放空(Unlearn)、再学习(Relearn)。“

托夫勒、博伊德的思想与皮亚杰有异曲同工之妙,都是建构—解构—重构的辩证循环(Dialetic Cycle)。

神经科学发现,人类大脑皮层接收到的视觉信息有80%并非来自视觉神经,而是来自记忆的提取和组合。而我们视觉信息占到我们全部信息来源的80%以上,也就是意味着,我们眼中的世界更多是大脑”虚拟“出来的。毫无疑问,我们所谓的”知识“更是一种”虚构“出来的”地图“。

”地图并非疆域。“知识有些时候是福音,而有些时候却是诅咒。如何破咒?

关键的心法是,你对头脑中知识的建构——解构——重构拥有绝对的所有权!

你可能感兴趣的:(机器已会学习的时代需要怎样的知识观?)