老公身上发现唇印,出轨概率有多大?算法可以帮到你

大脑的工作记忆在处理信息时存在局限,同时只能应付4到5个信息组块。对于如何突破瓶颈,上一篇文章中我们提出了MADE模型Model模型、Automation自动、Decompostion分解Externalizaiton外化

人类的长时记忆是一个具有无限空间的“硬盘”,理论上可以存储的数据没有上限,但是获取数据、处理数据以及保存数据的过程都必须消耗时间和能量,所以人类在进化过程中逐渐迭代出了非常有效的节省数据的方法。总结起来是一个“粉笔”模型”——CHALKSConcept概念、Heuristics启发式、Algorithm算法、学习和知识Learning& Knowledge与社会计算Social Computing。

文章目录

  1. Concept概念:事物之间相似性的浓缩

  2. Heuristics启发式:减少问题空间中的搜索和计算量

  3. Algorithm算法:利用有限的数据解决问题

  4. Learning&Knowledge学习与知识:通过编码和抽象节省数据

  5. Social Computing社会计算:社会网络是一种算法

(全文约12000字,预计阅读时间为30分钟)
image

Concept概念:事物之间相似性的浓缩
近日,由“汽车之家”创始人李想所创立的理想汽车计划在美国上市。目前市面上的电动车大致分为两种类型,一种是纯电动车,只是靠电池驱动马达带动车轮,比如特斯拉;另一种是混合动力,既可以使用电动模式,又可以使用内燃机驱动。但是理想汽车推出的车型“理想ONE”比较特别,车轮是由电动机驱动,但是车上又搭载了以燃油为动力的发电机给电池充电。这就产生了一个市场认知的问题,“理想ONE”到底是电动车中的纯电车型,还是混动车型呢?

这其实是一个概念的内涵与概念所指的对象之间产生矛盾的问题。“电动车”及纯电”和“混动”都是市场指称某一类车型的概念。从符号和语言上,“概念”是一个指代具体对象(可以是具体的事物,也可以是抽象的理念)的名词。

从大脑运作角度,概念是人类认知最重要的功能之一。重要程度之高,可能关乎人的基本生存。为什么这样讲呢?因为概念与分类密切相关。试想我们的祖先生活在丛林或草原中,一个原始人突破看到前面来了一只大型的有着锋利牙齿和爪子的动物。如何来判断它是危险的还是安全的?他会下意识地快速将眼睛的动物与头脑中已经储存的危险动物的概念进行比对。如果落到危险动物的类别里,就马上奔跑逃离;如果不是,则可以安心捕猎或赶路。我们通过概念来对未曾见过或经历过的事物进行快速分类,从而判断它的属性以及与我之间的关系(有利or有害?)。

在这里的“概念”并不是一个符号或词语,而是一种心理表征,是将有相似性的事物的共同特征进行提炼和浓缩后的存储于大脑的信息。我们可以将概念形象地理解为脱水后的蔬菜,比如青椒。不同的青椒有各自的大小、形状和颜色深浅等特征,但是一旦脱水后就变得很小并且几无差别。

关于概念在大脑中的生成和存储不得不谈及“认知经济性”原理(Cognitive Economy)。大脑对于有共同特征的事物,会提取它们的特征和属性进行储存。举例来讲,贵宾犬有毛、尾巴和四条腿;中华田园犬也有毛、尾巴和四条腿;斗牛犬也是。那么大脑在存储时,会把“有毛、尾巴和四条腿” 的共同特征存储于“狗”的这个上位(high-level)概念中,而贵宾犬、中华田园犬和斗牛犬等从属于“狗”的类别,而不用每一种犬都单独再存储“有毛、尾巴和四条腿”的信息。

image

提取事物相似性的一面,压缩保存于概念之中,并通过概念进行分类并产生推理和行动,这是认知经济性原理的体现。在此过程中,我们自然节省了对数据的获取、处理和存储上的负担,尤其是在时间和能量上。 脱水蔬菜在食用时,需要加水还原,类似地,在使用概念时要根据具体场景进行还原。面对一只小狗,我们会在“狗”这个概念上填充这只狗的细节信息,在相似性的基础上丰富其差异性的一面。认知心理学将这一过程称之为“概念级联”(Concept Casacade),是与概念建构相反的过程。

Heuristics启发式:减少问题空间的搜索和计算量

先来做一个有意思的题目:

D O N A L D
+G E R A L D
————————
=R O B E R T

任务要求:(1)把字母换成数字; (2)字母换成数字后,最下面一行数字答案必须等于第一行与第二行之和。这是一个看似没那么复杂,但是解题的可能性多达300万个的密码算术题。

公式中共有10个字母,每个字母都可能是0-9中的任意一个;共有三行字母,每行六个字母,所以总的可能性为300万=3×10^6。
不过,因为我们知道了一个线索:D=5,则各种可能的尝试减为30万=3×10^5。

解决该题的有效方法是先找出可能性最少的列,从中获得最多的信息,再利用加法中的某些规则去进行推理,从而找到正确答案。这种方法叫做启发式搜索 (Heuristic Search)。所谓可能性最少的那一列,就是限制性最多的那一列。

例如,从右侧开始:

第一列:T=D+D,D=5,T=0,同时要进一位。

第二列:R=2L+1,根据奇数和偶数的知识,两个L相加必定是偶数,再加上进位的1,R 必定是奇数,因为已知D=5,所以R可能是1,3,7或9。
从上面的分析中已知道R>5,所以R只可能是7或9。

第三列:没有更多的信息,A和E均为未知数。

第五列:有最大的限制性。因为O+E=O,所以E只可能是0或9已知T=03所以E=9。

将式中所有的E都换成9,再回到第三列。

第三列:A+A=9,A+A应是偶数,而9是奇数,这就说明第二列必须进一位,这样就得出A=4c在第二列已知R可能是7或9,既然E=9、所以R=7。

第二列:2L+1=17。故L=8。

第六列:D+G=R。即5+G+进位1=7, 放G=1。

现在只剩下三个字母O、N、B和3个数: 2、3、6了。随便试一下就可以得出N=6,B= 3,O=2。

最后结果变成:

5 2 6 4 8 5

+1 9 7 4 8 5
——————
= 7 2 3 9 7 0

能够解答这个问题的人几乎都用了这种方法,只利用了6个可能性,而不是经过30万次的尝试。启发式搜索又称为Informed Search,原因在于利用题面和长时记忆中已有的信息,排除大量的尝试,达到解决题的目的。换言之,减少在问题空间进行搜索的范围和数量,从初始状态到达最终状态。人在解决问题过程中主要采用的启发式方法有三种:1、手段-目的 分析法(Means-Ends Analysis)
2、爬山法(Hill Climbing)
3、逆推法(Working Backwards)

手段-目的分析法Means-End Analysis
作为启发式方法的一种,它是指将解决问题过程中需要达到的目标状态分成若干子目标,通过实现一系列的子目标最终达到总目标。基本步骤:
1、比较初始状态和目标状态,提出第一个子目标;
2、找出完成第一个子目标的方法或操作;
3、实现子目标;
4、提出新的子目标。

例如,我计划从深圳去上海。初始状态是人在深圳,目标状态是人到达上海,上海与深圳之间的距离就是差距。为了缩小差距,首先需要设定一个子目标——选择交通工具:A.飞机;B.高铁;C.轮船;D.汽车。为了节约时间,选择飞机。接下来,需要预订符合时间要求的航班。确定后又产生另一个子目标,如何去机场?可能的选择有:开车、打的或者地铁。由于行李比较重,又要赶时间,需要选择打的。最终乘上飞机顺利抵达上海。

再来看一个“韩信分油”的问题。这是是在我国民间流传已久的一道数学游戏题。题目是这样表述的:韩信分油——3斤葫芦7斤罐,10斤油篓分一半,请向怎么分?

“3斤葫芦7斤罐,10斤油篓分一半。”就是要用3斤、7斤和10斤这样三种容器来分出两个5斤,而量器也只能是这三件东西。由于5的组合方式只有1+4和2+3两种,利用现有的这三种容器没法直接分,所以需要另想办法。即用3斤的葫芦从10斤的篓中舀两次装入7斤的罐中,再舀一次把罐装满,这时篓中还剩1斤,葫芦中还剩2斤;再把罐中的油全倒回篓中,这时篓中共有8 斤油;然后把葫芦里剩的2斤倒入空罐中,这时罐中有2斤油;最后再从篓中舀一葫芦油装入已有2斤油的罐中,则罐中油就由2斤加上新舀来的3斤,正好等于5斤,而这时篓中油也就只剩下5斤了。于是两个5斤油被分出来了。
image

爬山法Hill Climbing
爬山法,顾名思义,假设我们想登上最高点,但又不知道具体的路径,比较务实的方式是,先选择周围最高的山头登上去,再在山顶观察你所在位置附近更高的山头登上去。反复上山下山,逐步登上最高的山峰。例如,你希望登上世界最高峰,但你暂时不知道是哪个山峰,而你有可能在地球上任意的地方。

你可以采取的策略:
1、先找到周围方圆10公里内最高的山峰;
2、登上该山峰,再观察和测算另外10公里内最高(比第一个登高)的山峰;
3、如此反复登上一个接一个更高的山峰;

4、最终找到最高的那座山峰然后登上去,此时你环顾四周已经找不到更高的山峰。爬山搜索也到此为止。
image

逆推法(Working Backward)
首先分析目标,以确定为达到目标所采取的最后一个步骤是什么,然后再分析紧挨着最后一步的前一步,以此类推。

以上面的深圳到上海的旅程为例。目标是抵达上海某个目的地,到达前的一步是从浦东机场出发乘车;再往前一步是飞机降落在机场;继续往前推,飞机从深圳宝安机场飞往上海;登上计划飞向上海的航班;乘车达到宝安机场;预订航班等等。当逆推的路径唯一时,逆向分析的解决问题的方法往往更为有效。

逆推法和手段——目的分析采取的同样方法是,两者都通过创建子目标来减少当前状态与目标状态之间的差异。手段-目的分析法、爬山法和逆推法,这三种主要的启发式解决问题的方法,共同的特点是都在尽可能地减少对信息的获取和处理。任何一个问题的解决,可以理解成为在问题空间中进行搜索的过程,搜索的对象是解决问题需要的步骤(节点)数量和节点可能的分支的数量。节点与节点之间的路径即是问题的初始状态到目标状态之间的路径。假设某个问题的解决路径有10个节点(步骤),每个节点可能有5种分支(可能性),那么总的路径可能性为:5^10。
如何减少对如此大的数据量的处理?
第一、根据已有的信息将不可能或不可行(比如成本过高)的去除;
第二、先处理少量的关键信息,比如先考虑主要的节点,至于每个节点会有多少可能性暂不考虑;
第三、每一次只处理有限的信息,比如手段—目的分析法和逆推法中先考虑如何达到过程中的某个子目标及其可能的路径。

当然,启发式方法并不能保证问题的解决,因为并没有遍历问题空间的所有部分或者说每一种可能性。所谓遍历(Traversal),是指沿着某条搜索路径,依次对每个节点均做一次访问;然后再搜索其他的路径并保证没有遗漏。比如,如果采用爬山法,可能出现的问题是爬上的某座山峰周围并没有比它更高的山峰,登山者可能以为这就是最高峰了,但其实并不是。

Algorithm算法:利用有限的数据解决问题
狭义上的算法主要是指数学和计算机领域的一系列解决问题的清晰指令,能够对一定规范的输入,在有限时间内获得想要的输出。广义上讲,算法可以理解为解决问题的方法和步骤。例如,喝茶的”算法“:烧开水、洗茶壶和茶杯、把茶叶到进入茶壶冲泡、倒进喝茶的杯子、端起茶杯喝茶。炒菜的”算法“:到菜市场买菜、洗菜切菜、开火并往锅里倒油、把菜和佐料等倒入锅里翻炒、起锅、端上餐桌等。手冲咖啡的”算法“:磨咖啡豆、烧开水、安装好滤纸和杯子、用水壶将热水缓缓倒入咖啡粉、品尝咖啡等。站在信息的角度,算法以及相关的计算意味着,对数据和符号等进行一些列的操作,得到想要的信息从而解决问题。选择合适的算法将有效地节约对数据和信息在量上的需求,还可以减小处理过程中的计算量。在计算机领域,前者意味着节约(内存)空间,后者则是节省(计算)时间。算法有成千上万种,下面介绍两种对于理解算法的作用和价值非常有帮助的典型算法:贝叶斯算法和遗传算法(属于进化算法的一种)。
贝叶斯算法
概率是我们日常生活和工作中经常接触到的概念,概率分为正向概率和逆向概率。1.正向概率:假设袋子里有N个白球,M个黑球,伸手摸一把,摸出黑球的概率是多大。2.逆向概率:如果事先不知道袋子里黑白球的比例,而是闭着眼摸出一个或好几个球,观察这些取出来的球的颜色之后,可以就此对袋子里的黑白球的比例作出推测。
算法界大名鼎鼎的贝叶斯定理解决的就是逆向概率的问题。通过下面这个有意思的思想实验来认识一下贝叶斯的核心思想。假如你是一个女生, 你在你的老公衬衣上发现了一个唇印,那么他出轨的概率是多少?可以把这个问题分解为几步:
1、你认为你的老公出轨的概率是多少(不考虑任何状况和条件)?
2、你老公身上出现唇印的概率是多少?(不管是否有出轨。比如,没有出轨的话,在挤地铁时某个女生的嘴无意中撞到了他);
3、如果你老公出轨了, 那么他会有唇印在身上的概率是多少?
我们假设出轨这个事件为A,唇印的事件为B。我们称P(A)、P(B)为先验概率,其实是一种主观的假设(信念)。P(A|B)和P(B|A)为后验概率,又称为条件概率,即:事件A在另外一个事件B已经发生条件下的发生概率,P(A|B);事件B在另外一个事件A已经发生条件下的发生概率,P(B|A)。贝叶斯的计算公式表达为:P(A/B)=P(B/A)P(A)/P(B)发现老公有唇印他出轨的概率为:老公出轨概率(发现唇印)=老公有唇印(发生出轨)的概率老公出轨概率/老公有唇印的概率

image

为了加深你对贝叶斯定律的理解,我们再来看一个题目: 一座别墅在过去的10年里一共发生过5次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率为百分百。
现在的问题是:此时,狗狗又叫了,请问,这个时候发生盗窃的概率是多少?一般的朋友会这么分析:每次来小偷了,狗都叫了,现在狗又在叫,那出现小偷的概率是非常高呀!
实际情况不是的,按照贝叶斯定律,计算公式如下:
狗叫同时有小偷的概率=正常的被盗概率X(被盗时狗叫概率/狗正常叫的概率)
正常的被盗概率=5次/(10年365天) = 5/3650
被盗时狗叫概率=100%
狗正常叫的概率=3次/7天=0.43。
按照公式很容易得出结果:
狗叫同时有小偷的概率 = (5/3650)
(1.0 / 0.43) =0.001369*2.3255=0.003184

看似简单的公式实则蕴藏着巨大的威力。这要从一次核潜艇事故说起。1968年5月,美国海军的天蝎号核潜艇在大西洋突然失踪,潜艇和艇上的99名海军官兵全部杳无音信。为了寻找天蝎号的位置,美国政府从国内调集了包括多位专家的搜索部队前往现场,其中包括一位名叫John Craven的数学家,他的头衔是“美国海军特别计划部首席科学家”。
在搜寻潜艇的问题上,Craven提出的方案使用了上面提到的贝叶斯公式。他召集了数学家、潜艇专家、海事搜救等各个领域的专家。有趣的是,Craven并不是按照惯常的思路要求团队成员互相协商寻求一个共识,而是让各位专家编写了各种可能的“剧本”,让他们按照自己的知识和经验对于情况会向哪一个方向发展进行猜测,并评估每种情境出现的可能性。据说,为了给枯燥的工作增加一些趣味,Craven还准备了威士忌酒作为“投注”正确的奖品。

由于失事时潜艇航行的速度快慢、行驶方向、爆炸冲击力的大小、爆炸时潜艇方向舵的指向都是未知量,即使知道潜艇在哪里爆炸,也很难确定潜艇残骸最后被海水冲到哪里。Craven粗略估计了一下,半径20英里的圆圈内的数千英尺深的海底,都是天蝎号核潜艇可能沉睡的地方。他把各位专家的意见综合到一起,得到了一张20英里海域的概率图。整个海域被划分成了很多个小格子,每个小格子有两个概率值p和q,p是潜艇躺在这个格子里的概率,q是如果潜艇在这个格子里,它被搜索到的概率。按照经验,第二个概率值主要跟海域的水深有关,在深海区域搜索失事潜艇的“漏网”可能性会更大。如果一个格子被搜索后,没有发现潜艇的踪迹,那么按照贝叶斯公式,这个格子潜艇存在的概率就会降低。
image

由于所有格子概率的总和是1,这时其他格子潜艇存在的概率值就会上升。每次寻找时,先挑选整个区域内潜艇存在概率值最高的一个格子进行搜索,如果没有发现,概率分布图会被“洗牌”一次,搜寻船只就会驶向新的“最可疑格子”进行搜索。过几次搜索,潜艇果然在爆炸点西南方的海底被找到了。
image

假如采用常规的搜寻方式,还是把这片海域分成若干小的区域挨个进行搜索,不知要耗费多少的人力、船只和时间。因为搜索的空间太大,需要收集并且处理的数据跟海水一样难以计数。而采用贝叶斯算法后将数据的获取量和处理的计算量都大大节约了。

遗传算法
我们可以把生物进化的过程看作获取数据并进行计算的过程。比如,某种生物从水生生物进化成陆生爬行动物的过程中,这个物种如何才能知道自己进化成为什么样才能适合陆地上的生存呢?原来的鳍自然没有用了,那用什么来运动呢?腮也没法用了,怎么呼吸空气呢?鳞片(假如有的话)和尾巴还需要吗,是否要保留?毕竟没有一个全能的设计师来规划和设计这些细节,也没有工程师来验证设计是否合理。

有句话大意是,鸟的翅膀上有空气的知识,鱼的鳞片上有海水的知识。”适者生存“,生物必须适应具体生存空间的环境才能生存。身体的构造和机能所包含的信息来自于生物种群与环境的互动。假如有个产品经理来规划生物应该有什么样的器官、体型、重量、呼吸方式、行动方式、觅食方式等,不难想象对数据的要求是极大的,他必须要全面和彻底地了解该物种所处的生态位的各种环境信息,包括:温度、湿度、物种、水源、天敌、食物来源等。生物的身体必须要与环境的信息相匹配,否则面临的将是物种的淘汰和灭绝。

这样问题就来了,大自然并没有这样的”产品经理“。那么,看似有方向性的生物进化所需要的信息来自哪里呢?或者说是以什么样的机制产生并且保存于生物的DNA当中的呢?答案是:进化算法。其中,遗传算法是最具有典型性也被研究得最多的一种进化算法。

进化算法是以达尔文的进化论思想为基础,通过模拟生物进化过程与机制的求解问题的方法。生物进化是通过繁殖、变异、竞争和选择实现的;而进化算法则主要通过选择、重组和变异这三种操作实现优化问题的求解。

遗传密码作为一种指令封装在每个细胞中,并以基因的形式包含在染色体中。每个基因产生的个体对环境有一定的适应性。基因杂交和基因突变都可能产生对环境适应性更强的后代。 一般的遗传算法包含有3个基本操作:复制(reproduction)交叉****(crossover)变异(mutation)。这3个基本操作分别模拟生物进化中的自然选择和种群遗传过程中的繁殖、交配和基因突变等现象。

image

复制:从旧的种群中选择适应度高的染色体,为以后染色体杂交、变异,产生新的染色体作准备。适应度值高的个体在下一代将有更多的机会繁殖一个或多个后代,而适应度值低的个体则有可能被淘汰。复制的目的在于保证那些适应度高的优良个体在进化中生存下去,但是复制不会产生新的个体。

交叉:单纯的复制并不能产生创新,杂交可解决染色体的创新。随机选择新复制产生的二个染色体(双亲染色体),随机指定一个部分或多个部分进行交换,可以得到新的染色体(子辈染色体)。

变异:模拟生物在自然界的遗传环境中由于各种偶然因素引起的基因突变,以很小的概率随机改变某段基因。通过变异,增加群体中的多样性,使适应环境的搜索在尽可能大的空间进行,避免陷入局部的优化。

图中描绘了一个遗传算法,可以在没有明确告知计算机如何“识别”0和1的情况下完成这个任务。这个计算机程序将1和0组成的任意序列转换成全1序列——对于人来说很简单,但对于不知道如何识别“1”的计算机来说并不容易。这个问题清晰地揭示了遗传算法的工作原理。为了简单起见这个例子中的序列只有10位,但完全可以是任何长度。
image

在这个算法中重复2、4和5步骤的循环就是进化算法特有的循环。重复步骤2和3的循环为每一代生成10个尝试结构。举个具体的例子:假设算法的初始输入是1001000100(1024种可能的01序列中的一个)。表中记录了从这个序列开始的一次计算的过程。最终的输出就是所预期的1111111111。对于表中给出的每一轮计算(迭代),在复制输入字母生成输出时,有0、1被随机选中翻转(0变成1或1变成0)。也就是说每次复制字符时有10%的可能产生变化。因为变化(突变)是随机的,但最终的输出总是由10个1组成的序列。1的“来源”是将一些0变成1的随机翻转。这个过程也会随机地将1变成0,但这些变化在选择过程中被舍弃了。

运行过程总共生成了50个字符串。反复试验表明平均约为60个。如果不是对现有的字符串进行细微的改动,而是每次都生成全新的字符串,则大约需要50个回合,总共500个字串才能产生出全为1的字符串。因此,搜索10个1组成的字符串时,进化算法比简单的随机搜索大约快10倍。对于更长的字符串,节省的时间会更多。
image

要把效率提高到如此高的程度,突变率的设置很重要,必须依据字串长度进行优化。当突变率接近1/n时(n为输入字串的长度)通常能表现出最优性能。图中描绘了字串长度为100比特时突变率的影响。找到100个1组成的位串需要生成的位串数量与每一代平均改变的位数(突变率)的关系。突变率为0时算法一直运行,突变率100%时大约需要生成10(30次方)个位串。突变率为2%时只需要生成大约1300个位字符串。
image

我们可以把这个例子中0/1字符串改做DNA的碱基对。生物的生存策略都打包编码在DNA之中。生存的环境复杂多变,无法预测,为了让物种能够适应和留存下来,需要有足够多的生存策略来对环境进行试探。因为基因本身的突变(随机发生),加上来自双亲的染色体的组合(本质是DNA的重组),子代DNA产生了差异,也就意味者物种中会催生出N种不同的生存策略来同时进行适应性的测试。适者生存,优胜劣汰,这个过程反复进行迭代,物种得以延续或者进化为新的物种继续存在。关于生存环境以及如何适应的信息也就累积于物种的基因之中。
进化算法在此过程当中,一方面保证能够产生足够多的生存策略,另一方面也提高了获得更具适应性的生存策略的效率,节约了数据也就节省了时间。假设没有基因复制和交配带来的基因重组,试想仅仅通过随机变异来获得对环境的适合,一个物种需要同时诞生多少子代才能测试出最优的生存策略?

Learning&Knowledge学习与知识:通过编码和抽象节省数据
地球在自转的同时围绕着太阳在公转,这是小学生都知道的常识。从古希腊时期的托勒密-亚里斯多德”地心说“到16世纪的哥白尼正式提出日心说的假说,再得到开普勒和伽利略等的严谨论证,经历了1500多年的时间。其中,一名叫第谷的天文学家和数学家在长达30年的时间里持之以恒地记录着天文数据,为“日心说”的理论提供了证据。

“地球在自转的同时围绕着太阳在公转”,这句包含着天文知识的命题只有寥寥数字,而哥白尼、第谷和伽利略等一代代天文学家关于天象的记录和理论的证明却经历了近百年时间。由于这个命题,我们不再需要获取和处理那么海量的数据。这就引出了关于人类为了解决问题中节省数据,包括数据的获取、处理、保存以及传输等上面的所花费时间和能力的另外一种重要的方法——知识以及及其创造和学习。

关于什么是知识,一万人心中就有一万种“知识”的定义。不过,我们可以对常常使用,有联系又有区别的三个概念(数据——信息——知识)做一些区别。
数据:也称数值,是对事物的属性、状态以及相互关系等进行观察、实验或计算得出的结果。数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的值,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0,1的形式表示。比如,绿色、黄色和红色的色彩就是数据。

信息:是从数据中提取出来代表一定意义的内容。因为涉及到意义,数据对于行为主体来讲,可能是信息,也可能不是信息,取决于主体本身的知识结构。例如,交通灯中的红灯/黄灯/绿灯,对于来自生活沙漠深处的游牧民族来讲,它们并没有什么意义。而对于生活在现代城市当中的人来讲就是信息。

知识:知识来自于从数据中提取出来的信息,用于指导行为主体的实际行为,包括思维活动和身体活动。知识代表的是行为主体的一种属性(数据是客观事物的一种属性),不像数据一样进行观察和测量,只能推动行为来推断。从地心说到日心说的过程不难看出,掌握知识可以减少去数据的需求(获取、处理、存储等)。这个过程是如何发生的呢?主要是两种途径:编码(Encoding)和抽象(Abstraction)。

编码Encoding
编码,从语义上可以简单理解,把事物进行某一种分类或排列的过程。也就是说,赋予事物一种形式(form)。英文form有表格的意思,因此将编码理解成为使用表格编排秩序的过程。

设想我们要把许多的珠子按照它们的颜色放入一些盒子里。珠子是从一大堆里随机地拣出来。如果珠子是同一种颜色,那么就可以把它们全都装到一个盒子里去。如果珠子有两种颜色,那么就可以把它们放人两个相邻的盒子里。但是完成这个分拣就需要更多的时间。随着颜色种类的增加,把珠子和对应颜色的盒子匹配起来需要更多的时间。

现在假设除了颜色之外,珠子的大小也不同。如果要求按照大小和颜色分类,那么决定把某一颗珠子放人哪个盒子所需要的时间也会增加。盒子的数量会增加到颜色的种类与大小的种类的乘积。5种颜色和有5种尺寸的珠子,就需要有25(55)只盒子和25种不同的分拣归类。如果我们依据重量、颜色和大小进行分类,并且有5种不同重量的珠子,那么,我们最终就会需要125(55*5)只盒子,还要做出与之数量相当的分拣归类。

我们按照珠子的颜色、尺寸、重量等进行分类的过程就是一种编码的过程。通过编码,这组事物呈现出一种形式或秩序。编码的过程体现为去除掉冗余的数据或信息,从而数据上实现节约的过程。因为可以不记住每一个珠子的具体颜色、大小、重量等,而只需记住多少个盒子以及盒子对应的颜色、大小、重量等属性的分类。

抽象Abstraction
编码和抽象常常同时进行,以致人们容易将两者混淆起来。然而,它们是完全不同的。前者赋予现象以形式,后者赋予现象以结构。如果说编码是通过使我们可以把经验数据分成各个类别,从而使我们得以节约数据处理资源,那么抽象则是通过使我们在完成某项特定任务时所需要的类别数最小化,从而使我们得以进一步实现数据处理上的节约。

设想一下,为了给待售的西瓜定价,我们要对它们进行评级,必须关注的特征有哪些呢?显然是那些最有可能对消费者的决策起到影响的。我们可以假定,对于消费者来说,重量、大小、颜色、质地、形状、硬度和味道构成了一只西瓜的重要属性。假如我们现在要把这七种属性中的每一种,都按照好、一般和差三个标准不同进行编码,并把西瓜进行分类,我们会得到3^6或2187种可能的归类。无论对于生产者来说,还是对于消费者来说,这都是难以应付的数据处理量。

我们怎样才能减少这个数量呢? 首先,我们会注意到某些属性具有很强的相关关系,所以一些属性可以作为其他属性的代替标准。例如,重量和大小往往是一致的;硬度、颜色和味道也是一样——没有成熟的西瓜又青又硬,而熟透了的则是又红又软。这样我们就可以把自己的任务简化为处理四种属性。最后我们会得到81种可能的分类。当然,可以进行进一步简化,例如,价格主要供需决定,可以把西瓜分成两大类,一类是西瓜批发商需求量大,另一种是批发商需求小的,需求大的自然可以定价高,反之定价降低。

如果是编码的作用分类,会发现某一个或某一些编码形式具有更高的层次和相关性。可以舍弃掉层级较低或者相关性不高的编码形式,保留更具有决定意义的编码。这就是抽象的过程。和编码一样,抽象是去除数据,也就是在数据处理资源方面实现节约的一种手段。通过使各个类别划分清晰,并通过使它们变得更明显且可操作,编码推动了抽象。反过来,通过需要界定的类别的数量,抽象促进了编码。两者共同发挥作用,使得我们对知识的掌握减少了对具体数据的需求。

各类系统,不管是物理系统、生物系统,还是社会系统,不管是系统本身还是系统中的个体,其数据处理和存储能力都有极限。如果它们要保证自身的学习能力,也就是对新数据的获取和处理,就得对自己摄取的数据进行新陈代谢。编码和抽象就是对数据的新陈代新。

学习:如何复制成功?
通过以上编码和抽象这两种途径可以创建或者获得知识。但是巧妇难为无米之炊,知识的来源是从数据中提取的信息。知识的创建首先需要数据,获取数据又需要成本,这就产生一个悖论:知识可以节约数据,但是知识的产生又依赖于数据。解决这个矛盾最直接的办法就是”拿来主义“,不是什么知识都是由自己生产,而是学习由别人创建的知识。

关于人类从经验中获取知识,著名管理学家詹姆斯·马奇在他的著作《经验的疆界》中作了精辟的分析和总结。他将学习(复制成功)的模式分为两种:一种是低智(low-intellect)学习,是指在不求理解因果关系的情况下,直接复制与成功相连的行为。另一类是高智(high-intellect)学习,是指在努力理解因果关系并用其指导以后的行动。如何复制成功?“低智学习”具体而言,有三种机制:
1、试误:亲自摸索、不断尝试,观察结果,复制与成功相连的行动,回避与失败相连的行动。
2、模仿:观察其他学习者的经验。其他学习者采取什么行动成功,哪我就采取什么行动。
3、天择:繁殖与成功相连的属性,淘汰与失败相连的属性。也就是两条规则:选择规则与繁殖规则,天择规则决定繁殖哪些属性;繁殖规则决定如何繁殖哪些属性。

动物一般都具有低智学习的天赋或能力,但是高智学习主要表现人类身上。high-intellect意味着不仅直接模仿别人成功的行为,而是会多分析他成功的原因是什么,找出因果关系和模式。这样的学习模式投入的智力(认知能力)会更多一点,所以马奇把它称为高智学习。

高智学习与低智学习这两种学习模式并没有高下之分,只是有各自擅长和适应的条件罢了。为什么高智学习主要出现在人类身上?因为诠释事物因果关系的知识承载于人类发明的语言符号之中。语言主要分为自然语言(口头语言和书面语言)和符号语言(数学、公式、图形等)。使用自然语言来编码信息和创建知识的主要方式是故事,也就是通过故事来表达、传递和保存知识。另外一种方式是模型,将知识浓缩在数学公式、图形符号、计算机模型等之中。当然,很多时候我们是把故事和模型结合起来。例如,在商学院讲授商业知识时,可能会使用各种管理模型作为工具,也可能通过案例,即各种成功或失败典型的公司的故事。
image

知识的产生主要通过对数据和信息的编码和抽象,而编码和抽象这两个动作并一定由我们自己来实操。通过直接经验(数据)的当事人可能会把经验进行编码和抽象,也有可能是旁观者和研究者。无论来自直接经验还是间接经验的知识,在经过编码和抽象后,就可以变成能够传播和扩展的知识“产品”。获取并吸收知识产品的人其实跳过了知识创建过程中所要“吞吐”的大量数据。

Social Computing社会计算**
社会网络是一种算法**每个人拥有的数据-信息-知识都存在局限。在有个形象的词叫PersonByte,意思是一个人所拥有的字节(计算机中1字节Byte=8比特bit)或者说一个人就是一个“人节”。当处理复杂问题时,单个人也就是一个“人节”是往往不够用的,必须要联合其他人即其他personbytes。人与人的链接和组织方式就是一种“算法”(处理PersonByte,区别于计算机处理由0/1组成的字节)。通过这种算法来解决问题的过程,我称之为社会计算或社交计算Social Computing。
这也是人类在解决问题时节省数据的一种特别方式。

乔布斯在离开苹果后创立了新公司NeXT。关于NeXT产品的市场定位和竞争优势,他在1991年的一个视频中提出了一个概念IPC:Interpersonal Computing人际计算。当时NeXT推出的“工作站workstation”电脑产品(主要是企业和学校的专业人士)已经有联网的功能,区别于其他产品的单机作战,它可以帮助更多机构内和机构外的人协作起来。这里的Interpersonal Computing与Social Computing概念基本相同,不一样的是目前的互联网规模和效率已远胜当年。
image
image

** CHALKS ARE MADE 造好粉笔**
上述Concept概念、Heuristics启发式、Algorithem算法、学习和知识Learning& Knowlege与社会计算Social Computing,我们取首个字母可以组成CHALKS(粉笔英语单词的复数)。结合工作记忆的MADE模型,大脑这部信息处理机器在节省数据,提高效率的“套路”结合起来可以形象地记忆为:CHALKS ARE MADE****造好粉笔。回忆中小学或中学教室里前后的黑板,前面的黑板主要是老师使用粉笔书写板书,课后擦掉,好比工作记忆,用于暂时处理数据;而后面的黑板则主要用于保存长期的内容,比如,优秀作文、好人好事等,这不就是长时记忆吗!

image

你可能感兴趣的:(老公身上发现唇印,出轨概率有多大?算法可以帮到你)