分类学习 Chapter 2.6-2.13

2.6 后天习得的类别

证据表明，我们的大多数类别都是后天习得的。

对于感官系统来说，一个个体（专有名词）和一个内容词所指的事物都是种类（kind）。

2.7 监督学习

分类是一种感觉运动技能，其中很大一部分是通过分析感觉输入来决定做/不做什么。输出是分类的，非连续的。像所有的技能一样，分类是习得的。但是不像游泳或绘画这样的连续技能，分类是离散的，要么全有，要么全无:要么做这个，要么做那个。

什么是学习？描述“一个系统什么时候做什么”比描述“它如何做”更容易。当一个系统根据材料和误差模拟输入并产生相应的输出时，学习就发生了。它的性能由正确的反馈来指导。我们从自己行为的后果中得到反馈，在此基础上学会做什么。然而，这只是描述输入和感觉运动的相互作用，而不是感觉运动系统实际上如何做这些事情——“how”（感觉运动能力的内在机制）。

2.8 操作性（工具性）学习

操作性或工具性学习：由一个自动适应系统执行对不同类型输入的系统的不同反应，最初随机响应，但在纠错反馈的指导下学会适应其反应（这是由于其内部状态的某种功能变化）。

当一只鸽子看到黑色圆圈时，它会啄一个键，当它看到白色圆圈时，它会啄另一个键(给食物是反应正确的反馈，没有食物是反应错误的反馈)。在只对黑和白进行训练之后，逐渐“变形”为灰色阴影，并在没有反馈的情况下测试中间的阴影，图像将显示出平滑的“综合梯度”，在“黑”键上啄得越多，灰色输入就越接近黑色，在白键上啄得越多，灰色输入就越接近白色，并在两者之间接近一个偶然的表现水平。在这种情况下，人类也是如此。

2.9 颜色类别

然而，如果动物有色觉，用蓝色和绿色作为输入，图像就会不同。在蓝色-绿色的中点仍会有最大的混乱，但是在边界的两边，按键的正确选择和按压的次数会比灰色阴影更突然地增加——甚至可以说是“分类的”。原因是黑色和白色之间没有天生的类别界限，而绿色和蓝色之间有(在蓝-绿色觉正常的动物中)。

2.10 分类感知

这种在边界上相对突然的感知变化被称为“分类感知”(CP，categorical perception)，在颜色感知的情况下，这种影响是与生俱来的。如果我们没有颜色分类感知，那么从红色到紫色的连续光谱看起来很像灰色的阴影，中间没有任何由中性混合物分隔的定性“带”。

颜色类别是通过一种复杂的感觉感受机制来检测的（该机制尚未被完全理解），不仅包括光的频率和其他属性（比如亮度和饱和度），还包括一个内部机制——三个专门的检测器选择性地调谐到频谱的某些区域(红、绿、蓝)，而且之间存在相互抑制的“反过程”关系(红色—绿色，蓝色—黄色)。这种机制会导致一些频率范围被自动“压缩”。每一个颜色范围内都有一个压力，它们之间也有一个膨胀。因此，大小相等的频率差异在同一个颜色类别内时看起来比跨越不同颜色类别的小得多。

虽然颜色CP是天生的，并非习得的，但仍符合我们对分类的定义。我们的祖先能够根据颜色进行快速、准确的区分，他们比那些不能区分的人活得更久、复制得更好。自然选择作为基因试错变异的“纠错”反馈。

2.11 学习的算法

人工智能研究中的机器学习算法(Michalski，Carbonell和Mitchell，2013)，人工生命研究中的遗传算法(Mitchell & Forrest，1994)和神经网络研究中的连接主义算法(Schmidhuber，2015)都为执行分类的“how”提供了候选机制：我们的大脑是如何学习抽象、不变的特征，如何区分每个类别的成员和非成员，如何使得我们用正确的事情做正确的事情。

总的来说，有两种学习模型:“监督（supervised）”和“无监督（unsupervised）”模型。

无监督模型通常是基于假设输入的“affordances”已经非常显著，因此正确的分类机制将能够根据输入landscape的形状来进行选择（无需要任何外部纠错反馈）。然而这首先需要大量的重复exposure和处理，其次这种假设还存在普遍的不确定性问题——相同的事物往往可以用许多不同的方式进行分类。

2.12 无监督学习

物体的感觉痕迹（sensory shadow）中既有形态不变量，也有几何不变量，特别是当我们与物体发生相对移动时。这些不变量可以通过对结构和相关性进行采样的非直观学习机制来提取。这种机制根据事物的结构相似性和差异性对事物进行分类，增强相似性和对比性。无监督对比度增强和边界发现机制的一个例子是“相互抑制”，即视觉空间中一点的活动抑制周围点的活动，反之亦然。这种内部竞争倾向于将输入所固有的和提供的结构集中化。

2.13 监督学习

根据其他环境(依赖于上下文的分类)采用对相同的感觉痕迹进行分类的不同方法，需要通过纠错反馈进行监督。因此，有监督的分类比无监督的分类更加模糊。两种分类都是不确定的，因为它们成员的感觉痕迹由大量的特征或维度组成，存在无数的潜在组合，很难找到能够提供正确分类的子集。但是有监督的分类更难，对于同一组感觉痕迹，有许多正确的分类。

不仅所有的事物都是无限多个不同类别的成员，而且它们的每一个特征和特征的每一种组合都是一种潜在的affordances，可以把事物分配到更多的类别中。当试图解释感觉运动系统如何工作的理论问题时，感觉输入就是无数不同种类事物的感觉痕迹。

监督学习的算法往往适用于：当不变特征是不确定的，且找到它们的问题不是“NP-complete问题”(即，只要有足够的数据、反馈和时间来找到不变特征)。数据不足和时间不足的一个例子是UG（通用语法），儿童学习语言的时间较短，他们无法学习区分与UG相符和与UG不相符的话语的不变量，然而，所有的孩子都会UG法，这意味着他们生来就必须遵守已经在大脑中编码的通用语法规则。但是，我们的大部分分类，不是天生的而是后天习得的。

我们的分类算法必须能够做到我们所能做到的。因此，如果我们能够正确地对一组输入进行分类，那么这些输入不仅必须具有能够提供正确分类的特征，而且还必须有一种方法来发现和使用这些affordances。