经典论文| Neocognitron:一种不受位置变化影响的模式识别机制的自组织神经网络模型

论文概述

    该论文提出了一种用于视觉模式识别的无监督神经网络模型。该网络不受识别对象位置的影响,通过几何相似度的方法完成识别。论文中把这样的网络称为neocognitron。

    大多数神经网络模型受到输入模式的位置偏移和形状扭曲的严重影响,也就是说,相同的模式在不同的位置呈现或者相同样式的圆滑程度不同,被传统的神经网络视为不同的模式。然而,本文提出的自组织神经网络模型中,网络的响应几乎不受刺激模式位置的影响。

神经网络结构

经典论文| Neocognitron:一种不受位置变化影响的模式识别机制的自组织神经网络模型_第1张图片
    Hubel 和 Wiesel曾对细胞进行过一个分类:LGB (lateral geniculate body)→simple cells →complex cells →lower order hypercomplex cells →higher order hypercomplex cells

    如图1所示,neocognitron由一系列模块化结构级联连接构成,在所有结构之前的是一个输入层U0。每个模块结构是由两层细胞级联连接。模块的第一层由“S细胞(S-cells)”组成,S-cells对应于 simple cells或lower order hypercomplex cells, 我们称它为s层,并将第l个模块中的s层表示为Usl。该模块的第二层由“C细胞(c-cells)”构成,对应于complex cells或higher order hypercomplex cells。我们称它为c层,并将第l个模块中的c层表示为Ucl。在该神经网络中,只有s层细胞的输入突触具有可塑性和可修改性。

    一层中的s细胞或c细胞根据其对上层输入刺激的最佳感受部位的不同,被分成子群(subgroups)。由于每个子群中的细胞都可被圈定为一个二维平面图形,所以我们称这个子群为“细胞平面(cell-plane)”。S-plane和C-plane分别表示由s细胞和c细胞组成的细胞平面。

    图2是层间相互连接的示意图。每一个用粗线画的四角形代表一个s平面或一个c平面,每一个用细线画的竖直四角形代表一个s层或c层,其中s层或c层是封闭的。

    每个细胞平面的细胞总数随着网络中细胞平面深度的增加而减少。在最后一个模块中,每个C-cell的接受域变得非常大,以至于覆盖了整个输入层的面积,并且每个C-plane被确定为只有一个C-cell。

网络的自组织过程

    首先,每次刺激模式出现时,从每个s层中选择几个“代表性(representative)”的S细胞。具有代表性的S细胞是从产生大量输出的S细胞中选出来的,每一个平面至多选取一个代表。选S细胞的过程类似于传统的在认知单元(conventional cognitron)中选择增强细胞的过程。

由于文章在服务器上,全文内容详见:http://burningcloud.cn/article/5/index.html

你可能感兴趣的:(经典论文| Neocognitron:一种不受位置变化影响的模式识别机制的自组织神经网络模型)