【CNN】平移不变形

translation invariance或translation invariant

什么是?

不变性意味着您可以将对象识别为对象,即使它的外观以某种方式发生变化。这通常是一件好事,因为它在视觉输入细节的变化(例如查看器/相机和对象的相对位置)中保留了对象的身份、类别(等)。
下图包含同一雕像的许多视图。你(和训练有素的神经网络)可以识别出同一个对象出现在每张图片中,即使实际像素值完全不同。
请注意,这里的翻译在视觉中具有特定的含义,是从几何学中借来的。它不涉及任何类型的转换,不像从法语到英语或文件格式之间的翻译。相反,这意味着图像中的每个点/像素都在相同的方向上移动了相同的量。或者,您可以将原点视为在相反方向上移动了相等的量。例如,我们可以通过将每个像素向右移动 50 或 100 个像素来生成第一行中的第二和第三图像。可以证明卷积算子在平移方面是通勤的。如果你卷积F 和 G,是否翻译卷积输出并不重要 F* g, 或者如果你翻译 F 或者 G首先,然后对它们进行卷积。
平移不变对象识别的一种方法是获取对象的“模板”并将其与图像中对象的每个可能位置进行卷积。如果您在某个位置收到较大的响应,则表明类似于模板的对象位于该位置。这种方法通常称为模板匹配。平移不变性和平移等效性之间存在差异。平移不变性意味着系统产生完全相同的响应,无论其输入如何移动。
如果图像中的对象位于区域 A 并且通过卷积在区域 B 的输出处检测到特征,则卷积提供平移等方差含义,那么当图像中的对象被平移到 A’ 时,将检测到相同的特征。输出特征的位置也将根据滤波器内核大小转换为新区域 B’。这称为平移等变而不是平移不变性。
术语本身可能来自物理学,其中平移对称意味着方程保持不变,无论空间平移如何。

特点

平移不变性和平移等效性之间存在差异。平移不变性意味着系统产生完全相同的响应,无论其输入如何移动。
卷积层本身或输出特征图是平移等变的
最大池化层所做的是提供一些平移不变性

你可能感兴趣的:(笔记,cnn,计算机视觉,深度学习)