全连接层 Fully Connected Layer 一般位于整个卷积神经网络的最后,负责将卷积输出的二维特征图转化成一维的一个向量,由此实现了端到端的学习过程(即:输入一张图像或一段语音,输出一个向量或信息)。全连接层的每一个结点都与上一层的所有结点相连因而称之为全连接层。由于其全相连的特性,一般全连接层的参数也是最多的。
全连接层的主要作用就是将前层(卷积、池化等层)计算得到的特征空间映射样本标记空间。简单的说就是将特征表示整合成一个值,其优点在于减少特征位置对于分类结果的影响,提高了整个网络的鲁棒性。
在知乎上有这样一个回答说的很形象。
假设你是一只小蚂蚁,你的任务是找小面包。你的视野还比较窄,只能看到很小一片区域。当你找到一片小面包之后,你不知道你找到的是不是全部的小面包,所以你们全部的蚂蚁开了个会,把所有的小面包都拿出来分享了。全连接层就是这个蚂蚁大会~如果提前告诉你全世界就只有一块小面包,你找到之后也就掌握了全部的信息,这种情况下也就没必要引入fc层了
作者:田star 链接:https://www.zhihu.com/question/41037974/answer/150552142
实现方式
全连接层的计算方式
如上图所示,一个网络在全连接层之前,生成了5@3×3的特征映射,我们需要只需要使用五个卷积核去和激活函数的输出进行卷积运算,在将五个输出的值相加即可得到一个全连接层的输出值。如果结果是N维的向量,则需要N×5个3×3的卷积核。再加上求和运算对应的权值,参数的数量是非常可观的,由此一般只在网络的之后使用全连接层。
因为卷积层的作用只是提取特征,但是很多物体可能都有同一类特征,比如猫、狗、鸟都有眼睛。如果只用局部特征的话不足与确定具体类别。
这时就需要使用组合特征来判别了。全连接就是组合这些特征来最终确定是哪一个分类,所以全连接就是组合特征和分类器功能。
(1)卷积神经网络为什么用卷积而不用全连接的原因之一就是:全链接计算量太大。
(2)卷积神经网络经过pooling之后,尺寸已经大大减少了,偶尔用一两层全连接,计算量可以接受。
(3)其实如果计算能力允许,你用每层都是全连接的,也许比卷积神经网络效果更好呢(我猜的,未必是真的),不过现实中不太可能。
初识全连接层 - Su'S Blog - SuZhengpeng.COM