卷积神经网络的笔记及自己的理解(主要基于李宏毅老师的CNN课程)

SDU软件学院的一枚大三学生,最近课程有好多要上台做pre,也有好多搞不懂的大作业什么的,决定用CSDN来记录一下。之前做实验都是水过去hhh快要毕业了还是希望有学会一些东西吧。

正文:

忘记是哪里看到的比喻了,感觉很不错:⬇️

“从卷积网络谈起,卷积网络在形式上有一点点像咱们正在召开的“人民代表大会制度”。卷积核的个数相当于候选人,图像中不同的特征会激活不同的“候选人”(卷积核)。

池化层(仅指最大池化)起着类似于“合票”的作用,不同特征在对不同的“候选人”有着各自的喜好。

全连接相当于是“代表普选”。所有被各个区域选出的代表,对最终结果进行“投票”,全连接保证了receiptive field
是整个图像,既图像中各个部分(所谓所有代表),都有对最终结果影响的权利。”

卷积神经网络的笔记及自己的理解(主要基于李宏毅老师的CNN课程)_第1张图片
(PPT主要是从台大李宏毅老师的讲课视频中截取的,加上了自己的一些思考或者解释)
我们从一只RGB的猫开始说,想要判断这张图片是不是猫猫,把它丢给一个已经训练好的CNNmodel,每一层的神经元都是通过判断是不是猫猫的鼻子,猫猫的眼睛,猫猫的嘴巴开始“激活”,卷积池化卷积池化卷积池化卷积池化(投票合票投票合票投票合票)……最后经过全连接层的代表普选,对最终结果进行“投票”,来判断这张图是什么,或者说是不是猫。

在BP神经网络中,每一层与每一层之间都是全连接的,参数非常非常的多,但是用卷积神经网络有一个好处就是可以减少参数。主要从:共享参数和池化两方面减少。这个在后面具体讲卷积层和池化层的时候会解释。

那我们先从人眼的角度来看一张图,如果我们想知道这张图是不是一只鸟,脑子里闪现的第一个想法是什么?有翅膀有羽毛有尖嘴,有圆溜溜的眼睛…它的形状弧度和我们当年幼儿园上的简笔画挺像的——所以我们第一眼觉得它是一只鸟?

同理,我们也可以让机器按照我们的脑回路去实现,也就是卷积层中神经元的作用,让每一个神经元来关注:这张图中有没有我负责的part在。“我是负责观察鸟嘴的神经元,只要这张图有鸟嘴,我就被激活了我很兴奋,我觉得这张图很有可能是鸟!”

未完待续

你可能感兴趣的:(卷积神经网络的笔记及自己的理解(主要基于李宏毅老师的CNN课程))