李宏毅《机器学习》笔记(6)--卷积神经网络

CNN架构

李宏毅《机器学习》笔记(6)--卷积神经网络_第1张图片

首先输入一张图片以后,这张图片会通过卷积层(convolution layer),接下来做最大池化(max pooling),这个过程可以反复无数次,反复的次数由事先决定。做完卷积和池化后,要做的另外一件事是flatten,再把压平的output丢到一般的全连接前向神经网络(fully connected feedforward network),然后得到影像辨识的结果。

卷积(Convolution):

李宏毅《机器学习》笔记(6)--卷积神经网络_第2张图片

如果把这卷积层与全连接层两个相联系类比的话,卷积就是全连接拿掉一些weight的结果。

池化(pooling):

李宏毅《机器学习》笔记(6)--卷积神经网络_第3张图片

相对于convolution来说,Max Pooling是比较简单的。根据filter 1得到4*4的矩阵,根据filter2得到另一个4*4的矩阵,接下来把output4个一组,每一组里面可以选择它们的平均或者选最大的都可以,就是把四个值合成一个值。这个可以让image缩小。

压平(flatten):

李宏毅《机器学习》笔记(6)--卷积神经网络_第4张图片

flatten就是feature map拉直,拉直之后就可以丢到全连接神经网络里,然后就结束了。

你可能感兴趣的:(机器学习,卷积,神经网络,深度学习,卷积神经网络,人工智能)