CNN for Visual Rcognition --- Stanford 2015 (一)

总结斯坦福2015李飞飞教授以及Andrej Karpathy教授的上课的slides中关于CNN的一些内容

一:神经网络实验的基本策略:

CNN for Visual Rcognition --- Stanford 2015 (一)_第1张图片

1.对输入数据进行预处理:

CNN for Visual Rcognition --- Stanford 2015 (一)_第2张图片
CNN for Visual Rcognition --- Stanford 2015 (一)_第3张图片

2.网络结构和数据集设置:

(1)-随机初始化weights为一些比较小的数(fan-in,fan-out),bias设置为0

(2)-利用好cv集,可以在少量epoch的结果下选择最好的params,然后进行更多的epoch

3.分析实验结果:

(1)-对 loss curve 进行分析:

CNN for Visual Rcognition --- Stanford 2015 (一)_第4张图片

(2)-对accuracy 进行分析:

CNN for Visual Rcognition --- Stanford 2015 (一)_第5张图片

(3)-对weight updates / weight的比值进行分析:

CNN for Visual Rcognition --- Stanford 2015 (一)_第6张图片

(4)-可视化隐含层单元:

CNN for Visual Rcognition --- Stanford 2015 (一)_第7张图片

(5)-dropout(Regularization)的使用:

随机的将一些 neuron设置为0,在使用的时候注意train的时候和predict的时候的区别(train的时候进行drop,predict的时候不进行drop):

CNN for Visual Rcognition --- Stanford 2015 (一)_第8张图片
CNN for Visual Rcognition --- Stanford 2015 (一)_第9张图片

(6)-学习率等相关设置:

CNN for Visual Rcognition --- Stanford 2015 (一)_第10张图片
一般用写好的库就行了,如adagrad等等

二:卷积网络ConVNet:

CNN for Visual Rcognition --- Stanford 2015 (一)_第11张图片

1.activations:

ConVNet中的activations是一个三维的立方体,例如:对于一个32*32*3的RGB图片,对应的activation的规格就是32widt*32height*3depth

CNN for Visual Rcognition --- Stanford 2015 (一)_第12张图片

2.local connectivity 局部连接:

(1)-局部连接是ConVNet一个很重要的思想,使用局部连接,减少了卷积层需要训练的params:

CNN for Visual Rcognition --- Stanford 2015 (一)_第13张图片

(2)-举个栗子:CNN for Visual Rcognition --- Stanford 2015 (一)_第14张图片

(3)-术语上:fenture map个数=filter个数

3.padding:

增加nolinearities的数量,同时也可以保持map的大小:

CNN for Visual Rcognition --- Stanford 2015 (一)_第15张图片

4.pooling:

一般是2*2的maxpool:

CNN for Visual Rcognition --- Stanford 2015 (一)_第16张图片

5.ConVNet的设置:

CNN for Visual Rcognition --- Stanford 2015 (一)_第17张图片

三:Visualizing and Understanding ConVNet:

CNN for Visual Rcognition --- Stanford 2015 (一)_第18张图片

1.t-SNE visualization:

下图是mnist数据集通过ConVNet后压缩成二维向量后的点图:

CNN for Visual Rcognition --- Stanford 2015 (一)_第19张图片

2.将最后的pooling层的特征,重构成图片:

CNN for Visual Rcognition --- Stanford 2015 (一)_第20张图片

3.将中间层的特征,重构成图片:

CNN for Visual Rcognition --- Stanford 2015 (一)_第21张图片

4.对于不可识别的图片,ConVNet有时竟然会有很高的置信度:

CNN for Visual Rcognition --- Stanford 2015 (一)_第22张图片

5.depth is important:

改变FC层的大小,对结果并没有多大的提升;而通过改变卷积层depth的大小(其实就是filter的数量),则对结果有较大的影响,并且:more depth = better improvement。

normalization对结果也没有很大的影响

你可能感兴趣的:(数据,神经网络,cnn)