pytorch学习视频——B站视频链接:《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili
以下是视频内容笔记以及小练习源码,本节代码有点多,另外单独写的代码——pytorch 深度学习实践 第10讲 卷积神经网络(基础篇)_代码
以下笔记纯属个人理解,如有错误欢迎路过的大佬指出 。
全连接网络
卷积神经网路
直接对图像进行操作,保留了更多的空间特征,前面卷积和采样的部分称为特征提取,后面全连接部分称为分类。
使用RGB图像,输入通道是3,输出通道是卷积核的数量
卷积公式: y ( t ) = ∫ − ∞ ∞ x ( p ) h ( t − p ) d p = x ( t ) ∗ h ( t ) y(t)=\int_{-\infty}^{\infty} x(p) h(t-p) d p=x(t) * h(t) y(t)=∫−∞∞x(p)h(t−p)dp=x(t)∗h(t)
多通道卷积如何操作
每个通道单独与一个卷积核进行卷积,图像通道数为3的话,每一个卷积核对应的通道数也是3,然后将这三个卷积核分别与图像的R G B通道图像求卷积,最后再将求得的结果相加得到最终的卷积结果。如图所示。
卷积核的形状是一个4维张量
maxpooling最大池化,效果如图所示:
经过池化层操作后,通道数不变。
见代码maxpooling.py