利用Pytorch搭建卷积神经网络实现图片分类任务(网络模型部分)

相信大家学到这,肯定是将神经网络模块学习完了,在利用全连接层进行图片分类的时候,会发现结果并不是非常好,这是为什么?其中第一个原因是,图片需要的参数很多,所以导致维度会很大,参数量也就随之变大。其二,我认为网络并不能很细致的学习图片上的特征,不像卷积块可以来回的去学习图片的特征。

那么卷积神经网络是如何工作的呢?下面用图形给大家展示:

利用Pytorch搭建卷积神经网络实现图片分类任务(网络模型部分)_第1张图片

 如上图,利用一个3x3的卷积块在图片上进行参数学习,从而能够得到一个卷积特征层,注意:如果是3通道的,那就将每个通道如上图进行计算,然后将数据进行相加,得到的还是一个特征,如果卷积核有多个,那么得到的特征层的通道数就是卷积和的通道数。

 下图就是整个卷积神经网络的推理流程:

利用Pytorch搭建卷积神经网络实现图片分类任务(网络模型部分)_第2张图片

 其中最重要的就是卷积的特征图长和宽变化的大小计算

利用Pytorch搭建卷积神经网络实现图片分类任务(网络模型部分)_第3张图片

注意:其中Pad表示填充值,其中填充的方式有两种,其一就是用0在最外层进行填充,其二就是将最外层进行复制再进行填充,这点希望大家了解。

下面试最简单的模型架构部分,对于数据的读取不懂的可以看我上一篇的博客对于Dataset类的重写。

import torch
import torch.nn as nn
class Mynet(nn.Module):
    def __init__(self,in_channels,out_channels,num_class=10):
        super(Mynet, self).__init__()
        self.conv_1=nn.Conv2d(in_channels,out_channels,stride=2,kernel_size=3,padding=1)#stride表示步长#kernel_size表示卷积核大小
        self.batchnormal = nn.BatchNorm2d(out_channels)
        self.conv_2=nn.Conv2d(out_channels,2*out_channels,stride=2,kernel_size=3,padding=1)
        self.relu=nn.ReLU(True)
        self.linear=nn.Linear(50176,num_class)#50176这个数字可以先随意写,然后整体模型代码写完后,再进行运行,会发现报错,
        # 然后将保存下面的维度匹配的值复制后,再将该任意写的值替换就行了
        self.softmax = nn.Softmax(dim=1)
    def forward(self,x):
        #假设输入的通道数为[b,c,w,h],b表示多少个,c表示图片的通道数,w,h分别表示图片的宽高
        b, c, w, h=x.shape
        out=self.conv_1(x)
        out=self.relu(out)
        out=self.batchnormal(out)
        out=self.conv_2(out)
        out=out.view(b,-1)#将卷积层输出的结果进行展平
        out=self.linear(out)
        out=self.softmax(out)
        return out

if __name__ == '__main__':
    a=torch.randn((1,3,224,224))#随机初始化一个图片
    model=Mynet(in_channels=3,out_channels=8)#in_channels表示输入图片的通道数
    out=model(a)
    print(out.shape)

最后希望大家能够学有所成!

你可能感兴趣的:(神经网络入门,pytorch,cnn,分类,卷积神经网络,算法)