示例—使用Pytorch堆叠一个神经网络的基础教程

目录

一、构建网络

二、网络训练

        训练步骤

三、进行预测


本文主要从大致步骤上讲述如何从零开始构建一个网络,仅提供一个思路,具体实现以实际情况为准。下面先简介下PyTorch:

概述
PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。
2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。2、包含自动求导系统的深度神经网络。

发展
PyTorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络,这是很多主流深度学习框架比如Tensorflow等都不支持的。
PyTorch 既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络 。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用

优点
PyTorch是相当简洁且高效快速的框架

设计追求最少的封装

设计符合人类思维,它让用户尽可能地专注于实现自己的想法
与google的Tensorflow类似,FAIR的支持足以确保PyTorch获得持续的开发更新

PyTorch作者亲自维护的论坛 供用户交流和求教问题
入门简单 

一、构建网络

class 网络模型(nn.Module):
    #----初始化函数----#
    #主要用来构建网络单元,类似于类定义
    def __init__(self,需要传入的参数列表): 
        super(网络模型,self).__init__()
        #----定义一些相关的神经单元----#
        self.backbone=BackBone(...)
        #----将神经单元堆叠成网络模块----#
        self.block=nn.Sequential(
            #将标准模块堆叠
        )
        self.cls_conv=nn.Conv2d(256,numclass,1,stride=1)

    #----前向传递函数----#
    #----主要用来实现网络计算,需要按严格的顺序堆叠
    def forward(self,x):    # x为输入特征
        #----堆叠网络                                                                                       
        return x

        以类的形式来构造神经网络的主结构,同时可以通过多个类的叠加来区分基干网络等各个部分,但是每个网络类中主要分为两个部分:

        ①类定义:主要负责声明神经模组,如卷积,池化,BN层等;以及参数的注入。同时将一些标准模块堆叠成神经模块(可以构造多个);类似于声明,顺序没有特殊要求(小模块内有顺序)

  ②前向传递函数:将类定义中构造的各模块进行顺序构造。x为传入的特征向量,通过让x按顺序经过各模块来实现网络的构造。类似于实现,需要遵守严格的顺序

二、网络训练

#----各种参数的定义,预处理----#
# 包括一些超参数,路径,cuda等参数的设定,以及卷积核尺寸等参数的计算

#----网络模型实体化----#
model = 类定义(参数列表)

#----权重的加载/初始化----#
model_dict = model.state_dict()    #获取网络结构
pretrained_dict = torch.load(modePath,map_location=device)    #从文件中加载权重
for k,v in pretrained_dict.items():
    #逐层判断网络结构是否一致
model_dict.update(temp_dict)         #上传权重参数
model.load_state_dict(model_dict)    #加载权重

#----如有必要,进行cuda型的转换----#

#----数据集的加载----#
dataset = 
dataloader = 

#----进行训练----#

        由于训练的步数较多,建议将其分为预处理和具体训练分开编写。预处理包括网络的实体化,参数和超参数的处理及填充,数据集的加载和转换

        而训练部分则包括:优化器的实例化和参数的填充训练和验证

        训练是指分步将训练数据从dataloader中取出并执行以下步骤:         

                        ①前向传递

                        ②计算损失函数

                        ③梯度清零

                        ④前向传递

                        ⑤优化参数

        随后将测试集从dataloader中取出按训练同样的步骤进行预测,并计算损失函数 

        训练步骤

loss_fn=   #设置交叉函数
learing_rate=   #学习率
optimizer = torch.optim   #设置优化器

#----开始训练----#
for i in range(epoch):
    #----将训练集从dataloader中解包----#
    for data in train_loader:
        imgs,targes=data    
        outputs=mynet(imgs) #网络前向传递
        loss=loss_fn(outputs,targes)    #计算损失函数

        optimizer.zero_grad()   #梯度清零
        loss.backward()  #前向传递
        optimizer.step()    #逐步优化

        total_train_step+=1 #训练计数

#----开始测试----#
with torch.no_grad():    #不设置梯度(保证不进行调优)
    #----将测试集从dataloader中拆包----#
    for data in test_loader:
        imgs,targets = data 
        outputs = mynet(imgs)    #进行预测
        loss = loss_fn(outputs,targets)    #计算损失函数

#----保存每轮的模型----#
#torch.save(mynet,"MyNerNet_Ver{}.pth".format(total_train_step))

三、进行预测

        进行预测总体和训练类似,但是不需要将数据送入dataset和dataloader中,一般也不需要计算损失函数,仅需要调用网络对数据进行预测即可。是神经网络的应用环节。

    def ImgDetect(self,img,count=False,nameClasses=None,outType=0):
        #----图片的预处理----#
        # 主要包括图像的参数计算,resize,和添加batch_size维度

        #----使用网络预测----#
        with torch.no_grad():
            # 类型转换
            imgs = torch.from_numpy(img_data)
            # 传入网络并得到结果
            Img = self.net(imgs)
            # 进行后续处理

        #----返回结果----#
        return Img

你可能感兴趣的:(神经网络,深度学习,人工智能)