error:404..

基于CNN模型的手写字符识别的分析与实现过程

1.前言

2.使用的工具介绍

2.1.TensorboardX

2.2.Netron

3.搭建CNN神经网络

3.1 CNN结构

3.1.1卷积层

3.1.2池化层

3.1.3全连接层

3.2构建CNN与代码实现

3.3CNN结构模型数据流可视化

3.3.1tensorboardx可视化

3.3.2Netron可视化模型

4.特征提取可视化

5.分析

6.总结

1.前言

MNIST是一个手写体数字的图片数据集，该数据集来由美国国家标准与技术研究所（National Institute of Standards and Technology (NIST)）发起整理，一共统计了来自250个不同的人手写数字图片，其中50%是高中生，50%来自人口普查局的工作人员。该数据集的收集目的是希望通过算法，实现对手写数字的识别。被广泛地应用于机器学习和深度学习领域，用来测试算法的效果，例如线性分类器（Linear Classifiers）、K-近邻算法（K-Nearest Neighbors）、支持向量机（SVMs）、神经网络（Neural Nets）、卷积神经网络（Convolutional nets）等等。 1998年，Yan LeCun 等人发表了论文《Gradient-Based Learning Applied to Document Recognition》，首次提出了LeNet-5 网络，利用上述数据集实现了手写字体的识别。本篇博客也根据LeNet5网络结构进行理解后，搭建最原始的神经网络。

2.使用的工具介绍

2.1.TensorboardX

Tensorboardx 是 TensorFlow 的一个附加工具，可以记录训练过程的数字、图像等内容，类似于tensoboard，在机器视觉的可视化中使用起来很方便。具体使用参照这里

2.2.Netron

Netron支持主流各种框架的模型结构可视化工作，支持windows，Linux，mac系统，使用起来很方便，直接去GitHub中下载exe文件就可以使用，然后将训练的模型保存为.pth等文件，在软件中打开文件即可。效果如下

当然也是可以直接通过pip install netron进行安装。

3.搭建CNN神经网络

3.1 CNN结构

此模型的结构是卷积层--池化层--卷积层--池化层--全连接层

3.1.1卷积层

卷积层（Convolutional layer）由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网路能从低级特征中迭代提取更复杂的特征。

主要的工作原理就是通过n*n大小的kernel对每张图片的每各通道进行扫描，每次都是选取n*n大小的数据跟kernel上的数据进行运算，得出一个值，而后继续一定，直到扫描完所有数据。

3.1.2池化层

池化层是夹在连续卷积层中间的，用于压缩数据和参数的量，减小过拟合。简而言之，如果输入是图像的话，那么池化层的最主要作用就是压缩图像。

下采样层也叫池化层，其具体操作与卷积层的操作基本相同，只不过下采样的卷积核为只取对应位置的最大值、平均值等（最大池化、平均池化），即矩阵之间的运算规律不一样，并且不经过反向传播的修改。如图

2*2的kernel对4*4的数据进行扫描，每次移动两步，那么算出来的值也就是一个2*2大小的数据。

因此池化层的作用就是保证特征不变，因为每次都还是会采样，保留重要的特征，其次就是特征降维，当特征量太多，我们会选择将一些没有用的特征丢掉，只保留有用的特征。

3.1.3全连接层

全连接层的作用就是分类，具体描述在我上一篇博客，并且还附有代码。

3.2构建CNN与代码实现

导入数据，并且查看数据，MINIST数据集包含train和test数据集，我们直接用train和test一个做训练集一个做测试集。

batch_size = 512

train_loader = torch.utils.data.DataLoader(
        torchvision.datasets.MNIST('mnist_data', train=True, download=True,
                                   transform=torchvision.transforms.Compose([
                                       torchvision.transforms.ToTensor(),
                                       torchvision.transforms.Normalize(
                                           (0.1307,), (0.3081,))
                                   ])),
        batch_size=batch_size, shuffle=True)

test_loader = torch.utils.data.DataLoader(
        torchvision.datasets.MNIST('mnist_data/', train=False, download=True,
                                   transform=torchvision.transforms.Compose([
                                       torchvision.transforms.ToTensor(),
                                       torchvision.transforms.Normalize(
                                           (0.1307,), (0.3081,))
                                   ])),
        batch_size=batch_size, shuffle=False)

这个时候文件夹会出现MNIST数据集文件，我们会发现，得到的并不是一系列图片，而是 .idx1-ubyte和.idx3-ubyte 格式的文件。这是一种IDX数据格式。如下图

查看输入tensor的shape（后面定义网络会用到），并且将数据集可视化，matplotlib.pyplot库支持直接对这些数据可视化。

x, y = next(iter(train_loader))
print(x.shape, y.shape, x.min(), x.max())

    
fig, axis = plt.subplots(4, 6, figsize=(15, 10))
images, labels = next(iter(train_loader))
for i, ax in enumerate(axis.flat):
    with torch.no_grad():
        image, label = images[i], labels[i]
        ax.imshow(image.view(28, 28), cmap='binary')
        ax.set(title=format(label))
plt.show()

定义网络，根据卷积层--池化层--卷积层--池化层--全连接层连接方式定义，

每个网络都是继承nn.Module的，

对于第一次卷积层参数，由于输入数据集torch.Size([100, 1, 28, 28]),输入数据集通道为1，所以第一次卷积层kernel个数为1，kernel大小就定为5*5比较合适，

第二层的池化层需要将特征缩减为原来的一半，所以stride定为2，

第三层卷积层，由于上一层通道数为6，于是kernel个数为6，其他参数前文的网络结构图一致即可，

第四层跟第二层池化层同理

下一层全连接层输入的大小需要算一下，直接去主函数调用Cnn（），用torch.Size([b, 1, 28, 28])的tensor输入看输出的tensor的shape大小，得16*4*4，输入全连接层，最后输出10大小tensor即可。nn.Linear(in, out),参数表示输入维度，输出维度，是一个降维的过程，最终降到了维度为10 nn.ReLU(inplace=True),激活函数，数值小于某个值则变为0，舍弃，inplace=True变为0的值直接覆盖，节省空间

class Cnn(nn.Module):

    def __init__(self):
        super(Cnn,self).__init__()

        self.conv_unit=nn.Sequential(
            nn.Conv2d(1,6,kernel_size=5,stride=1,padding=0),
            nn.AvgPool2d(kernel_size=2,stride=2,padding=0),

            nn.Conv2d(6, 16, kernel_size=5, stride=1, padding=0),
            nn.AvgPool2d(kernel_size=2, stride=2, padding=0),
        )
        #fc unit
        self.fc_unit = nn.Sequential(
            nn.Linear(16*4*4,120),
            nn.ReLU(inplace=True),
            nn.Linear(120,84),
            nn.ReLU(inplace=True),
            nn.Linear(84,10)
        )



    def forward(self,x):
        #param x:[512,1,28,28]

        batchsz = x.size(0)
        #[512,1,28,28]->[512,16,4,4]
        x=self.conv_unit(x)
        #[512,1,28,28]->[512,16*4*4]
        x=x.view(batchsz,16*4*4)
        #[512,16*4*4]->[512,10]
        logits = self.fc_unit(x)

        # #[512,10]
        # pred = F.softmax(logits,dim=1)
        # loss = self.criteon(logits,y)

        return logits

初始化网络，并且打印出模型基本结构

    model=Cnn()
    criteon = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=1e-3)
    print(model)

训练网络，并保存训练中的loss以及acc等

optimizer.zero_grad() 清空过往梯度；

loss.backward() 反向传播，计算当前梯度；

optimizer.step() 根据梯度更新网络参数

train_loss = []
    Acc=[]

    for epoch in range(50):

        model.train()
        running_loss=0
        for batchidx, (x, label) in enumerate(train_loader):
            # [b, 3, 32, 32]
            # [b]

            logits = model(x)
            # logits: [b, 10]
            # label:  [b]
            # loss: tensor scalar
            loss = criteon(logits, label)

            # backprop
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            running_loss += loss.item()

        train_loss.append(running_loss/len(train_loader))
        print('epoch:',epoch+1, 'loss:', loss.item())

        model.eval()
        with torch.no_grad():
            # test
            total_correct = 0
            total_num = 0
            for x, label in test_loader:
                # [b, 3, 32, 32]
                # [b]

                # [b, 10]
                logits = model(x)
                # [b]
                pred = logits.argmax(dim=1)
                # [b] vs [b] => scalar tensor
                correct = torch.eq(pred, label).float().sum().item()
                total_correct += correct
                total_num += x.size(0)
                # print(correct)

            acc = total_correct / total_num
            Acc.append(total_correct / total_num)
            print('test acc:', acc)

最后输出，test acc: 0.9549

可视化train的loss以及test的acc

plt.plot(train_loss, label='Loss')
plt.plot(Acc, label='Acc')

准确率不高，而且loss函数下降不平滑，改进网络

nn.BatchNorm2d(6),进行数据的归一化处理

class Cnn(nn.Module):

    def __init__(self):
        super(Cnn,self).__init__()

        self.conv_unit=nn.Sequential(
            nn.Conv2d(1,6,kernel_size=5,stride=1,padding=0),
            nn.BatchNorm2d(6),
            nn.ReLU(),
            nn.AvgPool2d(kernel_size=2,stride=2,padding=0),

            nn.Conv2d(6, 16, kernel_size=5, stride=1, padding=0),
            nn.BatchNorm2d(16),
            nn.ReLU(),
            nn.AvgPool2d(kernel_size=2, stride=2, padding=0),
        )
        #fc unit
        self.fc_unit = nn.Sequential(
            nn.Linear(16*4*4,120),
            nn.ReLU(inplace=True),
            nn.Linear(120,84),
            nn.ReLU(inplace=True),
            nn.Linear(84,10)
        )



    def forward(self,x):
        #param x:[512,1,28,28]

        batchsz = x.size(0)
        #[512,1,28,28]->[512,16,4,4]
        x=self.conv_unit(x)
        #[512,1,28,28]->[512,16*4*4]
        x=x.view(batchsz,16*4*4)
        #[512,16*4*4]->[512,10]
        logits = self.fc_unit(x)

        # #[512,10]
        # pred = F.softmax(logits,dim=1)
        # loss = self.criteon(logits,y)

        return logits

再次训练，可视化

最后准确率epoch=15时，test acc: 0.9844，准确率提升了不少

3.3CNN结构模型数据流可视化

3.3.1tensorboardx可视化

add_graph对结构模型可视化

 writer = SummaryWriter('runs/cnn_mnist')
 dummy_input = torch.rand(512, 1, 28, 28)
 writer.add_graph(model,(dummy_input,))
 writer.close()

可见在卷积层中有参数weight和bias，他们都与图片的shape有关，网络模型就是之前参照前文图片结构，如下

3.3.2Netron可视化模型

torch.save(model, 'runs/Model.pth')

将保存的.pth文件用netron打开

每个神经层的shape都可以看见，还可以查看具体训练时的数据

4.特征提取可视化

使用tensorboardx对每一层卷积的特征图进行可视化

writer = SummaryWriter('runs/cnn_mnist',comment='feature map')
    for i, data in enumerate(train_loader, 0):
        # 获取训练数据
        inputs, labels = data
        x = inputs[1].unsqueeze(0)  # x 在这里呀
        break

    img_grid = vutils.make_grid(x, normalize=True, scale_each=True, nrow=2)
    model.eval()
    for name, layer in model._modules.items():

        # 为fc层预处理x
        x = x.view(x.size(0), -1) if "fc" in name else x
        print(x.size())

        x = layer(x)
        print(format(name))

        # 查看卷积层的特征图
        if 'layer' in name or 'conv' in name:
            x1 = x.transpose(0, 1)  # C，B, H, W  ---> B，C, H, W
            img_grid = vutils.make_grid(x1, normalize=True, scale_each=True, nrow=4)  # normalize进行归一化处理
            writer.add_image(format(name), img_grid, global_step=0)

数字5第一次卷积

数字5第二次卷积

数字0第一次卷积

数字0第二次卷积

数字3第一次卷积

数字3第二次卷积

数字3的第二次卷积过后特征具有数字2 和1的特征（数字3这个模型只训练了几个epoch，可能是准确率不高），但是也可以反映特征被细化过后有些特征是会跟其他数字的特征一样

不同的数字第一次卷积，输出的通道为6，每个特征还是具有标识性，但是第一次卷积16个通道过后特征值就变得不那么具有标识性，也就是特征值被细化，于是可以可以从理论上得出在一定的神经深度下，堆叠网络层数是可以提高准确率的。

5.分析

本次demo可以归纳为建模，调参，可视化，优化，

将已经分类好的数据[x,y]通过像素的方式输入到有预设参数的模型中，模型根据输入的数据，不停的优化自身的参数，类似线性函数不断拟合w和b一样，最终建立具有最优参数的模型。神经网络以及这些数据都是很抽象的，在学习深度学习中可视化跟建模一样重要。

模型也就是神经网络，里面的卷积层细化特征，而池化层是取样，取出有用的特征值，进而降维，再是用全连接层对特征值进行分类，其间包括归一化，激活函数等优化操作，之所以正确率会提高，主要是因为前向传播以及反向传播，不断的更新参数，而梯度的更新，归根揭底就是梯度下降算法。

在解决实际问题时，我们需要做的就是选取一个合理的模型，预设合理的参数，采用各种优化处理，最终达到想要的效果。

6.总结

由于本人实力以及经验有限，有些理解有错，过后会加以改正，也希望看到的人跟我交流。

本次demo让我更加深刻的学习到了神经网络以及深度学习的原理，锻炼了实际操作的能力，确实期间遇到了不少的问题，刚开始的参数设置，可视化loss和acc，model，处理过拟合，都学到了不少东西，知道了优化器的不同会大幅度影响试验的结果，知道了表达实验结果最好的办法是可视化，熟悉了可视化的一些工具，知道dropout 正则化，更新学习率等方法来降低过拟合，合理更改模型结构有助于正确率的提高。

但是我对于深度学习的理解是完全不够的，思想方面也是有待提高，经验也不足，在可视化以及分析问题的时候花了不少时间，过后应该努力的改正思考问题的方式以及分析问题解决问题的速度，并且应该都和其他人交流意见别人的思想，每个人都有不同的思想，可能会让你很快解决一些问题。

深度学习与Pytorch实战（二）预测房价--线性回归 volcanical pytorch 深度学习 pytorch 线性回归
PyTorch实例：线性回归我们将实现一个线性回归模型，并用梯度下降算法求解该模型，从而给出预测曲线。准备数据首先我们编造一组数据，假如我们每隔一个月获取一次房价数据，代表0，1，2，3，4……月份，那么我们可以用PyTorch的linespace来构建1~100之间的均匀数字作为时间变量。importtorchimportmatplotlib.pyplotasplt#0~99月x=torch.T
Pytorch深度学习入门（1）-如何使用Pytorch跑一个神经网络火花同学深度学习 pytorch 神经网络 python
目录0.Intro1.深度学习与Pytorch1.1深度学习1.2Pytorch2.预训练模型2.1运行环境2.2加载预训练模型2.3使用网络进行图片分类3.总结写在后面的话0.Intro本文是Pytorch入门系列的第一篇文章。本文主要通过使用Pytorch当中的预训练模型完成一个深度学习任务，让大家对Pytorch的基本使用与一个最基础的了解，通过这样一个相对顶层的方式作为开始，让大家对Pyt
深度学习与PyTorch笔记1 niuniu990 深度学习 python pytorch
深度学习与PyTorch笔记1动态图计算的进行和代码的运行是同时的。静态图先构建函数，之后便不能更改，只能喂数据。好处：一次成型，一旦建好之后使用起来非常方便，不需要自己中间修改。问题：比如TensorFlow自建了一套命名体系，中间的所有变量和时序的控制逻辑都是使用自己的，用Python写的时候就非常麻烦，所以TensorFlow2.0支持动态图优先。使用PyTorch的优势1.GPU加速（50
深度学习与Pytorch入门实战（九）卷积神经网络&Batch Norm qq_41978139 深度学习
深度学习与Pytorch入门实战（九）卷积神经网络&BatchNorm目录1.卷积层1.1torch.nn.Conv2d()类式接口1.2F.conv2d()函数式接口2.池化层Pooling（下采样）2.1torch.MaxPool2d()类式接口2.2F.avg_pool2d()函数式接口3.upsample（上采样）4.RELU激活函数4.1torch.nn.RELU()类式接口4.2F.r
PyTorch元模型：创建模型，导入数据并训练的基本构件 weixin_Saturn 深度学习 pytorch 人工智能
本篇目的在学习深度学习与PyTorch的过程中，大大小小的开源项目里的代码不尽相同，有的较为复杂，有的偏向简单；本文描述了构建一个深度学习项目的最基本组成部分，包括net.py，dataset.py，train.py三个模块。网络importtorchimporttorch.nnasnnclassDoubleConv(nn.Module):'''[conv,bn,relu]*2'''def__in
第一章深度学习与PyTorch库简介 Cary. pytorch 深度学习 python
本书第一章主要介绍了深度学习的背景和PyTorch的基本库。没有涉及很多代码，这里简要总结本章内容，并查看PyTorch版本以及配置。本章小结1.深度学习模型自动学习关联示例的输入和期望的输出。2.PyTorch库允许你高效地构建和训练神经网络模型。3.PyTorch在注重灵活性和速度的同时最大限度地减少了认知开销，它还默认为急切模式。4.TorchScript允许我们预编译模型，并且不仅可以在p
Pytorch-《Deep learning with pytorch》1.2.1训练imagenetmini 在楼梯口吃芒果的是我 pytorch学习深度学习 pytorch 人工智能
最近在学习《Deeplearningwithpytorch》，跟着b站的一个up主敲代码，本篇内容对应这个视频大佬带你啃透【深度学习与pytorch】官方权威书籍P4。因为我是轻薄本，所以选择在colab上进行的实验，如果你的电脑内存够，配置也ok是可以直接在自己电脑上运行的。一下进入正题：实验内容：使用Alexnet和resnet101对imageNet进行训练。（因为内存原因，我用的image
深度学习与Pytorch入门实战（五）分类器 Douzi1024
笔记摘抄1.分类问题1.1二分类$f:x\rightarrowp(y=1|x)$$p(y=1|x)$：解释成给定x，求y=1的概率，如果概率>0.5，预测为1；否则，预测为0$p_{\theta}(y|x)$：给定x，输出预测值的概率$p_{r}(y|x)$：给定x，真实分布1.2多分类$f:x\rightarrowp(y|x)$\([p(y=0|x),p(y=1|x),...
【PyTorch学习笔记】8.对抗生成网络贪钱算法还我头发 #Deep Learning AI 人工智能深度学习 python pytorch
文章目录52.GAN简介53.画家的成长历程54.纳什均衡54.1纳什均衡-D54.2纳什均衡-G55.JS散度的弊端56.EM距离57.WGAN与WGAN-GP58.实战58.1GAN58.2WGAN根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲52.GAN简介生成式对抗网络(Generat
深度学习与PyTorch笔记10 niuniu990 python pytorch
tensor的统计属性常见的统计属性：norm(范数)，mean(均值)，sum(求和)，prod(累乘)，max(最大值)，min(最小值)，argmin(最小值位置)，argmax(最大值位置)，kthvalue(求第k个小的值的位置)，topk(求前k个大的值)normnorm-p.norm(1)一范数，所有元素绝对值求和.norm(2)二范数，所有元素绝对值的平方和，再开根.norm(n,
【week1】深度学习与pytorch基础 Coco珂笔记深度学习 pytorch 人工智能
week01深度学习与pytorch基础练习深度学习笔记深度学习深度学习概述pytorch的基础练习螺旋数据分类构建线性模型分类构建两层神经网络分类深度学习笔记人工智能的三个层面：计算智能：能存能算计算机具有快速计算和记忆存储的能力感知智能、能听会说、能看会认是目前人工智能的层面，类似于人的视觉、听觉、触觉认知智能：逻辑推理、认识理解、决策思考、机器学习的定义：最常用定义：计算机系统能够利用经验提
干货！141页的《深度学习PyTorch》开源书籍 Python数据之道 python 人工智能编程语言深度学习 java
介绍一本发布在Pytorch官网上的深度学习开源书，《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据、学习机制、用神经网络拟合数据等方面的内容，据称核心是指导读者使用Python和PyTorch实现深度学习算法。资料获取方式：下方公众号回复：7745Python程序员内容简介介绍一本发布在Pytorch官网上
【PyTorch】学习笔记(02):开发环境准备 Drmon. 机器学习 Python3 深度学习 pycharm cuda pytorch
【PyTorch】深度学习与Pytorch实战笔记学习笔记02:开发环境准备【PyTorch】深度学习与Pytorch实战笔记1.环境2.检测环境3.配置Pycharm1.环境Python+AnacondaCUDAPycharm2.检测环境nvcc-V3.配置Pycharm
注意力机制神经网络_GNN|三种注意力机制在图神经网络中的应用和总结 weixin_39717865 注意力机制神经网络
作者|ArchWalker编辑|深度学习与PyTorch转载|https://archwalker.github.io/blog/2019/06/01/GNN-Triplets-GAT.html声明|文章经作者授权转载引言在前两篇推文(图神经网络GraphConvolutionalNetwork(GCN)：从问题到理论分析;论文详解|浅谈GraphSage之图学习中的Inductivelearni
PyTorch + OpenVINO 开发实战系列教程英特尔边缘计算社区 OpenVINO pytorch openvino 深度学习
概述大家好，本章是主要介绍一下深度学习框架Pytorch的的历史与发展，主要模块构成与基础操作代码演示。重点介绍Pytorch的各个组件、编程方式、环境搭建、基础操作代码演示。本章对有Pytorch开发经验的读者来说可以直接跳过；对初次接触Pytorch的读者来说，通过本章学习认识Pytorch框架，搭建好Pytorch的开发环境，通过一系列的基础代码练习与演示建立起对深度学习与Pytorch框架
【DL with Pytorch】第 1 章：深度学习与PyTorch简介 Sonhhxg_柒深度学习（DL）深度学习 pytorch 人工智能
大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流个人主页－Sonhhxg_柒的博客_CSDN博客欢迎各位→点赞+收藏⭐️+留言系列专栏-机器学习【ML】自然语言处理【NLP】深度学习【DL】foreword✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。如果你对这个系列感兴趣的话，可以关注订阅哟文章目录
深度学习与PyTorch(一）飞天小福蝶 Python计算机视觉深度学习 pytorch
文章目录深度学习运算基本单元Tensor与ndarrayCPU与GPU运算实现K-means蒙特卡罗算法自动求导反向传播数据加载DatasetDataLoader深度学习深度学习原本是一种实现机器学习的手段，用于解决机器学习中的分类，回归等问题。运算基本单元Tensor与ndarray#coding=utf-8importtorchimportnumpyasnpa=np.ones((2,2))pr
【PyTorch学习笔记】7.自编码器贪钱算法还我头发 AI #Deep Learning 神经网络深度学习 python 自编码器 pytorch
文章目录47.Auto-Encoder介绍48.Auto-Encoder变种49.VariationalAuto-Encoder引入50.变分自编码器VAE51.实战51.1AE51.2VAE根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲47.Auto-Encoder介绍SupervisedL
全新深度学习与PyTorch入门实战教程 m0_59289129 深度学习 pytorch 机器学习
深度学习与PyTorch入门实战教程┣━━1.深度学习框架介绍┃┗━━1.lesson1-PyTorch介绍.mp4┣━━2.开发环境准备┃┗━━2.lesson2-开发环境准备.mp4┣━━3.初见深度学习┃┣━━3.lesson3-初探LinearRegression案例-1.mp4┃┣━━4.lesson3-初探LinearRegression案例-2.mp4┃┣━━5.lesson4-Py
深度学习 pytorch学习黑桃5200 Pytorch
背景准备用4周时间，根据深度学习与PyTorch入门实战视频教程，刷完配套的源代码。熟悉pytorch的使用。具体内容如下：每天抄写2-3个lesson的代码，完成任务之后微信群打卡。参考资料https://github.com/dragen1860/Deep-Learning-with-PyTorch-Tutorials后台回复「pytorch资源」，获取资源！后台回复「组队学习」，加入组队学习
第一周学习：深度学习与pytorch基础代码实战刘zekai 深度学习 pytorch 学习
目录part1：理论视频学习一.人工智能和深度学习概述1.人工智能定义及其三个层面2.机器学习2.1机器学习定义2.2机器学习过程2.2.1模型分类二.深度学习概述1.人工智能、机器学习、深度学习之间的关系2.深度学习的不能3.浅层神经网络3.1激活函数3.2万有逼近定理与神经网络3.3更宽or更深3.4反向传播误差3.5梯度消失part2：代码练习一.pytorch基础练习1.定义数据2.定义操
深度学习与PyTorch入门实战 Saber_e pytorch笔记 pytorch 深度学习 python
深度学习与PyTorch入门实战笔记1数据和初始化importtorcha=torch.randn(2,3)#随机初始化，正态分布print(a)#tensor([[-1.0912,-0.3995,-0.3796],#[0.5615,-0.2030,0.4820]])print(a.size())#类中的函数#torch.Size([2,3])print(list(a.size()))#可以转Li
【重磅干货】Python、机器学习、深度学习算法实战和应用必备书籍深度学习技术前沿神经网络人工智能编程语言深度学习机器学习
【导读】首先祝大家中秋佳节快乐，乘此良辰美景，今天就给大家发一波福利干货！本文给大家分享机器学习、深度学习算法实战和应用必备的4本“宝藏”书。具体书籍展示如下：（文末提供下载方式！）1.DeepLearningWithPyTorch（PyTorch官方指定教程）《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据
【PyTorch学习笔记】6.循环神经网络贪钱算法还我头发 AI #Deep Learning 人工智能深度学习 python pytorch
文章目录40.时间序列表示41.循环神经网络42.RNNLayer使用42.1nn.RNN42.2nn.RNNCell43.时间序列预测44.RNN训练难题45.LSTMLayer使用45.1nn.LSTM45.2nn.LSTMCell46.情感分类实战根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人
卧槽！一大波深度学习“宝藏书”来啦！免费下载... 视学算法神经网络人工智能编程语言 python 深度学习
【导读】今天给大家推荐一下机器学习、深度学习算法实战和应用必备的4本“宝藏”书。具体书籍展示如下：（文末提供下载方式！）1.DeepLearningWithPyTorch（PyTorch官方指定教程）《DeepLearningwithPyTorch》，上面共有五个章节，包括了深度学习与PyTorch库、张量、如何用张量表示真实世界的数据、学习机制、用神经网络拟合数据等方面的内容，核心是指导读者使用
网易云课程：深度学习与PyTorch入门实战鱼与钰遇雨人工智能
网易云课程：深度学习与PyTorch入门实战01深度学习初见1.1深度学习框架简介1.2pytorch功能演示2开发环境安装3回归问题3.1简单的回归问题（梯度下降算法）3.3回归问题实战3.4分类问题引入3.6手写数字识别体验4Pytorch基础4.1张量数据类型4.2创建Tensor4.3索引与切片4.4维度变换5随机梯度下降5.1什么是梯度？5.2什么是梯度局部极小值鞍点影响搜索过程的其他因
【Pytorch学习笔记】5.卷积神经网络贪钱算法还我头发 AI #Deep Learning 神经网络深度学习 pytorch python 卷积神经网络
文章目录32.卷积神经网络33.池化层&上/下采样34.批量正则化35.经典卷积网络36.残差网络37.nn.Module38.数据增强39.实战根据龙良曲Pytorch学习视频整理，视频链接：【计算机-AI】PyTorch学这个就够了！(好课推荐)深度学习与PyTorch入门实战——主讲人龙良曲32.卷积神经网络基础知识还是得看ngimporttorchimporttorch.nnasnnimp
深度学习与Pytorch入门笔记星时雨星深度学习 pytorch 神经网络
一、基本操作pythonPytorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-optim/一、Anaconda基本操作1、用conda创建Python虚拟环境（在condaprompt环境下完成）condacreate-nenvironment_namepython=X.X2、激活虚拟环境（在
深度学习与Pytorch入门实战（六）定义MLP&GPU加速&测试【数字识别实例】 Douzi1024
笔记摘抄Pytorch定义网络结构识别手写数字，可以对网络中的参数w和b进行手动定义的(参考上一节)也可以直接用nn.Linear定义层的方式来定义更加方便的方式是直接继承nn.Module来定义自己的网络结构。1.nn.Linear方式importtorchimporttorch.nnasnnimporttorch.nn.functionalasF#模拟一张28*28的图片摊平x=torch.r
深度学习与PyTorch笔记21 niuniu990
Visdom可视化TensorboardX使用pipinstalltensorboardX命令来安装。tensorboardX在pytorch中怎么使用：它有一个SummaryWriter，新建一个SummaryWriter实例，把要监听的数据起一个名字，(‘data/scalar’（名字）,dummy_s1[0]（数据）,n_iter（x坐标，代表的是哪一个epoch）)。tensorboard
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

基于CNN模型的手写字符识别的分析与实现过程

1.前言

2.使用的工具介绍

2.1.TensorboardX

2.2.Netron

3.搭建CNN神经网络

3.1 CNN结构

3.1.1卷积层

3.1.2池化层

3.1.3全连接层

3.2构建CNN与代码实现

3.3CNN结构模型数据流可视化

3.3.1tensorboardx可视化

3.3.2Netron可视化模型

4.特征提取可视化

5.分析

6.总结

你可能感兴趣的:(深度学习与pytorch)