小小yoghurt

pytorch学习笔记（三）

1.前言

上次我们简单讲了一个神经网络的构成，这次我们小试牛刀，来试着基于CIFAR-10来训练一个分类器，CIFAR-10共有60000张彩色图像，这些图像是32*32，分为10个类，每类6000张图。这里面有50000张用于训练，构成了5个训练批，每一批10000张图；另外10000用于测试，单独构成一批。测试批的数据里，取自10类中的每一类，每一类随机取1000张。抽剩下的就随机排列组成了训练批。注意一个训练批中的各类图像并不一定数量相同，总的来看训练批，每一类都有5000张图。

我们将按照如下步骤训练一个图像分类器：

用torchvision包载入并标准化CIFAR-10数据集
定义一个卷积网络
定义一个损失函数
用训练集训练网络
用测试集测试网络

2.训练一个分类器

2.1载入并标准化CIFAR-10数据集

先看代码：

import torch
import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
trainset = torchvision.datasets.CIFAR10(root='./data',train = True,download=True,transform = transform)
trainloader = torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=2)
testset = torchvision.datasets.CIFAR10(root='./data',train = False,download=True,transform = transform)
testloader = torch.utils.data.DataLoader(testset,batch_size=4,shuffle=False,num_workers=2)

classes = ('Plane','Car','Bird','Cat','Deer','Dog','Frog','Horse','Ship','Truck')

就部分函数进行说明

Compse

这就相当于一个函数的嵌套，例如把f和g组合起来就是f(g(x)).x是g的参数,执行的结果作为f的参数再执行,最后的结果就是组合函数的结果.这里就是把规则化的数据集传给ToTensor函数

torchvision.transforms.Normalize(mean,std)

我们本来的数据集是RGB在[0,1]范围内的图像数据集，我们通过标准化将其转化为[-1,1]的数据集，其中两个参数分别为输入的均值和标准差，1*3对应了RGB三个channels，公式如下：

o u t p u t [c h a n n e l] = (i n p u t [c h a n n e l] - m e a n [c h a n n e l]) / s t d [c h a n n e l]

torchvision.transforms.ToTensor

我们原本的数据集是PILImage格式，我们要将其转换成我们需要的张量tensor格式

torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=2)

简单解释一下这行代码的意思，读取训练数据集，一次读四个样本，每次读取都会重洗数据集随机读取，有两个子程序用于数据读取

输出：

Downloading http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz
Files already downloaded and verified

我们来简单看看一些训练图像：

import matplotlib.pyplot as plt
import numpy as np


#functions to show an image

def imshow(img):
    img = img/2+0.5#unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg,(1,2,0)))

#get some random training images
dataiter = iter(trainloader)
images,labels = dataiter.__next__()

#show images
imshow(torchvision.utils.make_grid(images))
#print labels
print(''.join('%5s'%classes[labels[j]] for j in range(4)))

输出

其中有一点，教程中代码给的dataiter.next()，但我这样得不到图像，而且根据编辑器的暗示用了加下划线的就显示了图像，这点我觉得不是很重要，就没有细究

2.2定义一个卷积神经网络

入门时，我们就用我们之前写的很简单的一个网络，不过在第一层卷积输入时要把1 channel输入换成3 channel

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        #3 input image channel,6 output channels,5x5 square convolution kernel
        self.conv1=nn.Conv2d(3,6,5)#生成一个1输入6输出的5x5的卷基层
        self.pool = nn.MaxPool2d(2,2)
        self.conv2=nn.Conv2d(6,16,5)#生成一个6输入16输出的5x5的卷基层
        #an affine operation:y=wx+b
        self.fc1=nn.Linear(16*5*5,120)#生成一个16*5*5输入120输出的线性变换层
        self.fc2=nn.Linear(120,84)#生成一个120输入84输出的线性变换层
        self.fc3=nn.Linear(84,10)#生成一个84输入10输出的线性变换层

    def forward(self,x):
        #Max pooling over a (2,2) window
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1,16*5*5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

net = Net()

你会感觉和我们之前写的代码有所不同，其实这里除了一些小的参数的改变，并没有什么变化，整个步骤还是按照我学习笔记（二）里面讲的来的，不同的其一是把池化函数放进了init里面，在这里顺便讲讲torch.nn和torch.nn.functional的区别，在建图过程中，往往有两种层，一种如全连接层，卷积层等，当中有Variable，另一种如Pooling层，Relu层等，当中没有Variable。如果所有的层都用nn.functional来定义，那么所有的Variable，如weights，bias等，都需要用户来手动定义，非常不方便。而如果所有的层都换成nn来定义，那么即便是简单的计算都需要建类来做，而这些可以用更为简单的函数来代替的。所以在定义网络的时候，如果层内有Variable,那么用nn定义，反之，则用nn.functional定义。(来源)

其二是少了一个num_flat_features函数，而是直接x.view(-1,16* 5* 5)代替，因为我们当时只是为了看看这个网络的输出，没实际意义，而这里的输入是有他的意义的，我们不要随意改变，所以直接把这些展成一维数组。

其实本质上和我们前面的没什么区别，很好理解的

2.3定义一个损失函数和优化控制

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(),lr = 0.001,momentum = 0.9)

这里我们用到的损失函数是Cross-Entropy loss和带动量的随机梯度下降方法更新参数

Cross-Entropy loss

交叉熵损失，在机器学习领域，多分类问题很常见，在很多深度学习模型当中，网络的输出层就是一个softmax层，对于NN分类问题，输出是一个NN维的向量，向量元素介于[0,1]之间，且元素累加和为1（这是softmax性质所决定的）；将softmax层输出向量视为预测类别的概率分布q(x)，用真实类别标签构造真实的类别概率分布p(x)（例如，令真实类别概率为1，其余类别概率为0），那么相对熵DKL(P||Q就可以评价预测结果q(x)的好坏了，我们只需要最小化它就好了。交叉熵等于基于预测概率分布q(x)对符合p(x)分布的字符集进行编码之后的平均字符编码长度，通过最小化交叉熵可以使q(x)逼近真实分布p(x)，也就使得预测模型更优。来源

H' (X) = \sum x p (x) l o g 1 q ( x )

其中有一个名词是softmax，我们简单说说这个，我们知道max，假如说我有两个数，a和b，并且a>b，如果取max，那么就直接取a，没有第二种可能但有的时候我不想这样，因为这样会造成分值小的那个饥饿。所以我希望分值大的那一项经常取到，分值小的那一项也偶尔可以取到，那么我用softmax就可以了现在还是a和b，a>b，如果我们取按照softmax来计算取a和b的概率，那a的softmax值大于b的，所以a会经常取到，而b也会偶尔取到，概率跟它们本来的大小有关。所以说不是max，而是 Soft max 那各自的概率究竟是多少呢，我们下面就来具体看一下，假设我们有一个数组，V，Vi表示V中的第i个元素，那么这个元素的Softmax值就是这段摘自

S = e V i \sum j e V j

SGD with momentum

关于SGD我们不再多说，什么叫动量的呢，其实在这里我们更好地可以把它理解成一个摩擦系数，用来阻碍梯度的下降速度，使得梯度在下降到最低的时候不要再继续下降，更确切地说，不要再下降的过于迅猛

v = momentum * v - learning_rate * dx

这个代码就很直观的反映了momentum的作用

2.4训练网络

for epoch in range(2):#loop over the dataset multiple times

    running_loss = 0.0
    for i,data in enumerate(trainloader,0):
        #get the input
        inputs,labels = data

        #zero the parameter gradients
        optimizer.zero_grad()

        #forward+backward+optimize
        outputs = net(inputs)
        loss = criterion(outputs,labels)
        loss.backward()
        optimizer.step()

        #print statistics
        running_loss += loss.item()
        if i % 2000 == 1999:#print every 2000 mini-batches
            print('[%d %5d] loss:%.3f'%(epoch+1,i+1,running_loss/2000))
            running_loss = 0.0
print('Finished Training')

这里面的代码都比较容易理解，整个思路就是在训练集中做两次大循环训练，每2000张训练完成后输出一次当前的平均损失值，直到循环结束。

其中enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标，一般用在 for 循环当中。使用起来非常便捷。

输出：

[1  2000] loss:1.919
[1  4000] loss:1.886
[1  6000] loss:1.862
[1  8000] loss:1.859
[1 10000] loss:1.846
[1 12000] loss:1.859
[2  2000] loss:1.838
[2  4000] loss:1.822
[2  6000] loss:1.812
[2  8000] loss:1.815
[2 10000] loss:1.825
[2 12000] loss:1.827
Finished Training

结果因电脑而异，本人电脑可能比较水，就没怎么把损失降下来。

2.5用测试集测试我们训练的网络

首先我们来随机展示几张测试集的图片：

dataier = iter(testloader)
images,labels = dataiter.__next__()

#print images
imshow(torchvision.utils.make_grid(images))
print('GroundTruth:',' '.join('%5s'%classes[labels[j]]for j in range(4)))

接下来把这些图片放入我们的网络中看会给它们什么标签：

outputs = net(images)
_,predicted = torch.max(outputs,1)
print('Predicted: ',' '.join('%5s'%classes[predicted[j]]for j in range(4)))

torch.max就是输出最可能的那个预测

Predicted:   Deer  Deer Plane Plane

一半对一半错，感觉还不错，那我们来看看整体正确率

correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images,labels = data
        outputs = net(images)
        _,predicted = torch.max(outputs.data,1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
print('Accuracy of the network on the 10000 test images: %d %%'%(100*correct/total))

Accuracy of the network on the 10000 test images: 30 %

感觉不是特别棒，但还是那句话，因电脑而异

再来看看各个标签的正确率

class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():
    for data in testloader:
        images,labels = data
        outputs = net(images)
        _,predicted = torch.max(outputs,1)
        c = (predicted==labels).squeeze()
        for i in range(4):
            label = labels[i]
            class_correct[label]+=c[i].item()
            class_total[label]+=1
for i in range(10):
    print('Accurary of %5s : %2d %%'%(classes[i],100*class_correct[i]/class_total[i]))

Accurary of Plane : 62 %
Accurary of   Car : 28 %
Accurary of  Bird :  4 %
Accurary of   Cat : 34 %
Accurary of  Deer : 37 %
Accurary of   Dog : 27 %
Accurary of  Frog : 20 %
Accurary of Horse : 50 %
Accurary of  Ship :  2 %
Accurary of Truck : 32 %

可以发现，在某些上预测还不错，但比如鸟和船的预测就没那么棒了，在我的直觉中，我的电脑可能把所有的船都当做飞船了吧

3.小结

这次我们用了一个比较简单的卷积网络训练了一个分类器，效果不是很好，但算是入门了吧，更多的是明白一些函数的用处和其中的一些原理，因为我用的是cpu版的pytorch，所以就不涉及cuda以及gpu的操作了，大家有兴趣的可以自己看看，我也比较建议学一学，这次内容不少，但不难，是把之前的整个串了起来

PyTorch学习笔记之基础函数篇（四）熊猫Devin 深度学习之PyTorch pytorch 学习笔记
文章目录2.8torch.logspace函数讲解2.9torch.ones函数2.10torch.rand函数2.11torch.randn函数2.12torch.zeros函数2.8torch.logspace函数讲解torch.logspace函数在PyTorch中用于生成一个在对数尺度上均匀分布的张量（tensor）。这意味着张量中的元素是按照对数间隔排列的，而不是线性间隔。这对于创建在数
pytorch学习笔记（2）--Tensor ToToBe pytorch 笔记 1024程序员节
系列文章pytorch学习笔记（1）–QUICKSTARTpytorch学习笔记（2）–Tensorpytorch学习笔记（3）–数据集与数据导入pytorch学习笔记（4）–创建模型(BuildModel)pytorch学习笔记（5）–Autograd文章目录系列文章Tensor（张量）1.初始化张量2.张量的属性3.张量的操作1.类似numpy的索引和切片2.拼接3.算数操作4.单元素张量5.
PyTorch学习笔记（三）：softmax回归 FriendshipT PyTorch学习笔记 pytorch 回归深度学习 softmax
PyTorch学习笔记（三）：softmax回归softmax回归分类问题softmax回归模型单样本分类的矢量计算表达式小批量样本分类的矢量计算表达式交叉熵损失函数模型预测及评价小结Torchvision获取数据集读取小批量PyTorch从零开始实现softmax获取和读取数据初始化模型参数实现softmax运算定义模型定义损失函数定义优化算法计算分类准确率训练模型预测小结PyTorch模块实现
PyTorch学习笔记1 zt_d918
训练过程importtorch#batch_size,input_dimension,hidden_dimension,output_dimensionN,D_in,H,D_out=64,1000,100,10#模拟一个训练集x=torch.randn(N,D_in)y=torch.randn(N,D_out)#模型定义有多种方式，这里不提model#loss函数定义loss_fn=torch.n
小土堆pytorch学习笔记004 柠檬不萌只是酸i 深度学习 pytorch 学习笔记机器学习深度学习
目录1、神经网络的基本骨架-nn.Module的使用2、卷积操作实例3、神经网络-卷积层4、神经网络-最大池化的使用（1）最大池化画图理解：（2）代码实现：5、神经网络-非线性激活（1）代码实现（调用sigmoid函数）6、神经网络-线性层（1）代码7、网络搭建-小实战（1）完整代码1、神经网络的基本骨架-nn.Module的使用官网地址：pytorch里的nnimporttorchfromtor
小土堆pytorch学习笔记003 | 下载数据集dataset 及报错处理柠檬不萌只是酸i 深度学习人工智能深度学习机器学习 pytorch python
目录1、下载数据集2、展示数据集里面的内容3、DataLoader的使用例子：结果展示：1、下载数据集#数据集importtorchvisiontrain_set=torchvision.datasets.CIFAR10(root="./test10_dataset",train=True,download=True)test_set=torchvision.datasets.CIFAR10(ro
小土堆pytorch学习笔记005 | 完结，✿✿ヽ(°▽°)ノ✿ 柠檬不萌只是酸i 深度学习学习笔记 pytorch 机器学习深度学习
目录1、损失函数与反向传播2、如何在搭建的网络中使用损失函数呢？3、优化器4、现有网络模型的使用及修改例子：5、模型训练保存+读取（1）保存（2）读取6、完整的模型训练：（1）代码【model文件】：【主文件】：（2）运行截图：（3）绘图展示：（4）添加训练正确率的完整代码：（5）总结！！！：（6）使用GPU训练7、完整模型验证（1）代码（2）运行结果1、损失函数与反向传播①计算实际输出和目标之间
小土堆pytorch学习笔记002 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
目录1、TensorBoard的使用（1）显示坐标：（2）显示图片：2、Transform的使用3、常见的Transforms（1）#ToTensor()（2）#Normalize()（3）#Resize()（4）#Compose()4、总结：1、TensorBoard的使用（1）显示坐标：fromtorch.utils.tensorboardimportSummaryWriterimportnu
【pytorch】pytorch学习笔记（续2）小白冲鸭 pytorch 学习笔记
p30：1.均方差（MeanSquaredError,MSE）：（1）注意区分MSE和L2范数：L2范数要开根号，而MSE不需要开根号。用torch.norm函数求MSE的时候不要忘记加上pow(2)。求导：pytorch实现自动求导：第一种方法：torch.autograd.grad()设置w需要求导有两种方法：（1）在创建w之后，用来设置w需要求导。（2）在创建w的时候，用w=torch.te
【pytorch】pytorch学习笔记（续1）小白冲鸭 pytorch 学习笔记
p22：1.加减乘除：（1）add(a,b)：等同于a+b。（2）sub(a,b)：等同于a-b。（3）mul(a,b)：等同于a*b。（4）div(a,b)：等同于a/b。a//b表示整除。2.tensor的矩阵式相乘：matmul注意区分：（1）*：表示相同位置的元素相乘；（2）.matmul：表示矩阵相乘。对于（2）矩阵的相乘，有三种方式：(1)torch.mm:只适用于二维的tensor，
【pytorch】pytorch学习笔记小白冲鸭 pytorch 学习笔记
（实践）p5：线性回归问题中损失函数为什么要使用均方误差？均方误差：即误差的平方和的平均数。p8：1.pytorch不是一个完备的语言库，而是一个对于数据的gpu加速库，所以其没有对string的内键支持，即pytorch的基本类型中不包含string。2.pytorch表示string的方法：（1）onehotencoding问题：1）两个单词之间的相关性并没有在onehot编码中得到体现；2）
【pytorch】pytorch学习笔记（续3）小白冲鸭 pytorch 学习笔记
p41：1.LeakReLU,SELU,softplus2.GPU加速：.to方法p42：不太懂p43：1.visdom，tensorbroadXp44：p45：1.如何检测过拟合？在train上表现很好，而在test上表现不好。test的目的（没有valset的时候）：防止过拟合，选取最优参数。相当于是验证集。一般选取testaccuracy最高的那点停止训练，作为最优参数。p46：1.trai
小土堆pytorch学习笔记001 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
1、Pytorch环境的配置与安装。（1）建议安装：Anaconda（2）检查显卡：GPU（3）管理环境（不同版本的pytorch版本不同）：condacreate-npytorchpython=3.6（4）检测自己的电脑是否可以使用：2、pytorch编辑器的选择（1）pycharm（下载社区版）（2）jupyter（可以交互）启动本地的jupyter:3、为什么torch.cuda.is_av
Pytorch学习笔记(2) Autograd(自动求导) —— PyTorch的核心银色尘埃010
本文是Pytorch快速入门第二部分，主要学习记录，主要翻译PytorchAutograd部分教程原文autograd包是PyTorch中神经网络的核心部分。torch.autograd提供了类和函数,用来对任意标量函数进行求导。要想使用自动求导，只需要对已有的代码进行微小的改变。只需要将所有的tensor包含进Variable对象中即可。一、Tensor(张量)torch.Tensor是程序包的
pytorch学习笔记（十）満湫学习笔记
一、损失函数举个例子比如说根据Loss提供的信息知道，解答题太弱了，需要多训练训练这个模块。Loss作用：1.算实际输出和目标之间的差距2.为我们更新输出提供一定的依据（反向传播）看官方文档每个输入输出相减取平均取绝对值再取平均第一个损失函数：L1Loss（差的绝对值取平均）需要注意输入输出N=batch_size你有多少个数据第一个损失函数：MSELoss（平方差误差，平方取平均）稳妥的写法是先
pytorch学习笔记（八）満湫 pytorch 学习笔记
Sequential看看搭建了这个能不能更容易管理，CIFAR-10数据集进行看一下网络模型CIFAR-10模型123456789输入进过一次卷积，然后经过一次最大池化，尺寸变成16*16了，在经过一次卷积尺寸没变，紧接着进过了一次最大池化，变成了8*8，再经过一次卷积通道数改变32→64，再经过一次池化变成4*4，然后展平，最后输出。（1-2）根据图里面看，32×32经过卷积后的尺寸仍然是32×
pytorch学习笔记（十一）満湫 pytorch 学习笔记
优化器学习把搭建好的模型拿来训练，得到最优的参数。importtorch.optimimporttorchvisionfromtorchimportnnfromtorch.nnimportSequential,Conv2d,MaxPool2d,Flatten,Linearfromtorch.utils.dataimportDataLoaderdataset=torchvision.datasets
pytorch学习笔记（五）満湫学习笔记
关注不同的方法输入是什么类型，输出是什么类型。1.Compose主要关注初始化函数从作用内置call的调用方法两种，第一种,直接使用对象，不用使用点，直接调用的是__call__当要调用的时候直接写个Person()按住ctrl+P看看需要填啥参数。2.Totensor的使用输出结果如下3.Normalize归一化输入必须要tensor的均值，标准差，然后看图片的维度计算4.Resize给定的是一
pytorch学习笔记満湫 pytorch 学习人工智能
torchvision处理图像的pytorch官网上看数据集的包，COCO数据集目标检测、语义分割，cifar物体识别预训练好的模型这个模块是图片的处理root-位置，train-创建的true是个训练集，transform前面是输出图片的数据类型，“3”是targetimporttorchvisionfromtorch.utils.tensorboardimportSummaryWriterda
pytorch学习笔记（七）満湫 pytorch 学习笔记
池化类似压缩最大池化-上采样例如给一个3的话就会生成一个3×3的窗口（生成相同的高和宽），给一个tuple就会给出一个相同的池化核。stride默认值就是核的大小dilation在卷积dialation设置之后每一个会和另外的差一个，空洞卷积ceilfloor模式（天花板、地板）floor就是向下取整。按下面的方法走，走的步数默认为核的大小取9个里面的最大值，走到右一图，这种情况只能覆盖6个，其他
pytorch学习笔记（一）乌拉圭没有壳
1、今天在学习60分钟pytorchtutorial中2、zip就是把2个数组糅在一起x=[1,2,3,4,5]y=[6,7,8,9,10]zip(x,y)[(1,6),(2,7),(3,8),(4,9),(5,10)]还可以方便建立字典。x=['bob','tom','kitty']>>>y=[80,90,95]>>>d=dict(zip(x,y))[('bob',80),('tom',90),
Pytorch学习笔记 | GAN生成对抗网络 | 代码 | 生成mnist手写数字图片惊鸿若梦一书生 Python深度学习 pytorch 学习笔记
文章目录GAN网络简介测试判别器和测试生成器测试判别器测试生成器首次生成图片（效果欠佳）生成图片（比较清晰，但还有差距）生成图片（继续优化，输入扩维）生成图片（继续优化，）GAN网络简介生成对抗网络（GAN，GenerativeAdversarialNetworks）是一种深度学习模型，由IanGoodfellow和他的同事在2014年首次提出。GAN是一种非常强大和独特的神经网络架构，用于生成新
『PyTorch学习笔记』分布式深度学习训练中的数据并行(DP/DDP) VS 模型并行 AI新视界 Pytorch学习笔记 pytorch 数据并行模型并行 Data Parallel
分布式深度学习训练中的数据并行(DP/DDP)VS模型并行文章目录一.介绍二.并行数据加载2.1.加载数据步骤2.2.PyTorch1.0中的数据加载器(Dataloader)三.数据并行3.1.DP(DataParallel)的基本原理3.1.1.从流程上理解3.1.2.从模式角度理解3.1.3.从操作系统角度看3.1.4.低效率3.2.DDP(DistributedDataParallel)的
Pytorch学习笔记——autograd 岳野学习笔记 python 机器学习深度学习
一、神经网络神经网络就是一个”万能的模型+误差修正函数“，每次根据训练得到的结果与预想结果进行误差分析，进而修改权值和阈值，一步一步得到能输出和预想结果一致的模型。机器学习可以看做是数理统计的一个应用，在数理统计中一个常见的任务就是拟合，也就是给定一些样本点，用合适的曲线揭示这些样本点随着自变量的变化关系。深度学习同样也是为了这个目的，只不过此时，样本点不再限定为(x,y)点对，而可以是由向量、矩
PyTorch学习笔记欢桑 pytorch 学习深度学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录学习目标学习内容：一pytorch深度学习方法二构建一个简单神经网络三深度学习工作流和pytorch生态系统四基于pytorch构建CNN五RNN以及序列数据处理六生成对抗网络七强化学习八将pytorch用用于生产三种不同的方法总结学习目标4月份到来之前学完《PorTorch深度学习实战》学习内容：一pytorch深度学习方法
Pytorch学习笔记（4）—LSTM序列生成模型 llddycidy Pytorch学习笔记 pytorch 学习笔记
文章目录前言主要内容一、序列生成问题解决方法二、RNN的引入三、LongShortTermMemory(LSTM)4、序列生成音乐本文引用：前言掌握使用PyTorch构建LSTM模型的方法掌握使用LSTM生成MIDI音乐的方法主要内容如何用神经网络做序列生成？RNN与LSTM的工作原理RNN是如何记忆Pattern的？MIDI音乐的原理如何用LSTM作曲一、序列生成问题解决方法将生成问题转化成一个
PyTorch学习笔记（二）——TensorBoard routine1o1oo pytorch
1用途1、训练过程中loss是如何变化的，是否正常或是否按预想的变化，选择什么样的模型2、模型在不同阶段的输出2需要导入的类和常用的方法fromtorch.utils.tensorboardimportSummaryWriterwriter.add_image()writer.add_scalar()查看SummaryWriter的官方文档直接向log_dir文件夹写入事件文件，可以被Tensor
【pytorch学习笔记03】pytorch完整模型训练套路 yierrrrr DL学习笔记 pytorch 学习笔记
B站我是土堆视频学习笔记，链接：https://www.bilibili.com/video/BV1hE411t7RN/?spm_id_from=333.999.0.01.准备数据集train_data=torchvision.datasets.CIFAR10(root='./dataset',train=True,transform=torchvision.transforms.ToTensor
PyTorch学习笔记 Junoxiang pytorch 学习笔记
1.item()→number方法:item()返回一个数只能用于只包含一个元素的张量。对于其他的张量，请查看方法tolist().该操作是不可微分的,即不可求导.(译者注:返回的结果是普通Python数据类型,自然不能调用backward()方法来进行梯度的反向传播)Example:例子:>>>x=torch.tensor([1.0])>>>x.item()1.02.Tensor（张量）中包含d
PyTorch学习笔记（4）--神经网络模型的保存和导入别管我啦就是说 Pytorch学习笔记 python pytorch
1.numpy矩阵的保存importnumpyasnpa=np.array(2)np.save("nm.npy",a)a=np.load("nm.npy")2.模型的保存和导入将训练好的模型和参数保存下来，下一次使用的时候直接导入模型和参数，和一个已经训练好的神经网络模型一样保存模型importtorch#保存整个神经网络的结构和模型参数torch.save(mymodel,'mymodel.pk
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

pytorch学习笔记（三）

pytorch学习笔记（三）

1.前言

2.训练一个分类器

2.1载入并标准化CIFAR-10数据集

Compse

torchvision.transforms.Normalize(mean,std)

torchvision.transforms.ToTensor

torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=2)

2.2定义一个卷积神经网络

2.3定义一个损失函数和优化控制

Cross-Entropy loss

SGD with momentum

2.4训练网络

2.5用测试集测试我们训练的网络

3.小结

你可能感兴趣的:(pytorch学习笔记)