糊小胡

PyTorch入门（六）：通过例子学习PyTorch

通过例子学习PyTorch
通过PyTorch的自带例子了解基本概念。
PyTorch有两个主要特征:

一个n维的张量，类似于numpy但可以在GPU上运行
创建和训练神经网络是可以自动微分
使用一个全连接RELU网络作为例子。该网络有一个单独隐藏层，使用梯度下降适应随机数据，最小化输出和标签的欧氏距离。

张量(Tensors)
引入PyTorch之前，首先用numpy实现网络。
Numpy提供一个n维数组，以及许多操作这些数组的函数。Numpy是一个用于科学计算的通用框架；它对计算图、深度学习或者梯度一无所知。然而，可以很容易地使用numpy适应双层网络，手动实现前向和反向操作。

import numpy as np

#N是batchsize,D_in是输入维度,H是隐藏层的维度,D_out是输出维度
N,D_in,H,D_out = 64,1000,100,10

#创建输入和输出
x = np.random.randn(N,D_in)
y = np.random.randn(N,D_out)

#随机初始权重
w1 = np.random.randn(D_in,H)
w2 = np.random.randn(H,D_out)

lr = 1e-6
for t in range(500):
    #前向计算y
    h = x.dot(w1)
    h_relu = np.maximum(h,0)
    y_pred = h_relu.dot(w2)

    #计算并输出loss
    loss = np.square(y_pred-y).sum()
    print(t,loss)

    #反向计算w1和w2相对于loss的梯度
    grad_y_pred = 2.0*(y_pred-y)
    grad_w2 = h_relu.T.dot(grad_y_pred)
    grad_h_relu = grad_y_pred.dot(w2.T)
    grad_h = grad_h_relu.copy()
    grad_h[h<0] = 0
    grad_w1 = x.T.dot(grad_h)

    #更新权重w1和w2
    w1 -= lr*grad_w1
    w2 -= lr*grad_w2

PyTorch:Tensors
Numpy框架很棒，但是不能利用GPU加速其数值计算。所以numpy对于深度学习来说不够。

一个PyToech的张量(Tensor)和numpy数组的概念相同:一个张量是一个n维数组，并且PyTorch提供了许多可以对这些张量进行操作的函数。除此之外，Tensors可以跟踪计算图和梯度，而且也可以作为科学计算的通用工具。
与numpy不同，PyTorch的张量可以利用GPUs加速数值计算。要在GPU上运行张量，需要将其转换成新的数据类型。
将上面numpy代码改写为PyTorch tensor版本:

# -*- coding: utf-8 -*-
import torch

dtype = torch.float
device = torch.device('cuda:0')

#N是batchsize,D_in是输入维度,H是隐藏层的维度,D_out是输出维度
N,D_in,H,D_out = 64,1000,100,10

#创建输入和输出
x = torch.randn(N,D_in,device=device,dtype=dtype)
y = torch.randn(N,D_out,device=device,dtype=dtype)

#随机初始权重
w1 = torch.randn(D_in,H,device=device,dtype=dtype)
w2 = torch.randn(H,D_out,device=device,dtype=dtype)

lr = 1e-6
for i in range(500):
    h = x.mm(w1)
    #torch.clamp(input,min,max,out=None) 将input中的元素限制在[min,max]范围内并返回一个Tensor
    h_relu = h.clamp(min=0)
    y_pred = h_relu.mm(w2)

    #计算并输出loss,通过.item() 从张量中获得 python number
    loss = (y_pred-y).pow(2).sum().item()
    print(i,loss)

    #反向计算w1和w2相对于loss的梯度
    grad_y_pred = 2.0*(y_pred-y)
    grad_w2 = h_relu.t().mm(grad_y_pred)
    grad_h_relu = grad_y_pred.mm(w2.t())
    grad_h = grad_h_relu.clone()
    grad_h[h<0] = 0
    grad_w1 = x.t().mm(grad_h)

    # 更新权重w1和w2
    w1 -= lr * grad_w1
    w2 -= lr * grad_w2

Autograd
使用自动微分自动计算神经网络的反向传播，可以使用Autograd包实现此功能。使用Autograd时，网络的前向传播将定义计算图；图中的节点为张量，边则是从输入张量到产生输出张量的函数。通过此图计算反向传播。

#-*-coding:utf-8-*-
import torch

dtype = torch.float
device = torch.device('cuda:0')

#N是batchsize,D_in是输入维度,H是隐藏层的维度,D_out是输出维度
N, D_in, H, D_out = 64,1000,100,10

#创建随机张量保存输入与输出,利用requires_grad=False表示在反向传递过程中，不需要计算梯度
x = torch.randn(N,D_in,device=device,dtype=dtype)
y = torch.randn(N,D_out,device=device,dtype=dtype)

#随机初始权重,利用requires_grad=True表示在反向传递过程中，需要计算梯度
w1 = torch.randn(D_in,H,device=device,dtype=dtype,requires_grad=True)
w2 = torch.randn(H,D_out,device=device,dtype=dtype,requires_grad=True)

learning_rate = 1e-6
for t in range(500):
    #前向传递：通过对Tensors操作计算预测的y，不需要保留对中间值的引用
    #h = x.mm(w1)
    #h_relu = h.clamp(min=0)
    #y = h_relu.mm(w2)
    y_pred = x.mm(w1).clamp(min=0).mm(w2)

    loss = (y_pred-y).pow(2).sum()
    print(t,loss.item())

    #使用Autograd自动求导
    loss.backward()

    #使用梯度下降进行权值更新,不需要跟踪求导过程，所以包装在torch.no_grad()
    with torch.no_grad():
        w1 -= learning_rate*w1.grad
        w2 -= learning_rate*w2.grad

        w1.grad.zero_()
        w2.grad.zero_()

PyTorch：定义新的autograd函数
实际上，每个基本的autograd算子都是两个作用于张量的函数。正向函数从输入张量计算输出张量。后向函数接收输出张量相对于某个标量值的梯度，并计算输入张量相对于该标量值的梯度。
在PyTorch中可以通过定义torch.autograd.Function来定义自己的Autograd操作。
此例中，定义自己的Autograd执行Relu，并且实现自己的双层网络。

#-*-coding:utf-8-*-
import torch

class MyRelu(torch.autograd.Function):

    @staticmethod
    def forward(ctx, input):
        """
        :param ctx:上下文对象,存储用于反向计算的信息,可缓存任意对象
        :param input: 一个包含输入的张量
        :return: 一个包含输出的张量
        """
        ctx.save_for_backward(input)
        return input.clamp(min=0)

    @staticmethod
    def backward(ctx, grad_output):
        """
        :param ctx:一个上下文对象
        :param grad_output:一个包含loss相对于输出的梯度
        :return:loss相对于输入的梯度
        """
        input = ctx.saved_tensors
        grad_input = grad_output.clone()
        grad_input[grad_input<0] = 0
        return grad_input

dtype = torch.float
device = torch.device('cuda:0')

#N是batchsize,D_in是输入维度,H是隐藏层的维度,D_out是输出维度
N, D_in, H, D_out = 64,1000,100,10

#创建随机张量保存输入与输出,利用requires_grad=False表示在反向传递过程中，不需要计算梯度
x = torch.randn(N,D_in,device=device,dtype=dtype)
y = torch.randn(N,D_out,device=device,dtype=dtype)

#随机初始权重,利用requires_grad=True表示在反向传递过程中，需要计算梯度
w1 = torch.randn(D_in,H,device=device,dtype=dtype,requires_grad=True)
w2 = torch.randn(H,D_out,device=device,dtype=dtype,requires_grad=True)

learning_rate = 1e-6
for t in range(500):
    relu = MyRelu.apply
    y_pred = relu(x.mm(w1)).mm(w2)

    loss = (y_pred-y).pow(2).sum()
    print(t,loss.item())

    loss.backward()

    with torch.no_grad():
        w1 -= learning_rate * w1.grad
        w2 -= learning_rate * w2.grad

        w1.grad.zero_()
        w2.grad.zero_()

TensorFlow：Static Graphs（静态图）

PyTorch的autograd与TensorFlow类似，都定义了一个计算图，并使用自动微分计算梯度。两者最大的区别为:TensorFlow的计算图为静态图，PyTorch则使用动态计算图。
在TensorFlow中，我们定义一次计算图，然后反复执行相同的图，可能向图提供不同的输入数据。在PyTorch中，每个前向传递都定义一个新的计算图。
静态图的优点在于可以预先优化图。例如:为了更高效，一个框架可能会融合一些图操作，或者将一种图分不到多个gpu或多台机器。静态图和动态图的不同在于控制流。

#-*-coding:utf8-*-

import tensorflow as tf
import numpy as np

N,D_in,H,D_out = 64,1000,100,10

x = tf.placeholder(dtype=tf.float32,shape=(None,D_in))
y = tf.placeholder(dtype=tf.float32,shape=(None,D_out))

w1 = tf.Variable(tf.random_normal((D_in, H)))
w2 = tf.Variable(tf.random_normal((H,D_out)))

h = tf.matmul(x,w1)
h_relu = tf.maximum(h,tf.zeros(1))
y_pred = tf.matmul(h_relu,w2)

loss = tf.reduce_sum((y_pred-y)**2.0)

w1_grad,w2_grad = tf.gradients(loss,[w1,w2])

lr = 1e-6
new_w1 = w1.assign(w1-lr*w1_grad)
new_w2 = w2.assign(w2-lr*w2_grad)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    x_value = np.random.randn(N,D_in)
    y_value = np.random.randn(N,D_out)

    for _ in range(500):
        loss_value,_, _ = sess.run(fetches=[loss,new_w1,new_w2],feed_dict={x:x_value,y:y_value})
        print(loss_value)

PyTorch:nn
对于大型神经网络，原始Autograd过于低级。构建神经网络时，可以考虑将计算安排到层中，其中的一些层具有可学习的参数，这些参数在学习期间优化。
在TensorfFlow中，例如keras，TensorFlow-Slim和TFLearn这样的软件包提供了对构建神经网络有用的原始计算图形的更高级别的抽象。
在PyTorch中，nn包有相同的作用。nn包定义了一些模块，类似与神经网络层，模块接受输入张量，计算输出张量，但也可以保持内部状态，例如包含可学习参数的张量。 nn包还定义了一组在训练神经网络时常用的损失函数。

#-*-coding:utf-8-*-
import torch
import torch.nn as nn

N,D_in,H,D_out = 64,1000,100,10

x = torch.randn(N,D_in)
y = torch.randn(N,D_out)

model = nn.Sequential(
    nn.Linear(D_in,H),
    nn.ReLU(),
    nn.Linear(H,D_out),)

loss_fn = nn.MSELoss(reduction='sum')

lr = 1e-4

for i in range(500):
    y_pred = model(x)
    loss = loss_fn(y_pred,y)
    print(i,loss.item())

    model.zero_grad()
    loss.backward()

    with torch.no_grad():
        for param in model.parameters():
            param -= lr*param.grad

PyTorch: optim
PyTorch中的optim包提取了优化算法的思想，并且实现了常用的优化算法。

#-*-coding:utf-8-*-
import torch
import torch.nn as nn
import torch.optim as optim

N,D_in,H,D_out = 64,1000,100,10

x = torch.randn(N,D_in)
y = torch.randn(N,D_out)

model = nn.Sequential(
    nn.Linear(D_in,H),
    nn.ReLU(),
    nn.Linear(H,D_out),)

loss_fn = nn.MSELoss(reduction='sum')

lr = 1e-4
optimizer = optim.Adam(model.parameters(), lr=lr)
for i in range(500):
    y_pred = model(x)
    loss = loss_fn(y_pred,y)
    print(i,loss.item())

    model.zero_grad()
    loss.backward()
    optimizer.step()

PyTorch: Custom nn Modules
通过继承torch.nn，利用其他模块或者对张量进行autograd操作接受输入张量并且产生输出张量进行前向传递，定义自己自己的模块。

#-*-coding:utf-8-*-
import torch
import torch.nn as nn
import torch.optim as optim

class Net(nn.Module):
    def __init__(self, D_in, H, D_out):
        super(Net,self).__init__()
        self.linear1 = nn.Linear(D_in,H)
        self.linear2 = nn.Linear(H,D_out)

    def forward(self, x):
        h_relu = self.linear1(x).clamp(min=0)
        y_pred = self.linear2(h_relu)
        return y_pred

N, D_in, H, D_out = 64,1000,100,10

x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

model = Net(D_in,H,D_out)

criterion = nn.MSELoss(reduction='sum')
optimizer = optim.SGD(model.parameters(),lr=1e-4)

for i in range(500):
    y_pred = model(x)
    
    loss = criterion(y_pred,y)
    print(i,loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

PyTorch: Control Flow + Weight Sharing
作为动态图和权值共享的例子，实现了一个奇怪的模型：一个全连接的Relu网络，在每个前向传递上选择1到4的随机数并使用这么多的隐藏层，重复使用相同的权值多次，计算最里面的隐藏层。
对于这个模型，我们可以使用普通的Python流控制来实现循环，并且我们可以通过在定义正向传递时多次重复使用相同的模块来实现最内层之间的权重共享。

#-*-coding:utf-8-*-
import torch
import torch.nn as nn
import torch.optim as optim
import random

class DynamicNet(nn.Module):
    def __init__(self, D_in, H, D_out):
        super(DynamicNet, self).__init__()
        self.input_Linear = nn.Linear(D_in,H)
        self.middle_Linear = nn.Linear(H,H)
        self.output_Linear = nn.Linear(H,D_out)

    def forward(self, x):
        h_relu = self.input_Linear(x).clamp(min=0)
        for i in range(random.randint(0,3)):
            h_relu = self.middle_Linear(h_relu).clamp(min=0)
        y_pred = self.output_Linear(h_relu)
        return y_pred

N, D_in, H, D_out = 64,1000,100,10

x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

model = DynamicNet(D_in,H,D_out)

criterion = nn.MSELoss(reduction='sum')
optimizer = optim.SGD(model.parameters(),lr=1e-4)

for i in range(500):
    y_pred = model(x)

    loss = criterion(y_pred,y)
    print(i,loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

PyTorch学习（13）：PyTorch的张量相乘（torch.matmul）赛先生.AI PyTorch pytorch
PyTorch学习（1）：torch.meshgrid的使用-CSDN博客PyTorch学习（2）：torch.device-CSDN博客PyTorch学习（9）：torch.topk-CSDN博客PyTorch学习（10）：torch.where-CSDN博客PyTorch学习（11）：PyTorch的形状变换(view,reshape)与维度变换(transpose,permute)-CSDN
PyTorch实现CIFAR-10分类代码曹勖之 PyTorch学习之路深度学习 pytorch
这篇是PyTorch学习之路第七篇，用于记录PyTorch实现CIFAR-10分类代码（书上的代码有好多冗余）目录完整代码（还未训练）完整代码（已训练，直接载入模型）下面实例数据集位于：C:\Users\22130\Learning_Pytorch\dataset完整代码（还未训练）importtorchimporttorchvisionimporttorchvision.transformsas
PyTorch学习笔记之基础函数篇（四）熊猫Devin 深度学习之PyTorch pytorch 学习笔记
文章目录2.8torch.logspace函数讲解2.9torch.ones函数2.10torch.rand函数2.11torch.randn函数2.12torch.zeros函数2.8torch.logspace函数讲解torch.logspace函数在PyTorch中用于生成一个在对数尺度上均匀分布的张量（tensor）。这意味着张量中的元素是按照对数间隔排列的，而不是线性间隔。这对于创建在数
深入浅出PyTorch学习网址今天是学习的一天人工智能
https://datawhalechina.github.io/thorough-pytorch/
Pytorch学习记录-接近人类水平的GEC（使用混合机器翻译模型）我的昵称违规了
五月第二周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的8.NearHuman-LevelPerformanceinGrammaticalErrorCorrectionwithHybridMachineTranslation昨天一天没看论文，发现我文献阅读速度太
Pytorch学习准备_Pycharm及Jupyter使用写点什么呢学习记录 pytorch 学习人工智能 python pycharm
已经创建环境pytorch01，可参考http://t.csdnimg.cn/KwJvh一.pytorch环境查看打开AnacondaPrompt进入pytorch01环境condaactivatepytorch01列出这个环境下的工具包piplist二.Pycharm打开，创建新项目2.1选择“现有指示器"(笔者使用此法未成功，使用的是2.2)找到你自己的pytorch位置笔者如图可以看到解释器
Pytorch学习01_加载数据初认识写点什么呢 pytorch 学习人工智能 python pycharm pip ipython
一.Dataset新建py文件fromtorch.utils.dataimportDataset可以按住”Ctrl“,鼠标左键点击Dataset，可以打开Dataset的定义及其内部函数二.编写引用cv2模块终端运行pipinstallopencv-python然后就可以引用cv2模块importcv2引用ImagefromPILimportImage数据集链接https://pan.baidu.
Pytorch学习02_TensorBoard使用01 写点什么呢学习记录 pytorch 学习人工智能 python pycharm
更换编辑器找到自己的Anaconda安装路径下envs\pytorch01中的oython.exe，pytorch01是笔者自己创建的pytorch环境名选择好后，点击确定点击“应用”，再点击“确定”在pytorch环境下安装tensorboardpipinstallpytorch安装结束writer.add_scalar("y=x",i,i)运行如下内容fromtorch.utils.tenso
Pytorch学习03_TensorBoard使用02 写点什么呢学习记录 pytorch 学习人工智能 pycharm python
Opencv读取图片，获得numpy型数据类型复制图片的相对路径目前这种type不适用，考虑用numpy类型安装opencv，在pytorch环境下pipinstallopencv-python导入numpyimportnumpyasnp将PIL类型的img转换为NumPy数组img_array=np.array(img)HWC三通道H：高度W：宽度C：通道fromtorch.utils.tens
【pytorch学习】关于torch.nn.MaxPool2d和torch.nn.functional.max_pool2d 你好，我老婆不吃香菜 pytorch 深度学习
两者之间的区别与联系首先给出结论，torch.nn.MaxPool2d和torch.nn.functional.max_pool2d两者本质上是一样的。具体可以参考torch.nn.MaxPool2d的源代码，核心源代码如下所示：from..importfunctionalasFclassMaxPool2d(_MaxPoolNd):kernel_size:_size_2_tstride:_size
Pytorch学习记录-GEC语法纠错我的昵称违规了
Pytorch学习记录-GEC语法纠错01五月第一周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的，国内这块做的真的不行啊……学习计划GEC概念AlibabaatIJCNLP-2017Task1:EmbeddingGrammaticalFeaturesintoL
PyTorch（超详细）部署与激活举起Python火炬，点亮智慧人生【Windows版】心安成长 PyTorch python pytorch windows
AI时代，我们不仅要学习Python，同时机器学习，深度学习利器也要逐步掌握，再次开始Pytorch学习教程记录。PyTorch是一个流行的开源深度学习框架，它可以用于构建、训练和部署各种机器学习和深度学习模型。PyTorch可以用于以下领域：计算机视觉：图像分类、目标检测、图像分割、人脸识别等。自然语言处理：机器翻译、文本分类、情感分析、问答系统等。语音处理：语音识别、语音合成、说话人识别等。生
Pytorch学习记录-卷积Seq2Seq（模型训练）我的昵称违规了
Pytorch学习记录-torchtext和Pytorch的实例50.PyTorchSeq2Seq项目介绍在完成基本的torchtext之后，找到了这个教程，《基于Pytorch和torchtext来理解和实现seq2seq模型》。这个项目主要包括了6个子项目使用神经网络训练Seq2Seq使用RNNencoder-decoder训练短语表示用于统计机器翻译使用共同学习完成NMT的堆砌和翻译打包填充
Python-Pytorch学习记录 yt_0618 学习
目录1.python-pycharm下载安装2.VSCode下载安装3.MATLAB下载安装4.pytorch一条龙下载安装环境配置1.python-pycharm下载安装pycharm从安装到全副武装，学起来才嗖嗖的快，图片超多，因为过度详细！_pycharm下载和环境配置-CSDN博客https://chuanchuan.blog.csdn.net/article/details/119934
pytorch学习笔记（2）--Tensor ToToBe pytorch 笔记 1024程序员节
系列文章pytorch学习笔记（1）–QUICKSTARTpytorch学习笔记（2）–Tensorpytorch学习笔记（3）–数据集与数据导入pytorch学习笔记（4）–创建模型(BuildModel)pytorch学习笔记（5）–Autograd文章目录系列文章Tensor（张量）1.初始化张量2.张量的属性3.张量的操作1.类似numpy的索引和切片2.拼接3.算数操作4.单元素张量5.
PyTorch学习笔记（三）：softmax回归 FriendshipT PyTorch学习笔记 pytorch 回归深度学习 softmax
PyTorch学习笔记（三）：softmax回归softmax回归分类问题softmax回归模型单样本分类的矢量计算表达式小批量样本分类的矢量计算表达式交叉熵损失函数模型预测及评价小结Torchvision获取数据集读取小批量PyTorch从零开始实现softmax获取和读取数据初始化模型参数实现softmax运算定义模型定义损失函数定义优化算法计算分类准确率训练模型预测小结PyTorch模块实现
PyTorch学习：加载模型和参数 TravelingLight77 DL Pytorch pytorch 深度学习神经网络
1.直接加载模型和参数加载别人训练好的模型：#保存和加载整个模型torch.save(model_object,'resnet.pth')model=torch.load('resnet.pth')2.分别加载网络的结构和参数#将my_resnet模型储存为my_resnet.pthtorch.save(my_resnet.state_dict(),"my_resnet.pth")#加载resne
PyTorch学习笔记1 zt_d918
训练过程importtorch#batch_size,input_dimension,hidden_dimension,output_dimensionN,D_in,H,D_out=64,1000,100,10#模拟一个训练集x=torch.randn(N,D_in)y=torch.randn(N,D_out)#模型定义有多种方式，这里不提model#loss函数定义loss_fn=torch.n
第二十九周：文献阅读笔记（ResMLP）+ pytorch学习（Resnet代码实现） @默然笔记 pytorch 学习人工智能 python 深度学习机器学习
第二十九周：文献阅读笔记（ResMLP）摘要Abstract1.ResMLP1.1文献摘要1.2文献引言1.3ResMLP方法1.3.1整体流程1.3.2残差多感知机层1.4实验1.4.1数据集1.4.2超参数设置1.4.3主要结果1.4.4监督设置1.4.5自监督设置1.4.5知识蒸馏设置1.5ResMLP的创新点2.pytorch学习（ResNet代码实现）2.1数据集2.2文件结构2.3下载
第二十八周：文献阅读笔记（弱监督学习）+ pytorch学习 @默然笔记学习 pytorch 深度学习人工智能 python
第二十八周：文献阅读笔记（弱监督学习）摘要Abstract1.弱监督学习1.1.文献摘要1.2.引言1.3.不完全监督1.3.1.主动学习与半监督学习1.3.2.通过人工干预1.3.3.无需人工干预1.4.不确切的监督1.5.不准确的监督1.6.弱监督学习的创新点2.pytorch学习2.1.对现有模型进行修改2.2.优化器的使用2.3.完整的模型训练套路总结摘要弱监督学习是一种机器学习方法，其训
第二十九周：文献阅读笔记（DenseNet）+ pytorch学习 @默然笔记 pytorch 学习
第二十九周：文献阅读笔记（DenseNet）+pytorch学习摘要Abstract1、DenseNet文献阅读1.1文献摘要1.2文献引言1.3DenseNets网络1.3.1残差网络1.3.2密集连接1.3.3实施细节1.4实验1.4.1数据集1.4.1.1CIFAR1.4.1.2SVHN1.4.2模型训练1.4.3CIFAR和SVHN的分类结果1.4.4ImageNet上的分类结果1.5总结
Pytorch学习记录-Pytorch可视化使用tensorboardX 我的昵称违规了
Pytorch学习记录-Pytorch可视化使用tensorboardX在很早很早以前（至少一个半月），我做过几节关于tensorboard的学习记录。https://www.jianshu.com/p/23205a7921cdhttps://www.jianshu.com/p/6235c1ecde67https://www.jianshu.com/p/2b24454b0629https://ww
PyTorch学习---2.自动求梯度与世无争小菜鸡
自动求梯度首先给大家介绍几个基本概念：方向导数：是一个数；反映的是f(x,y)在P0点沿方向v的变化率。偏导数：是多个数（每元有一个）；是指多元函数沿坐标轴方向的方向导数，因此二元函数就有两个偏导数。偏导函数：是一个函数；是一个关于点的偏导数的函数。梯度：是一个向量；每个元素为函数对一元变量的偏导数；它既有大小（其大小为最大方向导数），也有方向。摘自《方向导数与梯度》梯度从本质上来说也是导数的一种
pytorch学习路径诗人藏夜里
微信公众号：诗人藏夜里参考了黄海广老师的[pytorch快速入门资料](https://zhuanlan.zhihu.com/p/87263048)，并结合自身从0到1的学习经历，写下此pytorch入门路径本路径适合人群：深度学习初学者，深度学习框架初学者**欢迎拥抱最美DL框架**#1.[莫烦pytorch系列教程](https://morvanzhou.github.io/tutorials
小土堆pytorch学习笔记004 柠檬不萌只是酸i 深度学习 pytorch 学习笔记机器学习深度学习
目录1、神经网络的基本骨架-nn.Module的使用2、卷积操作实例3、神经网络-卷积层4、神经网络-最大池化的使用（1）最大池化画图理解：（2）代码实现：5、神经网络-非线性激活（1）代码实现（调用sigmoid函数）6、神经网络-线性层（1）代码7、网络搭建-小实战（1）完整代码1、神经网络的基本骨架-nn.Module的使用官网地址：pytorch里的nnimporttorchfromtor
小土堆pytorch学习笔记003 | 下载数据集dataset 及报错处理柠檬不萌只是酸i 深度学习人工智能深度学习机器学习 pytorch python
目录1、下载数据集2、展示数据集里面的内容3、DataLoader的使用例子：结果展示：1、下载数据集#数据集importtorchvisiontrain_set=torchvision.datasets.CIFAR10(root="./test10_dataset",train=True,download=True)test_set=torchvision.datasets.CIFAR10(ro
小土堆pytorch学习笔记005 | 完结，✿✿ヽ(°▽°)ノ✿ 柠檬不萌只是酸i 深度学习学习笔记 pytorch 机器学习深度学习
目录1、损失函数与反向传播2、如何在搭建的网络中使用损失函数呢？3、优化器4、现有网络模型的使用及修改例子：5、模型训练保存+读取（1）保存（2）读取6、完整的模型训练：（1）代码【model文件】：【主文件】：（2）运行截图：（3）绘图展示：（4）添加训练正确率的完整代码：（5）总结！！！：（6）使用GPU训练7、完整模型验证（1）代码（2）运行结果1、损失函数与反向传播①计算实际输出和目标之间
小土堆pytorch学习笔记002 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
目录1、TensorBoard的使用（1）显示坐标：（2）显示图片：2、Transform的使用3、常见的Transforms（1）#ToTensor()（2）#Normalize()（3）#Resize()（4）#Compose()4、总结：1、TensorBoard的使用（1）显示坐标：fromtorch.utils.tensorboardimportSummaryWriterimportnu
【pytorch】pytorch学习笔记（续2）小白冲鸭 pytorch 学习笔记
p30：1.均方差（MeanSquaredError,MSE）：（1）注意区分MSE和L2范数：L2范数要开根号，而MSE不需要开根号。用torch.norm函数求MSE的时候不要忘记加上pow(2)。求导：pytorch实现自动求导：第一种方法：torch.autograd.grad()设置w需要求导有两种方法：（1）在创建w之后，用来设置w需要求导。（2）在创建w的时候，用w=torch.te
【pytorch】pytorch学习笔记（续1）小白冲鸭 pytorch 学习笔记
p22：1.加减乘除：（1）add(a,b)：等同于a+b。（2）sub(a,b)：等同于a-b。（3）mul(a,b)：等同于a*b。（4）div(a,b)：等同于a/b。a//b表示整除。2.tensor的矩阵式相乘：matmul注意区分：（1）*：表示相同位置的元素相乘；（2）.matmul：表示矩阵相乘。对于（2）矩阵的相乘，有三种方式：(1)torch.mm:只适用于二维的tensor，
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

PyTorch入门（六）：通过例子学习PyTorch

你可能感兴趣的:(PyTorch学习)