genous110

PyTorch学习系列(九)——参数_初始化

本文转自如下：
https://www.cnblogs.com/lindaxin/p/8037561.html
https://blog.csdn.net/qq_19598705/article/details/80396047
之前我学习了神经网络中权值初始化的方法

那么如何在pytorch里实现呢。

PyTorch提供了多种参数初始化函数：

torch.nn.init.constant(tensor, val)
torch.nn.init.normal(tensor, mean=0, std=1)
torch.nn.init.xavier_uniform(tensor, gain=1)
等等。详细请参考：http://pytorch.org/docs/nn.html#torch-nn-init
注意上面的初始化函数的参数tensor，虽然写的是tensor，但是也可以是Variable类型的。而神经网络的参数类型Parameter是Variable类的子类，所以初始化函数可以直接作用于神经网络参数。

示例：

self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3)
init.xavier_uniform(self.conv1.weight)
init.constant(self.conv1.bias, 0.1)

上面的语句是对网络的某一层参数进行初始化。如何对整个网络的参数进行初始化定制呢？

def weights_init(m):
classname=m.class.name
if classname.find(‘Conv’) != -1:
xavier(m.weight.data)
xavier(m.bias.data)
net = Net()
net.apply(weights_init) #apply函数会递归地搜索网络内的所有module并把参数表示的函数应用到所有的module上。
不建议访问以下划线为前缀的成员，他们是内部的，如果有改变不会通知用户。更推荐的一种方法是检查某个module是否是某种类型：

def weights_init(m):
if isinstance(m, nn.Conv2d):
xavier(m.weight.data)
xavier(m.bias.data)

转载这个网址的
https://blog.csdn.net/qq_19598705/article/details/80396047
本文发现pytorch使用，必须对权重初始化，否则损失无法收敛。

在使用大多如下使用：

def weights_init(m):
classname = m.class.name
# print(classname)
if classname.find(‘Conv3d’) != -1:
init.xavier_normal_(m.weight.data)
init.constant_(m.bias.data, 0.0)
elif classname.find(‘Linear’) != -1:
init.xavier_normal_(m.weight.data)
init.constant_(m.bias.data, 0.0)

model = C3D()
model.apply(weights_init)
1
2
torch.nn.init有如下几种（0.4版本，目前最新）：

torch.nn.init.calculate_gain(nonlinearity, param=None)

gain = nn.init.calculate_gain(‘leaky_relu’)
1
torch.nn.init.uniform_(tensor, a=0, b=1)

w = torch.empty(3, 5)
nn.init.uniform_(w)
1
2
torch.nn.init.normal_(tensor, mean=0, std=1)

w = torch.empty(3, 5)
nn.init.normal_(w)
1
2
torch.nn.init.constant_(tensor, val)

torch.empty(3, 5)
nn.init.constant_(w, 0.3)
1
2
torch.nn.init.eye_(tensor)

w = torch.empty(3, 5)
nn.init.eye_(w)
1
2
torch.nn.init.dirac_(tensor)

w = torch.empty(3, 16, 5, 5)
nn.init.dirac_(w)
1
2
torch.nn.init.xavier_uniform_(tensor,gain=1)

w = torch.empty(3, 5)
nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain(‘relu’))
1
2
torch.nn.init.xavier_normal_(tensor, gain=1)

w = torch.empty(3, 5)
nn.init.xavier_normal_(w)
1
2
torch.nn.init.kaiming_uniform_(tensor, a=0, mode=’fan_in’, nonlinearity=’leaky_relu’)

w = torch.empty(3, 5)
nn.init.kaiming_uniform_(w, mode=‘fan_in’, nonlinearity=‘relu’)
1
2
torch.nn.init.kaiming_normal_(tensor, a=0, mode=’fan_in’, nonlinearity=’leaky_relu’)

w = torch.empty(3, 5)
nn.init.kaiming_normal_(w, mode=‘fan_out’, nonlinearity=‘relu’)
1
2
torch.nn.init.orthogonal_(tensor, gain=1)

w = torch.empty(3, 5)
nn.init.orthogonal_(w)
1
2
torch.nn.init.sparse_(tensor, sparsity, std=0.01)

w = torch.empty(3, 5)
nn.init.sparse_(w, sparsity=0.1)

以下来自
https://blog.csdn.net/hyk_1996/article/details/82118797
卷积神经网络的权值初始化方法
2018年08月28日 14:07:56 hyk_1996 阅读数：974
本文以CNN的三个主要构成部件——卷积层、BN层、全连接层为切入点，分别介绍其初始化方法。

卷积层
高斯初始化

从均值为0，方差为1的高斯分布中采样，作为初始权值。PyTorch中的相关函数如下：

torch.nn.init.normal_(tensor, mean=0, std=1)
1
kaiming高斯初始化

由FAIR的大牛Kaiming He提出来的卷积层权值初始化方法，目的是使得每一卷积层的输出的方差都为1，具体数学推导可以参考论文[1]. 权值的初始化方法如下：

Wl~N(0,2(1+a2)×nl−−−−−−−−−−−√)
Wl~N(0,2(1+a2)×nl)
其中，a为Relu或Leaky Relu的负半轴斜率，nlnl为输入的维数，即nl=卷积核边长2×channel数nl=卷积核边长2×channel数。
在PyTorch中，相关函数如下：

torch.nn.init.kaiming_normal_(tensor, a=0, mode=‘fan_in’, nonlinearity=‘leaky_relu’)
1
上述输入参数中，tensor是torch.Tensor变量，a为Relu函数的负半轴斜率，mode表示是让前向传播还是反向传播的输出的方差为1，nonlinearity可以选择是relu还是leaky_relu.

xavier高斯初始化

Glorot正态分布初始化方法，也称作Xavier正态分布初始化，参数由0均值，标准差为sqrt(2 / (fan_in + fan_out))的正态分布产生，其中fan_in和fan_out是分别权值张量的输入和输出元素数目. 这种初始化同样是为了保证输入输出的方差不变，但是原论文中([2])是基于线性函数推导的，同时在tanh激活函数上有很好的效果，但不适用于ReLU激活函数。

std=gain×2fan_in+fan_out−−−−−−−−−−−−−−√
std=gain×2fan_in+fan_out

在PyTorch中，相关函数如下：
torch.nn.init.xavier_normal_(tensor, gain=1)
1

BatchNorm层
回顾
BatchNorm

初始化

对于scale因子γγ，初始化为1；对于shift因子ββ，初始化为0.

全连接层
对于全连接层，除了可以使用卷积层的基于高斯分布的初始方法外，也有使用均匀分布（uniform distribution）的初始化方法，或者直接设置为常量（constant）。

还有其它这里没有细讲的初始化方法，包括：
Orthogonal：用随机正交矩阵初始化。
sparse：用稀疏矩阵初始化。
TruncatedNormal：截尾高斯分布，类似于高斯分布，位于均值两个标准差以外的数据将会被丢弃并重新生成，形成截尾分布。PyTorch中似乎没有相关实现。

参考
[1] Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification — He, K. et al. (2015)
[2] Understanding the difficulty of training deep feedforward neural networks — Glorot, X. & Bengio, Y. (2010)

来自如下的一个初始化例子
https://github.com/prlz77/ResNeXt.pytorch/blob/master/models/model.py

-- coding: utf-8 --

from future import division

“”"
Creates a ResNeXt Model as defined in:
Xie, S., Girshick, R., Dollár, P., Tu, Z., & He, K. (2016).
Aggregated residual transformations for deep neural networks.
arXiv preprint arXiv:1611.05431.
“”"

author = “Pau Rodríguez López, ISELAB, CVC-UAB”
email = "[email protected]"

import torch.nn as nn
import torch.nn.functional as F
from torch.nn import init

class ResNeXtBottleneck(nn.Module):
“”"
RexNeXt bottleneck type C (https://github.com/facebookresearch/ResNeXt/blob/master/models/resnext.lua)
“”"

def __init__(self, in_channels, out_channels, stride, cardinality, base_width, widen_factor):
    """ Constructor
    Args:
        in_channels: input channel dimensionality
        out_channels: output channel dimensionality
        stride: conv stride. Replaces pooling layer.
        cardinality: num of convolution groups.
        base_width: base number of channels in each group.
        widen_factor: factor to reduce the input dimensionality before convolution.
    """
    super(ResNeXtBottleneck, self).__init__()
    width_ratio = out_channels / (widen_factor * 64.)
    D = cardinality * int(base_width * width_ratio)
    self.conv_reduce = nn.Conv2d(in_channels, D, kernel_size=1, stride=1, padding=0, bias=False)
    self.bn_reduce = nn.BatchNorm2d(D)
    self.conv_conv = nn.Conv2d(D, D, kernel_size=3, stride=stride, padding=1, groups=cardinality, bias=False)
    self.bn = nn.BatchNorm2d(D)
    self.conv_expand = nn.Conv2d(D, out_channels, kernel_size=1, stride=1, padding=0, bias=False)
    self.bn_expand = nn.BatchNorm2d(out_channels)

    self.shortcut = nn.Sequential()
    if in_channels != out_channels:
        self.shortcut.add_module('shortcut_conv',
                                 nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, padding=0,
                                           bias=False))
        self.shortcut.add_module('shortcut_bn', nn.BatchNorm2d(out_channels))

def forward(self, x):
    bottleneck = self.conv_reduce.forward(x)
    bottleneck = F.relu(self.bn_reduce.forward(bottleneck), inplace=True)
    bottleneck = self.conv_conv.forward(bottleneck)
    bottleneck = F.relu(self.bn.forward(bottleneck), inplace=True)
    bottleneck = self.conv_expand.forward(bottleneck)
    bottleneck = self.bn_expand.forward(bottleneck)
    residual = self.shortcut.forward(x)
    return F.relu(residual + bottleneck, inplace=True)

class CifarResNeXt(nn.Module):
“”"
ResNext optimized for the Cifar dataset, as specified in
https://arxiv.org/pdf/1611.05431.pdf
“”"

def __init__(self, cardinality, depth, nlabels, base_width, widen_factor=4):
    """ Constructor
    Args:
        cardinality: number of convolution groups.
        depth: number of layers.
        nlabels: number of classes
        base_width: base number of channels in each group.
        widen_factor: factor to adjust the channel dimensionality
    """
    super(CifarResNeXt, self).__init__()
    self.cardinality = cardinality
    self.depth = depth
    self.block_depth = (self.depth - 2) // 9
    self.base_width = base_width
    self.widen_factor = widen_factor
    self.nlabels = nlabels
    self.output_size = 64
    self.stages = [64, 64 * self.widen_factor, 128 * self.widen_factor, 256 * self.widen_factor]

    self.conv_1_3x3 = nn.Conv2d(3, 64, 3, 1, 1, bias=False)
    self.bn_1 = nn.BatchNorm2d(64)
    self.stage_1 = self.block('stage_1', self.stages[0], self.stages[1], 1)
    self.stage_2 = self.block('stage_2', self.stages[1], self.stages[2], 2)
    self.stage_3 = self.block('stage_3', self.stages[2], self.stages[3], 2)
    self.classifier = nn.Linear(self.stages[3], nlabels)
    init.kaiming_normal(self.classifier.weight)

    for key in self.state_dict():
        if key.split('.')[-1] == 'weight':
            if 'conv' in key:
                init.kaiming_normal(self.state_dict()[key], mode='fan_out')
            if 'bn' in key:
                self.state_dict()[key][...] = 1
        elif key.split('.')[-1] == 'bias':
            self.state_dict()[key][...] = 0

def block(self, name, in_channels, out_channels, pool_stride=2):
    """ Stack n bottleneck modules where n is inferred from the depth of the network.
    Args:
        name: string name of the current block.
        in_channels: number of input channels
        out_channels: number of output channels
        pool_stride: factor to reduce the spatial dimensionality in the first bottleneck of the block.
    Returns: a Module consisting of n sequential bottlenecks.
    """
    block = nn.Sequential()
    for bottleneck in range(self.block_depth):
        name_ = '%s_bottleneck_%d' % (name, bottleneck)
        if bottleneck == 0:
            block.add_module(name_, ResNeXtBottleneck(in_channels, out_channels, pool_stride, self.cardinality,
                                                      self.base_width, self.widen_factor))
        else:
            block.add_module(name_,
                             ResNeXtBottleneck(out_channels, out_channels, 1, self.cardinality, self.base_width,
                                               self.widen_factor))
    return block

def forward(self, x):
    x = self.conv_1_3x3.forward(x)
    x = F.relu(self.bn_1.forward(x), inplace=True)
    x = self.stage_1.forward(x)
    x = self.stage_2.forward(x)
    x = self.stage_3.forward(x)
    x = F.avg_pool2d(x, 8, 1)
    x = x.view(-1, self.stages[3])
    return self.classifier(x)

PyTorch学习（13）：PyTorch的张量相乘（torch.matmul）赛先生.AI PyTorch pytorch
PyTorch学习（1）：torch.meshgrid的使用-CSDN博客PyTorch学习（2）：torch.device-CSDN博客PyTorch学习（9）：torch.topk-CSDN博客PyTorch学习（10）：torch.where-CSDN博客PyTorch学习（11）：PyTorch的形状变换(view,reshape)与维度变换(transpose,permute)-CSDN
PyTorch实现CIFAR-10分类代码曹勖之 PyTorch学习之路深度学习 pytorch
这篇是PyTorch学习之路第七篇，用于记录PyTorch实现CIFAR-10分类代码（书上的代码有好多冗余）目录完整代码（还未训练）完整代码（已训练，直接载入模型）下面实例数据集位于：C:\Users\22130\Learning_Pytorch\dataset完整代码（还未训练）importtorchimporttorchvisionimporttorchvision.transformsas
PyTorch学习笔记之基础函数篇（四）熊猫Devin 深度学习之PyTorch pytorch 学习笔记
文章目录2.8torch.logspace函数讲解2.9torch.ones函数2.10torch.rand函数2.11torch.randn函数2.12torch.zeros函数2.8torch.logspace函数讲解torch.logspace函数在PyTorch中用于生成一个在对数尺度上均匀分布的张量（tensor）。这意味着张量中的元素是按照对数间隔排列的，而不是线性间隔。这对于创建在数
深入浅出PyTorch学习网址今天是学习的一天人工智能
https://datawhalechina.github.io/thorough-pytorch/
Pytorch学习记录-接近人类水平的GEC（使用混合机器翻译模型）我的昵称违规了
五月第二周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的8.NearHuman-LevelPerformanceinGrammaticalErrorCorrectionwithHybridMachineTranslation昨天一天没看论文，发现我文献阅读速度太
Pytorch学习准备_Pycharm及Jupyter使用写点什么呢学习记录 pytorch 学习人工智能 python pycharm
已经创建环境pytorch01，可参考http://t.csdnimg.cn/KwJvh一.pytorch环境查看打开AnacondaPrompt进入pytorch01环境condaactivatepytorch01列出这个环境下的工具包piplist二.Pycharm打开，创建新项目2.1选择“现有指示器"(笔者使用此法未成功，使用的是2.2)找到你自己的pytorch位置笔者如图可以看到解释器
Pytorch学习01_加载数据初认识写点什么呢 pytorch 学习人工智能 python pycharm pip ipython
一.Dataset新建py文件fromtorch.utils.dataimportDataset可以按住”Ctrl“,鼠标左键点击Dataset，可以打开Dataset的定义及其内部函数二.编写引用cv2模块终端运行pipinstallopencv-python然后就可以引用cv2模块importcv2引用ImagefromPILimportImage数据集链接https://pan.baidu.
Pytorch学习02_TensorBoard使用01 写点什么呢学习记录 pytorch 学习人工智能 python pycharm
更换编辑器找到自己的Anaconda安装路径下envs\pytorch01中的oython.exe，pytorch01是笔者自己创建的pytorch环境名选择好后，点击确定点击“应用”，再点击“确定”在pytorch环境下安装tensorboardpipinstallpytorch安装结束writer.add_scalar("y=x",i,i)运行如下内容fromtorch.utils.tenso
Pytorch学习03_TensorBoard使用02 写点什么呢学习记录 pytorch 学习人工智能 pycharm python
Opencv读取图片，获得numpy型数据类型复制图片的相对路径目前这种type不适用，考虑用numpy类型安装opencv，在pytorch环境下pipinstallopencv-python导入numpyimportnumpyasnp将PIL类型的img转换为NumPy数组img_array=np.array(img)HWC三通道H：高度W：宽度C：通道fromtorch.utils.tens
【pytorch学习】关于torch.nn.MaxPool2d和torch.nn.functional.max_pool2d 你好，我老婆不吃香菜 pytorch 深度学习
两者之间的区别与联系首先给出结论，torch.nn.MaxPool2d和torch.nn.functional.max_pool2d两者本质上是一样的。具体可以参考torch.nn.MaxPool2d的源代码，核心源代码如下所示：from..importfunctionalasFclassMaxPool2d(_MaxPoolNd):kernel_size:_size_2_tstride:_size
Pytorch学习记录-GEC语法纠错我的昵称违规了
Pytorch学习记录-GEC语法纠错01五月第一周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的，国内这块做的真的不行啊……学习计划GEC概念AlibabaatIJCNLP-2017Task1:EmbeddingGrammaticalFeaturesintoL
PyTorch（超详细）部署与激活举起Python火炬，点亮智慧人生【Windows版】心安成长 PyTorch python pytorch windows
AI时代，我们不仅要学习Python，同时机器学习，深度学习利器也要逐步掌握，再次开始Pytorch学习教程记录。PyTorch是一个流行的开源深度学习框架，它可以用于构建、训练和部署各种机器学习和深度学习模型。PyTorch可以用于以下领域：计算机视觉：图像分类、目标检测、图像分割、人脸识别等。自然语言处理：机器翻译、文本分类、情感分析、问答系统等。语音处理：语音识别、语音合成、说话人识别等。生
Pytorch学习记录-卷积Seq2Seq（模型训练）我的昵称违规了
Pytorch学习记录-torchtext和Pytorch的实例50.PyTorchSeq2Seq项目介绍在完成基本的torchtext之后，找到了这个教程，《基于Pytorch和torchtext来理解和实现seq2seq模型》。这个项目主要包括了6个子项目使用神经网络训练Seq2Seq使用RNNencoder-decoder训练短语表示用于统计机器翻译使用共同学习完成NMT的堆砌和翻译打包填充
Python-Pytorch学习记录 yt_0618 学习
目录1.python-pycharm下载安装2.VSCode下载安装3.MATLAB下载安装4.pytorch一条龙下载安装环境配置1.python-pycharm下载安装pycharm从安装到全副武装，学起来才嗖嗖的快，图片超多，因为过度详细！_pycharm下载和环境配置-CSDN博客https://chuanchuan.blog.csdn.net/article/details/119934
pytorch学习笔记（2）--Tensor ToToBe pytorch 笔记 1024程序员节
系列文章pytorch学习笔记（1）–QUICKSTARTpytorch学习笔记（2）–Tensorpytorch学习笔记（3）–数据集与数据导入pytorch学习笔记（4）–创建模型(BuildModel)pytorch学习笔记（5）–Autograd文章目录系列文章Tensor（张量）1.初始化张量2.张量的属性3.张量的操作1.类似numpy的索引和切片2.拼接3.算数操作4.单元素张量5.
PyTorch学习笔记（三）：softmax回归 FriendshipT PyTorch学习笔记 pytorch 回归深度学习 softmax
PyTorch学习笔记（三）：softmax回归softmax回归分类问题softmax回归模型单样本分类的矢量计算表达式小批量样本分类的矢量计算表达式交叉熵损失函数模型预测及评价小结Torchvision获取数据集读取小批量PyTorch从零开始实现softmax获取和读取数据初始化模型参数实现softmax运算定义模型定义损失函数定义优化算法计算分类准确率训练模型预测小结PyTorch模块实现
PyTorch学习：加载模型和参数 TravelingLight77 DL Pytorch pytorch 深度学习神经网络
1.直接加载模型和参数加载别人训练好的模型：#保存和加载整个模型torch.save(model_object,'resnet.pth')model=torch.load('resnet.pth')2.分别加载网络的结构和参数#将my_resnet模型储存为my_resnet.pthtorch.save(my_resnet.state_dict(),"my_resnet.pth")#加载resne
PyTorch学习笔记1 zt_d918
训练过程importtorch#batch_size,input_dimension,hidden_dimension,output_dimensionN,D_in,H,D_out=64,1000,100,10#模拟一个训练集x=torch.randn(N,D_in)y=torch.randn(N,D_out)#模型定义有多种方式，这里不提model#loss函数定义loss_fn=torch.n
第二十九周：文献阅读笔记（ResMLP）+ pytorch学习（Resnet代码实现） @默然笔记 pytorch 学习人工智能 python 深度学习机器学习
第二十九周：文献阅读笔记（ResMLP）摘要Abstract1.ResMLP1.1文献摘要1.2文献引言1.3ResMLP方法1.3.1整体流程1.3.2残差多感知机层1.4实验1.4.1数据集1.4.2超参数设置1.4.3主要结果1.4.4监督设置1.4.5自监督设置1.4.5知识蒸馏设置1.5ResMLP的创新点2.pytorch学习（ResNet代码实现）2.1数据集2.2文件结构2.3下载
第二十八周：文献阅读笔记（弱监督学习）+ pytorch学习 @默然笔记学习 pytorch 深度学习人工智能 python
第二十八周：文献阅读笔记（弱监督学习）摘要Abstract1.弱监督学习1.1.文献摘要1.2.引言1.3.不完全监督1.3.1.主动学习与半监督学习1.3.2.通过人工干预1.3.3.无需人工干预1.4.不确切的监督1.5.不准确的监督1.6.弱监督学习的创新点2.pytorch学习2.1.对现有模型进行修改2.2.优化器的使用2.3.完整的模型训练套路总结摘要弱监督学习是一种机器学习方法，其训
第二十九周：文献阅读笔记（DenseNet）+ pytorch学习 @默然笔记 pytorch 学习
第二十九周：文献阅读笔记（DenseNet）+pytorch学习摘要Abstract1、DenseNet文献阅读1.1文献摘要1.2文献引言1.3DenseNets网络1.3.1残差网络1.3.2密集连接1.3.3实施细节1.4实验1.4.1数据集1.4.1.1CIFAR1.4.1.2SVHN1.4.2模型训练1.4.3CIFAR和SVHN的分类结果1.4.4ImageNet上的分类结果1.5总结
Pytorch学习记录-Pytorch可视化使用tensorboardX 我的昵称违规了
Pytorch学习记录-Pytorch可视化使用tensorboardX在很早很早以前（至少一个半月），我做过几节关于tensorboard的学习记录。https://www.jianshu.com/p/23205a7921cdhttps://www.jianshu.com/p/6235c1ecde67https://www.jianshu.com/p/2b24454b0629https://ww
PyTorch学习---2.自动求梯度与世无争小菜鸡
自动求梯度首先给大家介绍几个基本概念：方向导数：是一个数；反映的是f(x,y)在P0点沿方向v的变化率。偏导数：是多个数（每元有一个）；是指多元函数沿坐标轴方向的方向导数，因此二元函数就有两个偏导数。偏导函数：是一个函数；是一个关于点的偏导数的函数。梯度：是一个向量；每个元素为函数对一元变量的偏导数；它既有大小（其大小为最大方向导数），也有方向。摘自《方向导数与梯度》梯度从本质上来说也是导数的一种
pytorch学习路径诗人藏夜里
微信公众号：诗人藏夜里参考了黄海广老师的[pytorch快速入门资料](https://zhuanlan.zhihu.com/p/87263048)，并结合自身从0到1的学习经历，写下此pytorch入门路径本路径适合人群：深度学习初学者，深度学习框架初学者**欢迎拥抱最美DL框架**#1.[莫烦pytorch系列教程](https://morvanzhou.github.io/tutorials
小土堆pytorch学习笔记004 柠檬不萌只是酸i 深度学习 pytorch 学习笔记机器学习深度学习
目录1、神经网络的基本骨架-nn.Module的使用2、卷积操作实例3、神经网络-卷积层4、神经网络-最大池化的使用（1）最大池化画图理解：（2）代码实现：5、神经网络-非线性激活（1）代码实现（调用sigmoid函数）6、神经网络-线性层（1）代码7、网络搭建-小实战（1）完整代码1、神经网络的基本骨架-nn.Module的使用官网地址：pytorch里的nnimporttorchfromtor
小土堆pytorch学习笔记003 | 下载数据集dataset 及报错处理柠檬不萌只是酸i 深度学习人工智能深度学习机器学习 pytorch python
目录1、下载数据集2、展示数据集里面的内容3、DataLoader的使用例子：结果展示：1、下载数据集#数据集importtorchvisiontrain_set=torchvision.datasets.CIFAR10(root="./test10_dataset",train=True,download=True)test_set=torchvision.datasets.CIFAR10(ro
小土堆pytorch学习笔记005 | 完结，✿✿ヽ(°▽°)ノ✿ 柠檬不萌只是酸i 深度学习学习笔记 pytorch 机器学习深度学习
目录1、损失函数与反向传播2、如何在搭建的网络中使用损失函数呢？3、优化器4、现有网络模型的使用及修改例子：5、模型训练保存+读取（1）保存（2）读取6、完整的模型训练：（1）代码【model文件】：【主文件】：（2）运行截图：（3）绘图展示：（4）添加训练正确率的完整代码：（5）总结！！！：（6）使用GPU训练7、完整模型验证（1）代码（2）运行结果1、损失函数与反向传播①计算实际输出和目标之间
小土堆pytorch学习笔记002 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
目录1、TensorBoard的使用（1）显示坐标：（2）显示图片：2、Transform的使用3、常见的Transforms（1）#ToTensor()（2）#Normalize()（3）#Resize()（4）#Compose()4、总结：1、TensorBoard的使用（1）显示坐标：fromtorch.utils.tensorboardimportSummaryWriterimportnu
【pytorch】pytorch学习笔记（续2）小白冲鸭 pytorch 学习笔记
p30：1.均方差（MeanSquaredError,MSE）：（1）注意区分MSE和L2范数：L2范数要开根号，而MSE不需要开根号。用torch.norm函数求MSE的时候不要忘记加上pow(2)。求导：pytorch实现自动求导：第一种方法：torch.autograd.grad()设置w需要求导有两种方法：（1）在创建w之后，用来设置w需要求导。（2）在创建w的时候，用w=torch.te
【pytorch】pytorch学习笔记（续1）小白冲鸭 pytorch 学习笔记
p22：1.加减乘除：（1）add(a,b)：等同于a+b。（2）sub(a,b)：等同于a-b。（3）mul(a,b)：等同于a*b。（4）div(a,b)：等同于a/b。a//b表示整除。2.tensor的矩阵式相乘：matmul注意区分：（1）*：表示相同位置的元素相乘；（2）.matmul：表示矩阵相乘。对于（2）矩阵的相乘，有三种方式：(1)torch.mm:只适用于二维的tensor，
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

PyTorch学习系列(九)——参数_初始化

-- coding: utf-8 --

你可能感兴趣的:(Pytorch学习)