爱吃骨头的猫、

动手学深度学习(PyTorch实现)(十二)--批量归一化（BatchNormalization）

批量归一化-BatchNormalization

1. 前言
2. 批量归一化的优势
3. BN算法介绍
4. PyTorch实现

4.1 导入相应的包
4.2 定义BN函数
4.3 定义BN类

5. 基于LeNet的应用

5.1 定义LeNet
5.2 加载数据
5.3 训练网络

1. 前言

本博文理论部分摘自CSDN博主「Paulzhao6518」的文章《（BN）批量归一化全面解析》。

先来思考一个问题：我们知道在神经网络训练开始前，都要对输入数据做一个归一化处理，那么具体为什么需要归一化呢？归一化后有什么好处呢？原因在于神经网络学习过程本质就是为了学习数据分布，一旦训练数据与测试数据的分布不同，那么网络的泛化能力也大大降低；另外一方面，一旦每批训练数据的分布各不相同(batch 梯度下降)，那么网络就要在每次迭代都去学习适应不同的分布，这样将会大大降低网络的训练速度，这也正是为什么我们需要对数据都要做一个归一化预处理的原因。

对于深度网络的训练是一个复杂的过程，只要网络的前面几层发生微小的改变，那么后面几层就会被累积放大下去。一旦网络某一层的输入数据的分布发生改变，那么这一层网络就需要去适应学习这个新的数据分布，所以如果训练过程中，训练数据的分布一直在发生变化，那么将会影响网络的训练速度。

我们知道网络一旦train起来，那么参数就要发生更新，除了输入层的数据外(因为输入层数据，我们已经人为的为每个样本归一化)，后面网络每一层的输入数据分布是一直在发生变化的，因为在训练的时候，前面层训练参数的更新将导致后面层输入数据分布的变化。以网络第二层为例：网络的第二层输入，是由第一层的参数和input计算得到的，而第一层的参数在整个训练过程中一直在变化，因此必然会引起后面每一层输入数据分布的改变。我们把网络中间层在训练过程中，数据分布的改变称之为：“Internal Covariate Shift”。Paper所提出的算法，就是要解决在训练过程中，中间层数据分布发生改变的情况，于是就有了Batch Normalization，这个牛逼算法的诞生。

2. 批量归一化的优势

BN算法（Batch Normalization）其强大之处如下：

可以选择比较大的初始学习率，让训练速度飙涨。以前还需要慢慢调整学习率，甚至在网络训练到一半的时候，还需要想着学习率进一步调小的比例选择多少比较合适，现在我们可以采用初始很大的学习率，然后学习率的衰减速度也很大，因为这个算法收敛很快。当然这个算法即使你选择了较小的学习率，也比以前的收敛速度快，因为它具有快速训练收敛的特性；
不用去担心过拟合中drop out、L2正则项参数的选择问题，采用BN算法后，你可以移除这两项了参数，或者可以选择更小的L2正则约束参数了，因为BN具有提高网络泛化能力的特性；
不需要使用使用局部响应归一化层了（局部响应归一化是Alexnet网络用到的方法，搞视觉的估计比较熟悉），因为BN本身就是一个归一化网络层；
可以把训练数据彻底打乱（防止每批训练的时候，某一个样本都经常被挑选到）

3. BN算法介绍

就像激活函数层、卷积层、全连接层、池化层一样，BN(Batch Normalization)也属于网络的一层。在前面我们提到网络除了输出层外，其它层因为低层网络在训练的时候更新了参数，而引起后面层输入数据分布的变化。这个时候我们可能就会想，如果在每一层输入的时候，再加个预处理操作那该有多好啊，比如网络第三层输入数据X3(X3表示网络第三层的输入数据)把它归一化至：均值0、方差为1，然后再输入第三层计算，这样我们就可以解决前面所提到的“Internal Covariate Shift”的问题了。

实现BN并不是那么简单的。如果是仅仅使用普通的归一化公式，对网络某一层A的输出数据做归一化，然后送入网络下一层B，这样是会影响到本层网络A所学习到的特征的。打个比方，比如我网络中间某一层学习到特征数据本身就分布在S型激活函数的两侧，你强制进行归一化处理、标准差也限制在了1，把数据变换成分布于s函数的中间部分，这样就相当于我这一层网络所学习到的特征分布被你搞坏了，这可怎么办？于是BN算法是怎么做的：变换重构，引入了可学习参数γ、β，这就是算法关键之处：

每一个神经元xk都会有一对这样的参数γ、β。这样其实当：

是可以恢复出原始的某一层所学到的特征的。因此我们引入了这个可学习重构参数γ、β，让我们的网络可以学习恢复出原始网络所要学习的特征分布。最后Batch Normalization网络层的前向传导过程公式就是：

4. PyTorch实现

4.1 导入相应的包

import time
import torch
from torch import nn, optim
import torch.nn.functional as F
import torchvision
import sys
sys.path.append("/home/kesci/input/") 
import d2lzh1981 as d2l
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

4.2 定义BN函数

def batch_norm(is_training, X, gamma, beta, moving_mean, moving_var, eps, momentum):
    # 判断当前模式是训练模式还是预测模式
    if not is_training:
        # 如果是在预测模式下，直接使用传入的移动平均所得的均值和方差
        X_hat = (X - moving_mean) / torch.sqrt(moving_var + eps)
    else:
        assert len(X.shape) in (2, 4)
        if len(X.shape) == 2:
            # 使用全连接层的情况，计算特征维上的均值和方差
            mean = X.mean(dim=0)
            var = ((X - mean) ** 2).mean(dim=0)
        else:
            # 使用二维卷积层的情况，计算通道维上（axis=1）的均值和方差。这里我们需要保持
            # X的形状以便后面可以做广播运算
            mean = X.mean(dim=0, keepdim=True).mean(dim=2, keepdim=True).mean(dim=3, keepdim=True)
            var = ((X - mean) ** 2).mean(dim=0, keepdim=True).mean(dim=2, keepdim=True).mean(dim=3, keepdim=True)
        # 训练模式下用当前的均值和方差做标准化
        X_hat = (X - mean) / torch.sqrt(var + eps)
        # 更新移动平均的均值和方差
        moving_mean = momentum * moving_mean + (1.0 - momentum) * mean
        moving_var = momentum * moving_var + (1.0 - momentum) * var
    Y = gamma * X_hat + beta  # 拉伸和偏移
    return Y, moving_mean, moving_var

4.3 定义BN类

class BatchNorm(nn.Module):
    def __init__(self, num_features, num_dims):
        super(BatchNorm, self).__init__()
        if num_dims == 2:
            shape = (1, num_features) #全连接层输出神经元
        else:
            shape = (1, num_features, 1, 1)  #通道数
        # 参与求梯度和迭代的拉伸和偏移参数，分别初始化成0和1
        self.gamma = nn.Parameter(torch.ones(shape))
        self.beta = nn.Parameter(torch.zeros(shape))
        # 不参与求梯度和迭代的变量，全在内存上初始化成0
        self.moving_mean = torch.zeros(shape)
        self.moving_var = torch.zeros(shape)

    def forward(self, X):
        # 如果X不在内存上，将moving_mean和moving_var复制到X所在显存上
        if self.moving_mean.device != X.device:
            self.moving_mean = self.moving_mean.to(X.device)
            self.moving_var = self.moving_var.to(X.device)
        # 保存更新过的moving_mean和moving_var, Module实例的traning属性默认为true, 调用.eval()后设成false
        Y, self.moving_mean, self.moving_var = batch_norm(self.training, 
            X, self.gamma, self.beta, self.moving_mean,
            self.moving_var, eps=1e-5, momentum=0.9)
        return Y

5. 基于LeNet的应用

5.1 定义LeNet

net = nn.Sequential(
            nn.Conv2d(1, 6, 5), # in_channels, out_channels, kernel_size
            BatchNorm(6, num_dims=4),
            nn.Sigmoid(),
            nn.MaxPool2d(2, 2), # kernel_size, stride
            nn.Conv2d(6, 16, 5),
            BatchNorm(16, num_dims=4),
            nn.Sigmoid(),
            nn.MaxPool2d(2, 2),
            d2l.FlattenLayer(),
            nn.Linear(16*4*4, 120),
            BatchNorm(120, num_dims=2),
            nn.Sigmoid(),
            nn.Linear(120, 84),
            BatchNorm(84, num_dims=2),
            nn.Sigmoid(),
            nn.Linear(84, 10)
        )
print(net)

打印结果为：

5.2 加载数据

##cpu要调小batchsize
batch_size=16

def load_data_fashion_mnist(batch_size, resize=None, root='/home/kesci/input/FashionMNIST2065'):
    """Download the fashion mnist dataset and then load into memory."""
    trans = []
    if resize:
        trans.append(torchvision.transforms.Resize(size=resize))
    trans.append(torchvision.transforms.ToTensor())
    
    transform = torchvision.transforms.Compose(trans)
    mnist_train = torchvision.datasets.FashionMNIST(root=root, train=True, download=True, transform=transform)
    mnist_test = torchvision.datasets.FashionMNIST(root=root, train=False, download=True, transform=transform)

    train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=2)
    test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=2)

    return train_iter, test_iter
train_iter, test_iter = load_data_fashion_mnist(batch_size)

5.3 训练网络

lr, num_epochs = 0.001, 5
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
d2l.train_ch5(net, train_iter, test_iter, batch_size, optimizer, device, num_epochs)

你可能感兴趣的:(•深度学习实践)

全流程Python编程、机器学习与深度学习实践技术应用为为-180-3121-1455 深度学习机器学习 python python 机器学习深度学习
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。为了帮助科研人员系统地掌握深度学习的基础理论及其在PyTorch中的实现方法，Ai尚研修特别推出了“最新PyTorch机器学习与深度学习技
最新基于MATLAB机器学习、深度学习实践技术应用 weixin_贾 python 深度学习 MATLAB编程 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。系统学习机器学习和深度学习的理论知识及对应的代码实现方法，掌握图像处理的基础知识，以及经典机器学习算法和最新的深度神经网络
最新基于MATLAB 2021b的机器学习、深度学习实践数字化信息化智能化解决方案 matlab 机器学习深度学习
基于MATLAB2021b的机器学习和深度学习实践是一个广泛的主题，下面是一些基本的步骤和资源，可以帮助你开始：安装MATLAB2021b:首先，你需要安装MATLAB2021b。你可以从MathWorks网站下载并安装最新版本的软件。学习MATLAB基础知识:在开始机器学习和深度学习之前，了解MATLAB的基础知识是很有帮助的。你可以查看MathWorks的官方文档和教程，以了解MATLAB的语
【NLP】Datawhale-AI夏令营Day6-7打卡：大模型不雨_亦潇潇人工智能AI #自然语言处理NLP 人工智能自然语言处理 NLP 大模型微调大模型指令微调 AIGC
⭐️最近参加了由Datawhale主办、联合科大讯飞、阿里云天池发起的AI夏令营（第三期），我参与了深度学习实践-NLP（自然语言处理）方向⭐️作为NLP小白，我希望能通过本次夏令营的学习实践，对NLP有初步的了解，学习大模型，动手完成NLP项目内容，同时通过社区交流学习，提升调参优化等能力⭐️今天是打卡的第六天！✊✊✊⭐️按照日程安排，8月19日-22日主要学习深度学习方法，完成任务二，同时尝试
【PyTorch】深度学习实践之逻辑斯蒂回归 Logistic Regression zoetu #PyTorch深度学习实践深度学习 pytorch 回归
本文目录回归vs分类sigmoid函数损失函数例子课堂练习模型实现计算损失实现代码测试模型学习资料系列文章索引回归vs分类回归是预测数值分类是预测类别概率sigmoid函数LogisticFunction是最典型的sigmoid函数，因此有些书会直接说成sigmoid函数。实际上满足如下条件即可称为sigmoid函数：饱和函数单调递增存在极限损失函数使用二分类交叉熵公式：y=1，预测值接近1，lo
PyTorch深度学习实践——用pytorch实现logistic regression（分类问题）没有人会真的躺平 PyTorch 深度学习实践深度学习 pytorch
参考资料参考资料1：https://blog.csdn.net/bit452/article/details/109680909参考资料2：http://biranda.top/Pytorch%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0007%E2%80%94%E2%80%94%E5%88%86%E7%B1%BB%E9%97%AE%E9%A2%98/#%E9%97%AE
PyTorch深度学习实践——Logistic Regression 不见当年灰太狼 pytorch深度学习 pytorch 深度学习机器学习
在本次学习中，学习到了logistic回归，虽然说是一种回归模型，但是这个模型实际上是做分类问题，对于这种回归模型我们同样从三个方面来进行介绍，logistic回归是什么？为什么要采用logistics回归？如何实现losgistic回归模型？下面是对于logistic回归的总结：logistic回归是什么？给出定义：逻辑斯谛回归（logisticregression）是统计学习中的经典分类方法，
研0或研一|如何快速入门深度学习？ -希冀- 深度学习人工智能笔记小土堆深度学习
一、经验建议1️⃣课程篇直接上手B站【小土堆PyTorch深度学习快速入门教程】，共计9h50min左右，预计一周就可以学完，比较偏向理论和实践相结合跟李沐学AIB站【动手学深度学习PyTorch版】刘二大人B站【PyTorch深度学习实践】，共计11h56min，比较偏向原理理论2️⃣网站篇推荐使用李沐老师的动手学深度学习网站，里面还有论坛可以讨论3️⃣实践篇可以从往年的数学建模比赛的赛题以及k
“不缺钱，只缺人” ，同传翻译的那些事儿飞桨PaddlePaddle 人工智能编程语言深度学习自然语言处理 nlp
点击左上方蓝字关注我们项目简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
刘二大人《PyTorch深度学习实践》p9多分类问题失舵之舟- #深度学习 pytorch 分类
刘二大人《PyTorch深度学习实践》p9多分类问题一、零碎知识点1.LongTensor长整形张量2.transform结构及用法二、预备知识1.Softmax激活函数2.NLLLoss损失函数3.CrossEntropyLoss()4.随堂练习CrossEntropyLossvsNLLLoss三、课程代码1.函数名问题导致的运行错误2.课程代码一、零碎知识点1.LongTensor长整形张量t
刘二大人《PyTorch深度学习实践》p8加载数据集失舵之舟- #深度学习 pytorch 人工智能
刘二大人《PyTorch深度学习实践》p8加载数据集一、零碎知识点1.enumerate()二、Batch（批次）和Mini-Batch1.Mini-Batch2.Dataset（数据集）3.DataLoader（数据加载器）三、课程代码一、零碎知识点1.enumerate()enumerate()是python的一个内置函数，用于对可迭代对象进行遍历，并返回索引和对应的元素。citys=["wu
刘二大人《PyTorch深度学习实践》p5用pytorch实现线性回归失舵之舟- #深度学习 pytorch 线性回归
刘二大人《PyTorch深度学习实践》p5用pytorch实现线性回归一、零碎知识点1.torch.nn2.nn.Module3.nn.linear4.nn.MSELoss5.torch.optim.SGD二、课程代码1.思路流程2.代码三、课后小练习一、零碎知识点1.torch.nntorch.nn是PyTorch中用于构建神经网络模型的模块。它是PyTorch的神经网络库，提供了一系列的类和函
刘二大人《PyTorch深度学习实践》p6逻辑斯蒂回归失舵之舟- #深度学习 pytorch 回归
刘二大人《PyTorch深度学习实践》p6logistic回归一、零碎知识点1.torchvision2.np.linspace3.torch.Tensor(x).view4.matplotlib画一条直线二、分类问题1.二分类问题2.BCELoss函数3.思路流程三、课程代码一、零碎知识点1.torchvisionTorchVision提供了一些方便的函数和类，用于加载和预处理常见的图像数据集，
【深度学习实践】换脸应用dofaker本地部署 justld 深度学习大模型图像处理深度学习人工智能
本文介绍了dofaker换脸应用的本地部署教程，dofaker支持windows、linux、cpu/gpu推理，不依赖于任何深度学习框架，是一个非常好用的换脸工具。本教程的部署系统为windows11，使用CPU推理。注意：1、请确保您的所有路径不要包含中文，否则可能发生奇怪的问题（windows用户名不要是中文）2、安装好visualstudiocommunity（社区版本)，勾选C++开发。
最新PyTorch机器学习与深度学习实践技术应用 asyxchenchong888 机器学习机器学习深度学习 pytorch
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。因此，为了帮助广大科研人员更加系统地学习深度学习的基础理论知识及对应的Pytorch代码实现方法，掌握深度学习的基础知识，与经典机器学习算法
PyTorch机器学习与深度学习实践技术应用梦想的初衷~ pytorch 机器学习深度学习 pytorch
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。因此，为了帮助广大科研人员更加系统地学习深度学习的基础理论知识及对应的Pytorch代码实现方法，Ai尚研修特举办“最新PyTorch机器学
PyTorch机器学习与深度学习实践技术应用思考的小猴子机器学习生态农业机器学习深度学习 pytorch
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。因此，为了帮助广大科研人员更加系统地学习深度学习的基础理论知识及对应的Pytorch代码实现方法，Ai尚研修特举办“最新PyTorch机器学
PyTorch机器学习与深度学习实践技术应用 Mr.靳靳477302280 人工智能机器学习机器学习深度学习 pytorch
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。因此，为了帮助广大科研人员更加系统地学习深度学习的基础理论知识及对应的Pytorch代码实现方法，Ai尚研修特举办“最新PyTorch机器学
越学越有趣：『手把手带你学NLP』系列项目02 ——语义相似度计算的那些事儿... 飞桨PaddlePaddle 百度 python 人工智能深度学习编程语言
点击左上方蓝字关注我们课程简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
越学越有趣：『手把手带你学NLP』系列项目05 ——文本情感分析的那些事儿飞桨PaddlePaddle python 人工智能深度学习机器学习自然语言处理
点击左上方蓝字关注我们课程简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
每天五分钟计算机视觉：经典架构的力量与启示幻风_huanfeng 计算机视觉计算机视觉架构人工智能卷积神经网络深度学习
在深度学习和计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetworks，简称CNN）无疑是最为经典的架构之一。近年来，随着研究的不断深入和新架构的不断涌现，许多初学者可能会忽视这些经典架构的重要性。然而，理解并学习这些经典架构，对于我们深入理解卷积神经网络的工作原理，以及如何设计更有效的模型具有极大的帮助。本文将探讨学习经典卷积网络架构的原因，并阐述其对于现代深度学习实践
AI 夏令营第三期 - 基于论文摘要的文本分类与关键词抽取挑战赛学习笔记3 话不多说干起来人工智能学习笔记 python
背景Datawhale联合科大讯飞、阿里云天池平台开设了机器学习、深度学习、AIforScience三个方向的夏令营学习。其中，深度学习实践-NLP方向以讯飞平台“基于论文摘要的文本分类与关键词抽取挑战赛”（2023iFLYTEKA.I.开发者大赛-讯飞开放平台）为学习命题，并提供了一些解题代码供夏令营的初学者、学习者学习研究。本笔记在此学习过程中产出。赛题背景：医学领域的文献库中蕴含了丰富的疾病
Batch Norm简明图解【批归一化】新缸中之脑神经网络 batch 人工智能
BatchNorm（批归一化）是现代深度学习实践者工具包的重要组成部分。在批归一化论文中引入它后不久，它就被认为在创建可以更快训练的更深层次神经网络方面具有变革性。BatchNorm是一种神经网络层，现在在许多架构中普遍使用。它通常作为线性或卷积块的一部分添加，并有助于在训练期间稳定网络。在本文中，我们将探讨什么是BatchNorm、为什么需要它以及它是如何工作的。但在我们讨论批归一化本身之前，让
pytorch-深度学习实践 jjnn97 深度学习 pytorch 人工智能
pytorch-深度学习实践02-线性回归线性回归是回归问题，损失函数如下图所示。MSE:平均平方误差04-代码实现线性模型一下代码实现一个线性模型，05为使用pytorch工具实现线性模型注意：1.tensor计算会建立计算图2.backward()函数将计算图释放importtorchx_data=[1.0,2.0,3.0]y_data=[2.0,4.0,6.0]w=torch.tensor(
百度飞桨心得Final——总结 hdu_Mikeshen 百度飞桨学习笔记
不知不觉，百度飞桨深度学习21天的课程，已经接近尾声了。俗话说的好：师傅领进门，修行看个人。在这次课程之后，我说不上对深度学习，机器学习了解了多深。但这次课程是一次敲门砖，带我走进了ML,DL的大门，了解到了这个领域是怎么运作的，对具体知识的要求，以及——数学的美。在这里我想总结一下本课程的主要内容，分享给大家，同时便于自己日后翻看。本次课程总共有4个模块。①零基础入门深度学习实践项目：波士顿房价
PyTorch 深度学习实践第2讲/作业（Linear Model）有温度的AI PyTorch 深度学习实践 pytorch 深度学习人工智能 cnn 计算机视觉
对一组数据进行预测训练损失和MSE均方误差损失代码示例y=w*ximportnumpyasnpimportmatplotlib.pyplotasplt#准备数据x_data=[1.0,2.0,3.0]y_data=[2.0,4.0,6.0]#定义模型y=x*wdefforward(x):returnx*wdefloss(x,y):y_pred=forward(x)#y_pred为模型预测值retu
PyTorch 深度学习实践第5讲刘二大人课后题个人答案 asfvdvc 深度学习 pytorch 人工智能
PyTorch深度学习实践第5讲课后习题由于本节习题很少看到比较完整的代码,因此上传一个给大家参考.B站刘二大人这里要注意一下,在对不同优化器进行比较的过程中,需要保持初始参数值一致,这样才有可比性#练习5-1尝试不同优化器训练线性模型,并保存图像"""AdagradAdamAdamax"ASGDLBFGSRMSpropRpropSGD"""importtorchimportmatplotlib.
深度学习debug沉思录视学算法神经网络算法计算机视觉机器学习人工智能
作者丨土豆@知乎来源丨https://zhuanlan.zhihu.com/p/158739701前言接触深度学习也有一两年了，一直没有将一些实战经验整理一下形成文字。本文打算用来记录一些在深度学习实践中的调试过程，记录一些经验之谈。因为目前深度学习业界的理论基础尚且薄弱，很多工程实践中的问题没法用理论解释得很好，这里的只是实践中的一些经验之谈，以供参考以及排错。本文将持续更新。需要强调的是，本文
深度学习debug实践中的一些经验之谈 zenRRan 计算机视觉神经网络机器学习人工智能深度学习
点击上方，选择星标或置顶，每天给你送干货！阅读大概需要23分钟跟随小博主，每天进步一丢丢作者：土豆链接：https://zhuanlan.zhihu.com/p/158739701编辑：王萌澳门城市大学(深度学习冲鸭公众号)本文仅作学术分享，若侵权，请联系后台删文处理前言接触深度学习也有一两年了，一直没有将一些实战经验整理一下形成文字。本文打算用来记录一些在深度学习实践中的调试过程，记录一些经验之
深度学习debug沉思录！ Datawhale 神经网络计算机视觉机器学习人工智能深度学习
↑↑↑关注后"星标"Datawhale每日干货&每月组队学习，不错过Datawhale干货作者：土豆@知乎，来源：极市平台原文丨https://zhuanlan.zhihu.com/p/158739701前言接触深度学习也有一两年了，一直没有将一些实战经验整理一下形成文字。本文打算用来记录一些在深度学习实践中的调试过程，记录一些经验之谈。因为目前深度学习业界的理论基础尚且薄弱，很多工程实践中的问题
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他