Fey_Well

MxNet 实践（1）：Spatial Transformer Networks

论文：Spatial Transformer Networks
演示：google drive
博客：kevinzakka
代码：自己实现的代码
————————————————————

- 摘要
- 网络结构
  - 特点
  - 结构
    - 1 Localisation Net
    - 2 Grid Generator
    - 3 Sampler
- 代码
  - 1 使用Gluon
    - 11 STN结构示例
    - 12 主体网络
  - 2 使用MxNetsymbol
  - 3 注意
  - 4 可视化
  - 5 可视化结果
  - 6 训练结果
- 参考资料

摘要

卷积神经网络在图像分类，目标检测等任务上显示了强大的特征提取能力，且CNN本身具有一定的位移、旋转、尺度不变性。然而，对于一些图像数据变形的情况，CNN并不能自适应地学习图像的变形情况。
Spatial Transformer Networks （以下均简称STN）提供了一种可微分的网络结构，不需要关键点的标定，能够根据分类或者其它任务自适应地将数据进行空间变换和对齐（包括平移、缩放、旋转以及其它几何变换等）。

MxNet 实践（1）：Spatial Transformer Networks_第1张图片

上述图片是将STN作为MNIST分类网络第一层的结果，我们注意到STN学会了如何更“健壮”地进行图像分类：通过放大和消除背景噪声，它已经“标准化”输入数据以提高分类效果。详细动画 here

网络结构

特点

论文作者提出STN 有三个重要的特性：

模块化： STN可以插入到现有深度学习网络结构的任意位置，且只需要较小的改动。
可微分性： STN 是一个可微分的结构，可以进行反向传播，整个网络可以端到端训练。
动态性： 与对所有输入进行相同的pooling操作相比，STN对每一特征图输入采样，并主动学习空间变换。

结构

MxNet 实践（1）：Spatial Transformer Networks_第2张图片

网络结构

如上图所示，STN由Localisation net （定位网络），Grid generator（网格生成器）和Sampler（采样器）三部分构成。

2.1 Localisation Net

Localisation 网络的目标是学习空间变换参数 θ ,无论通过全连接层，还是卷积层，Localisation网络最后一层必须回归产生空间变换参数 θ 。

输入特征图 U ，其大小为 (H, W, C)
输出空间变换参数 θ （对于仿射变换来说，其大小为（6，））
结构全连接，卷积均可，记作 θ=floc(U)

2.2 Grid Generator

该层利用Localisation Net 输出的空间变换参数θ，将输入的特征图进行变换，以仿射变换为例，将输出特征图上某一位置 (xti,yti) 通过参数 θ 映射到输入特征图上某一位置 (xsi,ysi) ，计算公式如下：

grid公式

网格参数恒等映射和应用仿射变换后结果如下：

MxNet 实践（1）：Spatial Transformer Networks_第3张图片

2.3 Sampler

实际上 (xsi,ysi) 往往会落在原始输入特征图的几个像素点中间，因此需要利用双线性插值来计算出对应该点的灰度值。需要补充的是，文中在变换时用都是标准化坐标，即 xi,yi∈[−1,1] 。实际采样形式如下：

Φx 和 Φy 是采样核函数 k() 的参数，定义了图像插值的形式（比如，双线性）。
Ucnm 是输入特征图 U 通道 c 中位置为 (n,m) 的值。
Vci 是输出特征图 V 通道 c 中位置为 (xti,yti) ，即像素点 i 的值。

注意到采样是对输入的每一个通道的确定性映射，这样做在通道上维持了空间的一致性。
理论上，只要能对 xsi 和 ysi 求得次梯度的任何采样核函数都可以使用。使用整数插值的情况如下：

整数插值

其中，

⌊x+0.5⌋ 对

x 向下取整，即取最近邻的整数。而

δ() 是Kronecker delta函数。这样的采样核将对

(xsi,ysi) 的最近邻像素的值复制得到输出位置

(xti,yti) 的值。在作者的实验中采用的是双线性插值：

双线性

代码

3.1 使用Gluon

3.1.1 STN结构示例

class STN(nn.HybridBlock):
    ##继承HybridBlock模块，可以方便的hybrid，将命令式编程转换为符号式提升性能但损失了一定的灵活性
    def __init__(self):
        super(STN, self).__init__()
        with self.name_scope():
        # 使用name_scope可以自动给每一层生成独一无二的名字方便读取特定层
        # Spatial transformer localization-network
        # loc 定义了两层卷积网络
            loc = self.localization = nn.HybridSequential() 
            loc.add(nn.Conv2D(8, kernel_size=7))
            loc.add(nn.MaxPool2D(strides=2))
            loc.add(nn.Activation(activation='relu'))
            loc.add(nn.Conv2D(10, kernel_size=5))
            loc.add(nn.MaxPool2D(strides=2))
            loc.add(nn.Activation(activation='relu'))
         # 采用两层全连接层，回归出仿射变换所需的参数θ（6，）   
            # Regressor for the 3 * 2 affine matrix
            fc_loc = self.fc_loc = nn.HybridSequential()
            fc_loc.add(nn.Dense(32,activation='relu'))
            # 将该层w初始化为全零，b初始化为[1,0,0,0,1,0]
            fc_loc.add(nn.Dense(3 * 2,weight_initializer='zeros'))

    # Spatial transformer network forward function
    # 使用hybrid_forward需要增加F参数，它会自动判定前向过程中调用nd还是sym            
    def hybrid_forward(self,F, x):    
        xs = self.localization(x)
        xs = xs.reshape((-1, 10 * 3 * 3))
        theta = self.fc_loc(xs)
        theta = theta.reshape((-1, 2*3))
        # MxNet 已经定义好了相应的产生网格和采样的函数接口
        grid = F.GridGenerator(data=theta, transform_type='affine',target_shape=(28,28),name='grid')

        x = F.BilinearSampler(data=x,grid=grid,name='sampler' )

        return x

3.1.2 主体网络

class Net(nn.HybridBlock):
    def __init__(self):
        super(Net, self).__init__()
        # 对输入图片进行STN变换后送入一个简单的两层卷积，两层全连接网络
        with self.name_scope():
            self.model = nn.HybridSequential()
            self.model.add(STN())
            self.model.add(nn.Conv2D(10, kernel_size=5))
            self.model.add(nn.MaxPool2D())
            self.model.add(nn.Activation(activation='relu'))
            self.model.add(nn.Conv2D(20, kernel_size=5))
            self.model.add(nn.Dropout(.5))
            self.model.add(nn.MaxPool2D())
            self.model.add(nn.Activation(activation='relu'))
            self.model.add(nn.Flatten())
            self.model.add(nn.Dense(50))
            self.model.add(nn.Activation(activation='relu'))
            self.model.add(nn.Dropout(.5))
            self.model.add(nn.Dense(10))

    def hybrid_forward(self,F, x):
        for i,b in enumerate(self.model):
            x = b(x)
        return x

3.2 使用MxNet.symbol

def get_loc(data, attr={'lr_mult':'0.01'}):
    """
    the localisation network in stn, it will increase acc about more than 1%,
    when num-epoch >=15
    """
    ## 与gluon写法一致，只是调用的mx.symbol模块
    loc = sym.Convolution(data=data, num_filter=8, kernel=(7, 7), stride=(1,1))
    loc = sym.Activation(data = loc, act_type='relu')
    loc = sym.Pooling(data=loc, kernel=(2, 2), stride=(2, 2), pool_type='max')
    loc = sym.Convolution(data=loc, num_filter=10, kernel=(5, 5), stride=(1,1))
    loc = sym.Activation(data = loc, act_type='relu')
    loc = sym.Pooling(data=loc, kernel=(2, 2),stride=(2, 2), pool_type='max')

    loc = sym.FullyConnected(data=loc, num_hidden=32, name="stn_loc_fc1", attr=attr)
    loc = sym.Activation(data = loc, act_type='relu')
#       loc = sym.Flatten(data=loc)
    loc = sym.FullyConnected(data=loc, num_hidden=6, name="stn_loc_fc2", attr=attr)
    return loc

def get_symbol(num_classes=10, flag='training' ,add_stn=True, **kwargs):
    data = sym.Variable('data')
    if add_stn:
        ## mx.sym中写好了STN层包括grid generator和sampler，只需要送入相应参数θ
        data = sym.SpatialTransformer(data=data, loc=get_loc(data), target_shape = (28,28),
                                         transform_type="affine", sampler_type="bilinear")
    # first conv
    conv1 = sym.Convolution(data=data, kernel=(5,5), num_filter=10)
    relu1 = sym.Activation(data=conv1, act_type="relu")
    pool1 = sym.Pooling(data=relu1, pool_type="max",
                              kernel=(2,2), stride=(2,2))
    # second conv
    conv2 = sym.Convolution(data=pool1, kernel=(5,5), num_filter=20)
    relu2 = sym.Activation(data=conv2, act_type="relu")
    pool2 = sym.Pooling(data=relu2, pool_type="max",
                              kernel=(2,2), stride=(2,2))

    drop1 = mx.sym.Dropout(data=pool2)
    # first fullc
    flatten = sym.Flatten(data=drop1)
    fc1 = sym.FullyConnected(data=flatten, num_hidden=50)
    relu3 = sym.Activation(data=fc1, act_type="relu")
    # second fullc
    drop2 = mx.sym.Dropout(data=relu3,mode=flag)
    fc2 = sym.FullyConnected(data=drop2, num_hidden=num_classes)
    # loss
    net = sym.SoftmaxOutput(data=fc2, name='softmax')
    return net

3.3 注意

对于Localisation学习的参数 θ 可以初始化为[1,0,0,0,1,0]，相当于恒等映射，没有对输入图像做空间变换。可将Localisation的最后一层的w的初始化为0，b初始化为[1,0,0,0,1,0]

b = net.model[0].fc_loc[1].bias
b.set_data(nd.array([1, 0, 0, 0, 1, 0]))

3.4 可视化

def visualize_stn():
    # 随机读取其中一个batch数据进行可视化
    for i,(data,_) in enumerate(test_data):
        if i==1:
            break
        data = data.as_in_context(ctx)
        # 只做STN部分
        output = net.model[0](data)
        # convert_image_np函数 转换图片通道为（W,H,C）便于显示，以及标准化      
        in_grid = convert_image_np(make_grid(data))        
        out_grid = convert_image_np(make_grid(output))        
        # Plot the results side-by-side
        fig, axarr = plt.subplots(1, 2)
        axarr[0].imshow(in_grid)
        axarr[0].set_title('Dataset Images')

        axarr[1].imshow(out_grid)
        axarr[1].set_title('Transformed Images')
        # 将图片结果保存
        fig.savefig('result/compare.jpg',dpi=256)

3.5 可视化结果

MxNet 实践（1）：Spatial Transformer Networks_第4张图片

3.6 训练结果

Train Epoch: 1 [0/60000 (0%)] Loss: 0.002750
Train Epoch: 1 [32000/60000 (53%)] Loss: 0.790990

Test set: Average loss: 0.0072, Accuracy: 9196.0/10000 (92%)

Train Epoch: 2 [0/60000 (0%)] Loss: 0.000803 Train Epoch: 2
[32000/60000 (53%)] Loss: 0.260360

Test set: Average loss: 0.0032, Accuracy: 9568.0/10000 (96%)
………………………………………………………………………………………………………………
………………………………………………………………………………………………………………
Train Epoch: 19 [0/60000 (0%)] Loss: 0.000084 Train Epoch: 19
[32000/60000 (53%)] Loss: 0.057609

Test set: Average loss: 0.0008, Accuracy: 9833.0/10000 (98%)

Train Epoch: 20 [0/60000 (0%)] Loss: 0.000102 Train Epoch: 20
[32000/60000 (53%)] Loss: 0.056364

Test set: Average loss: 0.0008, Accuracy: 9852.0/10000 (99%)

完整代码请移步我的github，欢迎star

参考资料

Pytorch 教程
MxNet 范例
MxNet 初始化模型参数
http://www.cnblogs.com/neopenx/p/4851806.html
https://blog.csdn.net/xbinworld/article/details/69049680
kevinzakka 博客

你可能感兴趣的:(深度学习实践)

Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
Python实现简单的深度学习实践 master_chenchengg python python Python python开发 IT
Python实现简单的深度学习实践Python：通往深度学习世界的钥匙动手搭建你的第一个神经网络模型从零开始，用Python解析MNIST手写数字识别超越基础：使用Keras快速构建卷积神经网络实战演练：训练一个简单的图像分类器Python：通往深度学习世界的钥匙在当今这个数据驱动的时代，Python无疑成为了打开深度学习大门的金钥匙。它不仅语法简洁、易于上手，而且拥有强大的社区支持和丰富的库资源
什么是 tensorflow ？解决了什么问题？为什么需要它？没有它会出现什么问题？微信公众号：AI创造财富 tensorflow 人工智能 python
什么是TensorFlow？TensorFlow是一个用于数值计算的强大开源框架，其核心是通过有向图表示计算过程，图中的节点代表数学运算，边则代表多维数组（张量）之间的数据流。它最初是为了满足Google内部的研究需求而开发的，现在已成为全球开发者构建和部署机器学习模型的重要工具。解决了什么问题？TensorFlow主要解决了深度学习实践中的以下关键问题：跨平台计算：TensorFlow支持在CP
《Pytorch深度学习实践》ch5-Logistic回归拾零吖机器学习深度学习 pytorch 线性回归
------B站《刘二大人》1.Classification经典的分类数据集：MNIST（0-9）导入数据集：（路径，训练集/测试集，是否下载）importtorchvisiontrain_set=torchvision.datasets.MINIST(root='../dataset/mnist',train=True,download=True)test_set=torchvision.dat
《深度学习实践教程》[吴微] ch-5 3/5层全连接神经网络破无差Povchar python 深度学习人工智能神经网络 python
一、练习课本上3层全连接神经网络识别手写数字。答案代码：importtorchfromtorchimportnn,optimfromtorch.autogradimportVariablefromtorch.utils.dataimportDataLoaderfromtorchvisionimportdatasets,transforms#定义一些超参数batch_size=64learning_
Python深度学习实践：通过深度学习提高天气预测准确性 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python深度学习实践：通过深度学习提高天气预测准确性作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着全球气候变化和极端天气事件的日益频繁，准确预测天气变得越来越重要。传统的数值天气预报模型依赖于复杂的物理方程和大量的观测数据，但仍然难以预测短期内的极端天气事件。近年来，深度学习技术取得了突破性进展，为提高天气预报的
【深度学习实践与解惑】Basic Block 与 Bottleneck Block 的结构差异与适用深度范围？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能机器学习神经网络反向传播大模型 python
深度学习中BasicBlock与BottleneckBlock的结构差异与适用深度范围目录结构差异数学公式对比适用深度范围总结结构差异特征BasicBlockBottleneckBlock卷积层组合两个3×33\times33×3卷积层三个卷积层：1×1→3×3→1×11\times1\rightarrow3\times3\rightarrow1\times11×1→3×3→1×1通道数变化保持或
Python深度学习实践：手把手教你利用YOLO进行对象检测 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python深度学习实践：手把手教你利用YOLO进行对象检测1.背景介绍1.1问题的由来随着深度学习技术的不断发展，计算机视觉领域取得了令人瞩目的成果。其中，目标检测作为计算机视觉的核心任务之一，在安防监控、无人驾驶、智能交通、医疗诊断等多个领域都有着广泛的应用。目标检测旨在从图像或视频中检测出其中的目标，并标注出其位置和类别。近年来，基于深度学习的目标检测算法层出不穷，其中YOLO（YouOnl
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
Python深度学习实践：使用TensorFlow构建图像分类器 Evaporator Core Python开发经验 python 深度学习 tensorflow
摘要随着深度学习技术的飞速发展，图像识别已成为AI领域的热点应用之一。本篇文章将引导读者使用Python和Google的TensorFlow框架，从零开始构建一个简单的图像分类器。我们将深入探讨卷积神经网络（CNN）的基本原理，实现一个能够识别MNIST手写数字的数据集模型，并通过实战代码演示整个过程，最终展示模型的训练与评估。一、环境配置与库导入确保已安装Python3.7+版本，以及Tenso
深度学习面试八股文——决战金三银四 Good Note 补档深度学习面试人工智能机器学习 AIGC 校招春招
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记的任务是解读深度学习实践/面试过程中可能会用到的知识点，内容通俗易懂，入门、实习和校招轻松搞定。公主号合集地址点击进入优惠地址：深度学习笔记合集笔记介绍本笔记的任务是解读深度学习实践/面试过程中可能会用到的知识点，内容通俗易懂，入门、实习和校招轻松搞定。涵盖深度学习八股文和常用算法、模型，包括深度学习基础知识，前向传
一文读懂！深度学习 + PyTorch 的超实用学习路线 a小胡哦深度学习 python pytorch
深度学习作为人工智能领域的核心技术，正深刻改变着诸多行业。PyTorch则是深度学习实践中备受青睐的框架，它简单易用且功能强大。下面就为大家详细规划深度学习结合PyTorch的学习路线。一、基础知识储备数学基础数学是很重要的！！！线性代数、概率论与数理统计、微积分是深度学习的数学基石。熟悉矩阵运算、概率分布、梯度计算等概念，能帮助理解深度学习模型的原理。例如，在神经网络中，矩阵乘法用于神经元之间的
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）赵钰老师 python 机器学习深度学习 python 机器学习深度学习数据分析人工智能
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。理解和掌握深度学习的基础知识，深入了解其与经典机器学习算法的区别与联系，并系统掌握包括迁移学习、循环神经网络（RNN）、长短时记忆网络（L
keras快速上手-基于python的深度学习实践-基于索引的深度学习对话模型-源代码... weixin_34162401
该章的源代码已经调通，如下，先记录下来，再慢慢理解#!/usr/bin/envpython#coding:utf-8#In[1]:importpandasaspdimportnumpyasnpimportpickleimportkerasfromkeras.modelsimportSequential,Modelfromkeras.layersimportInput,Dense,Activatio
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
基于YOLOv5、YOLOv8和YOLOv10的自助售货机商品检测：深度学习实践与应用 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言自助售货机已经成为现代零售和自动化销售领域的重要组成部分。在自助售货机中，商品的检测与管理至关重要。通过精准的商品检测技术，售货机可以在商品售出后自动更新库存，并提供准确的商品信息反馈。然而，在复杂的环境下进行商品检测是一个具有挑战性的问题，尤其是在商品种类繁多、摆放方式多样以及光照条件变化较大的情况下。近年来，基于深度学习的目标检测算法，特别是YOLO（YouOnlyLookOnce）系列模
气象海洋水文领域Python机器学习及深度学习实践应用能力提升 AAIshangyanxiu 农林生态遥感编程算法统计语言大气科学 python 机器学习深度学习
Python是功能强大、免费、开源，实现面向对象的编程语言，能够在不同操作系统和平台使用，简洁的语法和解释性语言使其成为理想的脚本语言。除了标准库，还有丰富的第三方库，Python在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能。上述优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为气象、海洋和水文
全流程Python编程、机器学习与深度学习实践技术应用为为-180-3121-1455 深度学习机器学习 python python 机器学习深度学习
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。为了帮助科研人员系统地掌握深度学习的基础理论及其在PyTorch中的实现方法，Ai尚研修特别推出了“最新PyTorch机器学习与深度学习技
最新基于MATLAB机器学习、深度学习实践技术应用 weixin_贾 python 深度学习 MATLAB编程 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。系统学习机器学习和深度学习的理论知识及对应的代码实现方法，掌握图像处理的基础知识，以及经典机器学习算法和最新的深度神经网络
最新基于MATLAB 2021b的机器学习、深度学习实践数字化信息化智能化解决方案 matlab 机器学习深度学习
基于MATLAB2021b的机器学习和深度学习实践是一个广泛的主题，下面是一些基本的步骤和资源，可以帮助你开始：安装MATLAB2021b:首先，你需要安装MATLAB2021b。你可以从MathWorks网站下载并安装最新版本的软件。学习MATLAB基础知识:在开始机器学习和深度学习之前，了解MATLAB的基础知识是很有帮助的。你可以查看MathWorks的官方文档和教程，以了解MATLAB的语
【NLP】Datawhale-AI夏令营Day6-7打卡：大模型不雨_亦潇潇人工智能AI #自然语言处理NLP 人工智能自然语言处理 NLP 大模型微调大模型指令微调 AIGC
⭐️最近参加了由Datawhale主办、联合科大讯飞、阿里云天池发起的AI夏令营（第三期），我参与了深度学习实践-NLP（自然语言处理）方向⭐️作为NLP小白，我希望能通过本次夏令营的学习实践，对NLP有初步的了解，学习大模型，动手完成NLP项目内容，同时通过社区交流学习，提升调参优化等能力⭐️今天是打卡的第六天！✊✊✊⭐️按照日程安排，8月19日-22日主要学习深度学习方法，完成任务二，同时尝试
【PyTorch】深度学习实践之逻辑斯蒂回归 Logistic Regression zoetu #PyTorch深度学习实践深度学习 pytorch 回归
本文目录回归vs分类sigmoid函数损失函数例子课堂练习模型实现计算损失实现代码测试模型学习资料系列文章索引回归vs分类回归是预测数值分类是预测类别概率sigmoid函数LogisticFunction是最典型的sigmoid函数，因此有些书会直接说成sigmoid函数。实际上满足如下条件即可称为sigmoid函数：饱和函数单调递增存在极限损失函数使用二分类交叉熵公式：y=1，预测值接近1，lo
PyTorch深度学习实践——用pytorch实现logistic regression（分类问题）没有人会真的躺平 PyTorch 深度学习实践深度学习 pytorch
参考资料参考资料1：https://blog.csdn.net/bit452/article/details/109680909参考资料2：http://biranda.top/Pytorch%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0007%E2%80%94%E2%80%94%E5%88%86%E7%B1%BB%E9%97%AE%E9%A2%98/#%E9%97%AE
PyTorch深度学习实践——Logistic Regression 不见当年灰太狼 pytorch深度学习 pytorch 深度学习机器学习
在本次学习中，学习到了logistic回归，虽然说是一种回归模型，但是这个模型实际上是做分类问题，对于这种回归模型我们同样从三个方面来进行介绍，logistic回归是什么？为什么要采用logistics回归？如何实现losgistic回归模型？下面是对于logistic回归的总结：logistic回归是什么？给出定义：逻辑斯谛回归（logisticregression）是统计学习中的经典分类方法，
研0或研一|如何快速入门深度学习？ -希冀- 深度学习人工智能笔记小土堆深度学习
一、经验建议1️⃣课程篇直接上手B站【小土堆PyTorch深度学习快速入门教程】，共计9h50min左右，预计一周就可以学完，比较偏向理论和实践相结合跟李沐学AIB站【动手学深度学习PyTorch版】刘二大人B站【PyTorch深度学习实践】，共计11h56min，比较偏向原理理论2️⃣网站篇推荐使用李沐老师的动手学深度学习网站，里面还有论坛可以讨论3️⃣实践篇可以从往年的数学建模比赛的赛题以及k
“不缺钱，只缺人” ，同传翻译的那些事儿飞桨PaddlePaddle 人工智能编程语言深度学习自然语言处理 nlp
点击左上方蓝字关注我们项目简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
刘二大人《PyTorch深度学习实践》p9多分类问题失舵之舟- #深度学习 pytorch 分类
刘二大人《PyTorch深度学习实践》p9多分类问题一、零碎知识点1.LongTensor长整形张量2.transform结构及用法二、预备知识1.Softmax激活函数2.NLLLoss损失函数3.CrossEntropyLoss()4.随堂练习CrossEntropyLossvsNLLLoss三、课程代码1.函数名问题导致的运行错误2.课程代码一、零碎知识点1.LongTensor长整形张量t
刘二大人《PyTorch深度学习实践》p8加载数据集失舵之舟- #深度学习 pytorch 人工智能
刘二大人《PyTorch深度学习实践》p8加载数据集一、零碎知识点1.enumerate()二、Batch（批次）和Mini-Batch1.Mini-Batch2.Dataset（数据集）3.DataLoader（数据加载器）三、课程代码一、零碎知识点1.enumerate()enumerate()是python的一个内置函数，用于对可迭代对象进行遍历，并返回索引和对应的元素。citys=["wu
刘二大人《PyTorch深度学习实践》p5用pytorch实现线性回归失舵之舟- #深度学习 pytorch 线性回归
刘二大人《PyTorch深度学习实践》p5用pytorch实现线性回归一、零碎知识点1.torch.nn2.nn.Module3.nn.linear4.nn.MSELoss5.torch.optim.SGD二、课程代码1.思路流程2.代码三、课后小练习一、零碎知识点1.torch.nntorch.nn是PyTorch中用于构建神经网络模型的模块。它是PyTorch的神经网络库，提供了一系列的类和函
刘二大人《PyTorch深度学习实践》p6逻辑斯蒂回归失舵之舟- #深度学习 pytorch 回归
刘二大人《PyTorch深度学习实践》p6logistic回归一、零碎知识点1.torchvision2.np.linspace3.torch.Tensor(x).view4.matplotlib画一条直线二、分类问题1.二分类问题2.BCELoss函数3.思路流程三、课程代码一、零碎知识点1.torchvisionTorchVision提供了一些方便的函数和类，用于加载和预处理常见的图像数据集，
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他