机器学习与AI生成创作

深入理解神经网络中的反(转置)卷积

正文

本文主要是把之前在知乎上的回答[1,2]重新整理了一下并且加了一些新的内容。对于像素级的任务，在decoder部分都会用一些常规操作去逐步恢复feature map的空间大小，而常用的模块有反卷积[3,5]、上采样+卷积和subpixel[4]操作等等。

对于上采样+卷积操作，就是一个最近邻或者双线插值上采样到想要的feature map 空间大小再接一层卷积。但是对于反卷积，相信有不少炼丹师并不了解其具体实现原理，即反卷积是如何实现增大feature map空间大小的，而本文主要内容就是把反卷积具体实现讲清楚。

卷积前后向传播实现细节

在讲解反卷积计算实现细节之前，首先来看下深度学习中的卷积是如何实现前后向传播的。

先来看下一般训练框架比如Caffe和MXNet卷积前向实现部分代码：

Caffe:

https://github.com/BVLC/caffe/blob/master/src/caffe/layers/base_conv_layer.cpp#L258

MXNet:

https://github.com/apache/incubator-mxnet/blob/master/src/operator/nn/convolution-inl.h#L223

从实现上看，卷积的前向的实现方式都是 + 。

im2col 实现细节：

假设输入feature map 维度是，表示batch为1，通道为，高为，宽为，卷积核维度是，表示输出通道为，卷积核大小是。

引用自：https://www.researchgate.net/figure/Im2Col-operation-in-input-matrices_fig5_327070011

则过程如入上图所示，窗口从左到右上到下的顺序在每个输入通道同步滑动，每个窗口内容按行展开成一列，然后再按通道顺序接上填到 buffer对应的列，且 buffer 按从左到右顺序填写。

因为没有padding且步长为1，所以根据卷积输出大小计算公式可得：

所以输出buffer的宽维度为：，高维度则是，再把权值reshape成，则卷积计算就可以化为矩阵相乘运算了。

更一般的卷积前向计算：

则之前先要先根据pad在输入边缘补一圈0，然后再根据步长s去取每个卷积的位置填入buffer里面。

我们接着来看卷积反向传播是如何实现的。

其实用不太严谨的方式来想，我们知道输入对应的梯度维度大小肯定是和输入大小一致的，而上一层传回来的梯度大小肯定是和输出一致的。而且既然是反向传播，计算过程肯定是卷积前向过程的逆过程。

所以是将权值转置之后左乘输出梯度，得到类似 buffer 大小的中间结果然后再接一个操作，就可以得到输入梯度了：

这个也很好理解，就是反过来，把每一列回填累加回输入梯度对应的位置，之前前向过程滑窗怎么取的就怎么填回去。

简单来说就是把中间buffer结果的每一列从一个的向量，reshape 成的 tensor，然后根据的索引把对应的 patch 回填累加到输入梯度对应 channel 的位置上。

反卷积的两种实现方式

理解卷积实现细节之后，再来看下反卷积的两种实现方式，这里只讨论步长大于1，pad大于0的情况。

GEMM + col2im

其实从前面卷积的实现过程可以看到，如果卷积步长大于1的话，输出大小是小于输入的，但是反向传播的时候，输出梯度通过 + 操作可以实现把输出梯度空间大小从小变大到输入梯度大小，这不就是和反卷积想做的事情一样吗。

下面给出反卷积前向过程示意图：

所以反卷积核的维度是，和卷积核维度输入输出通道是反过来的。

https://github.com/BVLC/caffe/blob/master/src/caffe/layers/deconv_layer.cpp#L25

看caffe里面反卷积的实现确实也是调用的卷积的后向传播实现。

一般在用反卷积的时候都是需要输出大小是输入的两倍这样子，但是仔细回想一下卷积的输出大小计算公式：

如果根据这个公式反推，

假设不能整除的话，是会小于的，所以看MXNet[7]反卷积层的实现还有提供了一个的参数，用于得到正确的输出大小，adj可以根据如下公式求解：

https://github.com/apache/incubator-mxnet/blob/master/src/operator/nn/deconvolution-inl.h

下面画个简单的计算流程图展示下卷积的反向传播和反卷积的前向传播过程，假设卷积和反卷积核大小都是3x3，步长为2，pad为1，卷积输入大小是4x4，则假设需要卷积输出或反卷积输入大小是2x2，则现在看下如何从2x2大小的输入反推输出4x4。

为了方便理解，假设卷积输出梯度或者反卷积输入都是1，输入和输出通道都是1：

为什么要center crop，可以这样想，原来卷积输入是4x4的，然后是pad了0再卷积得到输出2x2，在梯度回传的时候我们其实是只需要中间4x4部分的梯度，相当于把pad的部分去掉。

用MXNet[7]代码验证下：

import mxnet as mx
import numpy as np

data_shape = (1, 1, 2, 2)
data = mx.nd.ones(data_shape)

deconv_weight_shape = (1, 1, 3, 3)
deconv_weight = mx.nd.ones(deconv_weight_shape)
deconv_weight[:] = np.array([1,2,3,4,5,6,7,8,9]).reshape((1,1,3,3))


# deconvolution forward
data_deconv = mx.nd.Deconvolution(data=data, weight=deconv_weight,
				      kernel=(3, 3),
				      pad=(1, 1),
				      stride=(2, 2),
				      adj=(1, 1),
				      num_filter=1)
print(data_deconv)

# convolution backward
data_sym = mx.sym.Variable('data')
conv_sym = mx.sym.Convolution(data=data_sym, kernel=(3, 3), stride=(2, 2), pad=(1, 1), num_filter=1, no_bias=True, name='conv')
executor = conv_sym.simple_bind(data=(1, 1, 4, 4), ctx=mx.cpu())
deconv_weight.copyto(executor.arg_dict['conv_weight'])
executor.backward(mx.nd.ones((1, 1, 2, 2)))

print(executor.grad_dict['data'])

可以看到运行结果和手推是一样的：

输入插空补0+卷积

其实反卷积还有一种实现方式，就是输入插空补0再加一个卷积（这里需要注意，卷积的时候需要把反卷积核旋转180度，下面会详细讲）的方式，同上这里只讨论步长大于1，pad大于0的情况。

根据文章[5]4.6节给出的推导公式，先从卷积前向方向来看，假设输入是，卷积核大小、步长和pad分别是，则卷积输出大小计算公式如下：

然后假设反卷积前向，输入大小是，参数配置同上，则反卷积输出计算公式如下：

那实际插空补0是怎么做呢，这里直接给出结论，输入之间插入个0，然后边缘padding大小是，最后再在右边和下边pad 大小的0。

下面看下文章[5]中给出的示意图：

https://arxiv.org/pdf/1603.07285.pdf

假设卷积输入是，卷积核大小、步长和pad分别是，则输出大小是。根据上面的结论，在反卷积的时候首先输入之前填入个0，然后周围pad一圈大小的0，最后因为，所以右下不需要再pad，然后应用步长为1的卷积就能得到大小的输出了。

https://arxiv.org/pdf/1603.07285.pdf

假设卷积输入是，卷积核大小、步长和pad分别是，则输出大小是。根据上面的结论，在反卷积的时候，首先输入之间填入个0，然后周围pad一圈大小的0，最后因为，所以右下需要再pad一圈，然后应用步长为1的卷积就能得到大小的输出了。

下面用实际例子来讲解下实际计算过程，假设反卷积核大小都是3x3，步长为2，pad为1，假设反卷积输入大小是2x2，则现在看下如何从2x2大小的输入反推输出4x4。

为了方便理解，假设反卷积输入都是1，输入和输出通道都是1：

可以看到结果和上面 + 方式是一致的。

一般看训练和推理框架的实现的方式都是 + ，而插空补0这种实现，目前我在MNN[6]这个推理框架里有见到，其Metal GPU上的实现用的是这个思路：

https://github.com/alibaba/MNN/blob/master/source/backend/metal/MetalDeconvolution.metal#L83


#define UP_DIV(x, y) (((x) + (y) - (1)) / (y))
#define ROUND_UP(x, y) (((x) + (y) - (1)) / (y) * (y))

kernel void deconv_depthwise(const device ftype4 *in        [[buffer(0)]],
                             device ftype4 *out             [[buffer(1)]],
                             constant deconv_constants& cst [[buffer(2)]],
                             const device ftype4 *wt        [[buffer(3)]],
                             const device ftype4 *biasTerms [[buffer(4)]],
                             ushort3 gid                    [[thread_position_in_grid]]) {
    if ((int)gid.x >= 4 || (int)gid.y >= 4) return;
    
    float4 result = float4(biasTerms[(short)gid.z]);
    
    short oy = (short)gid.y + 1;
    // 第一个输出:1，第6个输出：2
    short ox = (short)gid.x + 1;
    // 第一个输出:1，第6个输出：2
    short max_sy = min((2 - 1) * 2, oy / 2 * 2);
    // 第一个输出:0，第6个输出：2
    short max_sx = min((2 - 1) * 2, ox / 2 * 2);
    // 第一个输出:0，第6个输出：2
    short min_ky = UP_DIV(oy - max_sy, 1);
    // 第一个输出:1，第6个输出：0
    short min_kx = UP_DIV(ox - max_sx, 1);
    // 第一个输出:1，第6个输出：0
    
    if ((oy - min_ky * 1) % 2 == 0 && (ox - min_kx * 1) % 2 == 0) {
        short min_sy = max(0, ROUND_UP(oy + 1 - 3 * 1, 2));
        // 第一个输出:0，第6个输出：0
        short min_sx = max(0, ROUND_UP(ox + 1 - 3 * 1, 2));
        // 第一个输出:0，第6个输出：0
        short max_ky = (oy - min_sy) / 1;
        // 第一个输出:1，第6个输出：2
        short max_kx = (ox - min_sx) / 1;
        // 第一个输出:1，第6个输出：2
        short min_iy = (oy - max_ky * 1) / 2;
        // 第一个输出:0，第6个输出：0
        short min_ix = (ox - max_kx * 1) / 2;
        // 第一个输出:0，第6个输出：0
        
        for (auto ky = max_ky, iy = min_iy; ky >= min_ky; ky -= 2, iy += 2) {
            for (auto kx = max_kx, ix = min_ix; kx >= min_kx; kx -= 2, ix += 2) {
                auto wt4 = wt[ky * 3 + kx];
                auto in4 = in[iy * 2 + ix];
                result += float4(in4 * wt4);
            }
        }
    }
}

这里我把代码简化了，为了方便理解，同时也把一些参数都按照上面例子带入进去了。这里GPU实现的思路，简单来说开启的线程数是输出的大小，假设现在输出维度是，则启动了个线程，维度是，因为MNN的数据排布是C4[8]的结构，所以实际启动线程需要把通道数需要除以4，同时上取整。

这里kernel实现的是计算一个输出点的代码，而且因为实际实现的时候，输入并没有真的去插空补0和Padding，反卷积核也没有真的去旋转180度，所以看到绝大部分代码在计算当前线程负责的输出点所对应的权值和输入的取值索引。

这里线程维度是3维的，所以gid.x表示输出宽索引，gid.y表示高索引，gid.z表示通道索引。

代码里面的注释是按照卷积顺序，计算第一个卷积输出点和第6个输出点，变量所对应的值，就是上面流程图的红框和蓝框。最后看到卷积循环，恰好就是对应各自输入和权值的取值点。

反卷积的缺点

分析完反卷积的运算过程，再来看下反卷积的缺点。

反卷积有一个最大的问题是，如果参数配置不当很容易出现输出feature map带有明显棋盘状的现象，原因就是在与回填这一步。

文献[3]就分析的非常好，值得细读，里面提供了可动态配置反卷积的kernel size和stride然后可视化输出结果，可以看到当stride为2的时候，kernel是奇数就会出现网格：

而偶数kernel就不会：

而如果是多层堆叠反卷积的话而参数配置又不当，那么棋盘状的现象就会层层传递：

所以当使用反卷积的时候参数配置需要特别的小心。

下面就用简单的几句代码来复现使用反卷积可能会带来的的网格问题：

import mxnet as mx

batch_size = 1
in_channel = 1
height = 5
width = 5

data_shape = (batch_size, in_channel, height, width)
data = mx.nd.ones(data_shape)

out_channel = 1
kernel_size = 3
deconv_weight_shape = (in_channel, out_channel, kernel_size, kernel_size)
deconv_weight = mx.nd.ones(deconv_weight_shape)

stride = 2
up_scale = 2
data_deconv = mx.nd.Deconvolution(data=data, weight=deconv_weight,
				      target_shape=(height * up_scale, width * up_scale),
				      kernel=(kernel_size, kernel_size),
				      stride=(stride, stride),
				      num_filter=out_channel)
print(data_deconv)

data_upsample = mx.nd.contrib.BilinearResize2D(data=data, scale_height=up_scale, scale_width=up_scale)
conv_weight_shape = (out_channel, in_channel, kernel_size, kernel_size)
conv_weight = mx.nd.ones(conv_weight_shape)
pad = (kernel_size - 1) / 2
data_conv = mx.nd.Convolution(data=data_upsample, weight=conv_weight,
			            kernel=(kernel_size, kernel_size),
			            pad=(pad, pad), num_filter=out_channel, no_bias=True)
print(data_conv)

这里为了简化，反卷积和卷积的权重都是设为1，而输入与输出 feature map 通道数都是1，输入 feature map 的值都是1，然后来看下反卷积和上采样+卷积的前向结果：

deconvolution, kernel3, stride2

bilinear upsample + convolution

可以看到，kernel为3，步长为2的情况下，反卷积在不训练的情况下，输出就带有明显很规律的棋盘状。接着我们把kernel改为4看看：

deconvolution, kernel4, stride2

可以看到棋盘状消失了。

所以在实际应用中对于一些像素级别的预测任务，比如分割，风格化，Gan这类的任务，对于视觉效果有要求的，在使用反卷积的时候需要注意参数的配置，或者直接换成上采样+卷积。

参考资料

[1] https://www.zhihu.com/question/328891283/answer/717113611
[2] https://www.zhihu.com/question/48279880/answer/838063090
[3] https://distill.pub/2016/deconv-checkerboard/
[4] https://blog.csdn.net/shwan_ma/article/details/78440394
[5] https://arxiv.org/pdf/1603.07285.pdf
[6] https://github.com/alibaba/MNN
[7] https://github.com/apache/incubator-mxnet
[8] https://www.zhihu.com/question/337513515/answer/768632471

公众号近期荐读：

GAN整整6年了！是时候要来捋捋了！
新手指南综述 | GAN模型太多，不知道选哪儿个？
数百篇GAN论文已下载好！配一份生成对抗网络最新综述！
图卷积网络GCN的理解与介绍
【CapsulesNet的解析】了解一下胶囊网络？
结合GAN的零次学习（zero-shot learning）
GAN的图像修复：多样化补全
CVPR2020之MSG-GAN：简单有效的SOTA
CVPR2020之姿势变换GAN：图像里谁都会劈叉？
CVPR2020之多码先验GAN：预训练模型如何使用？
两幅图像！这样能训练好GAN做图像转换吗？
单图训GAN！如何改进SinGAN？
有点夸张、有点扭曲！速览这些GAN如何夸张漫画化人脸！
见微知细之超分辨率GAN！附70多篇论文下载！
天降斯雨，于我却无！GAN用于去雨如何？
脸部转正！GAN能否让侧颜杀手、小猪佩奇真容无处遁形？
容颜渐失！GAN来预测？
强数据所难！SSL（半监督学习）结合GAN如何？
弱水三千，只取你标！AL（主动学习）结合GAN如何？
异常检测，GAN如何gan ?
虚拟换衣！速览这几篇最新论文咋做的！
脸部妆容迁移！速览几篇用GAN来做的论文
【1】GAN在医学图像上的生成，今如何？
01-GAN公式简明原理之铁甲小宝篇

GAN&CV交流群，无论小白还是大佬，诚挚邀您加入！

一起讨论交流！长按备注【进群】加入：

更多分享、长按关注本公众号：

【Node.js】Express 框架及其基本使用详解 Peter-Lu #NodeJS node.js express javascript 前端 npm
文章目录一、Express概述1.Express是什么？2.为什么选择Express？二、安装与项目初始化1.环境准备2.初始化Express项目三、Express的基本使用1.创建一个简单的服务器2.路由管理3.使用中间件4.处理静态文件四、处理请求数据1.解析JSON数据2.解析URL编码的数据五、错误处理六、总结Express是Node.js生态中最受欢迎的web框架之一，广泛用于构建服务器
shell脚本部署俄罗斯方块 Leo0718 shell
#!/bin/bashAPP_NAME="${0##*[\\/]}"APP_VERSION="1.0"#颜色定义iSumColor=7#颜色总数cRed=1#红色cGreen=2#绿色cYellow=3#黄色cBlue=4#蓝色cFuchsia=5#紫红色cCyan=6#青色(蓝绿色)cWhite=7#白色#位置与大小marginLeft=3#边框左边距marginTop=2#边框上边距((map
STM32 RTC 功能详解与代码示例对error说不 stm32 实时音视频单片机
一、引言STM32微控制器的实时时钟（RTC）功能在许多应用中都非常重要，它允许设备保持精确的时间和日期信息，即使在系统断电或复位后，只要有备用电源（如锂电池）为RTC供电，就能继续运行。这对于需要时间戳、定时任务、日历功能以及其他需要精确时间信息的应用程序来说是必不可少的，例如数据记录系统、定时控制、事件调度等。二、STM32RTC概述STM32的RTC模块通常由一组时钟源、预分频器、计数器和闹
Java面试题汇总-集合篇+JUC篇泰山小张只吃荷园 java 哈希算法开发语言后端面试 spring boot
其他面试题Java面试题汇总-Java基础篇（共50道题）-CSDN博客Java集合目录1.请你说说java中hashmap的原理2.HashMap的put(key,value)和get(key)过程3.在使用hashmap时，有哪些提升性能的技巧？4.什么是哈希碰撞？怎么解决哈希碰撞？5.谈一谈hashmap的扩容操作？6.hashmap的初始容量和负载因子越大越好吗？7.为什么jdk1.8之后
Xbox：Xbox游戏编程入门_2024-07-19_20-02-54.Tex chenjj4003 游戏开发2 xbox 游戏 java 前端 ux
Xbox：Xbox游戏编程入门游戏开发环境搭建安装VisualStudio环境准备在开始Xbox游戏开发之前，首先需要一个强大的集成开发环境(IDE)，VisualStudio是微软提供的一个广泛使用的开发工具，它支持多种编程语言，包括C++，这是Xbox游戏开发的主要语言。下载与安装访问VisualStudio官方网站，下载最新版本的VisualStudio。在安装向导中，选择“创建游戏”工作负
nodejs后端ws与http结合共享一个服务器，前端websocket发送信息后端ws接收信息,使用Map定型数组设置ID cdcdhj nodejs http 服务器前端
//服务端代码consthttp=require('node:http');constWebSocket=require('ws');constserver=http.createServer();//创建websocket服务constwss=newWebSocket.WebSocketServer({server});//创建定型数组constclients=newMap();wss.on('
node.js中实现token的生成与验证小灰灰学编程 Node.js node.js token 前端
Token（令牌）是一种用于在客户端和服务器之间安全传输信息的加密字符串。在Web开发中，Token常用于身份验证和授权，确保用户能够安全地访问受保护的资源。作用与意义身份验证：Token可以用来验证用户的身份，确保用户已经通过认证流程。授权：通过Token，服务器可以识别用户的权限，从而允许或拒绝访问特定的资源。状态管理：在无状态（stateless）的API设计中，Token可以携带用户的状态
书籍推荐 —— UML和模式应用（原书第3版） blackcat王文俊心得体会 uml 分析设计
出版社：机械工业出版社ISBN：9787111186823版次：1商品编码：13745494品牌：机工出版包装：平装丛书名：软件工程技术丛书开本：16开出版时间：2022-06-01用纸：胶版纸页数：524内容简介■关于面向对象分析与设计及UML的经典之作。■全面升级到UML2和新的迭代/敏捷实践。■增加了全新的案例研究，阐述了大量关键思想。无论对于专业人士还是教师来说，本书都堪称经典之作。本书介
TypeScript 中的类型推断：提升代码安全与开发效率
TypeScript是JavaScript的超集，通过在代码中添加静态类型检查来提升代码的安全性和开发效率。在使用TypeScript时，理解和利用类型推断机制是至关重要的。类型推断可以减少显式类型注解的需求，从而提高代码的可读性和开发效率。本文将深入探讨TypeScript中的类型推断机制，常见的推断场景，以及如何在实际项目中有效利用这一特性。什么是类型推断？类型推断是指编译器自动推断出变量或表
华为OD机试E卷 - 空栈压数（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 python 华为od java javascript c语言 c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述向一个空栈压入正整数，每当压入一个整数时，执行以下规则（设:栈顶至栈底整数依次编号为n1,n2,…,nx，其中n1为最新压入的整数)如果n1=n2，则n1、n2全部出栈，压入新数据m(m=2*n1)如果n1=n2+…+ny(y的范围为[3,x])，则n1,n2,…,ny全部出栈，压入新数据m(m=2*n1)。如果上述规
大数据新视界 -- 大数据大厂之 Hive 数据压缩算法对比与选择（下）（20 / 30）青云交大数据新视界 #Hive 之道大数据 Hive 数据压缩压缩算法对比选择因素案例分析实时数据处理数据存储优化 sql
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
大数据新视界 --大数据大厂之数据脱敏技术在大数据中的应用与挑战青云交大数据新视界大数据数据脱敏发展现状应用场景挑战解决方案未来趋势
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
大数据新视界 --大数据大厂之AI 与大数据的融合：开创智能未来的新篇章青云交大数据新视界 AI&人工智能大数据人工智能智能环保智能教育智能农业 ChatGPT 智能能源数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
从RNN到Transformer：生成式AI技术演变与未来展望非著名架构师人工智能 rnn transformer
生成式人工智能（GenerativeAI）近年来取得了令人瞩目的进展，其背后的核心技术是自回归模型的不断演进。从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。一、RNN：生成式模型的起点1.RNN的基本原理递归神经网络（RecurrentNeuralNetwork,RNN）是一种专为处理序列数据设计的神经网络架构。其核心思想是通过循环连接的隐藏状
开源多模态推理模型QVQ：视觉推理能力的突破与未来展望前端
近年来，AI代码生成器等人工智能技术飞速发展，多模态推理模型作为其中一个重要分支，正展现出越来越强大的能力。它能够理解和处理多种类型的数据，例如图像、文本、音频等，并进行复杂的推理和决策。阿里云通义千问团队近日发布的QVQ-72B-Preview模型，就是一个极具代表性的例子。该模型开源且在视觉推理方面表现突出，为多模态模型的发展树立了新的里程碑。QVQ模型的核心能力与突破QVQ-72B-Prev
PyTorch建模与应用：从深度学习到大模型屿小夏书籍推荐深度学习 pytorch 人工智能
文章目录一、内容简介二、值得一读1.从基础到深入，适合不同层次的读者2.丰富的实战案例3.全面的数据处理与模型构建三、适用人群1.AI技术初学者2.在校学生和从业者3.培训机构和高校教学四、总结一、内容简介《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度
会捡垃圾、能干家务，元萝卜“视觉+机械臂”技术扫地机器人首秀量子位
在2025开年科技盛宴CES（国际消费电子展）上，AI机器人无疑成为全场焦点，而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用，更获得了全球媒体的高度关注。通过将视觉感知与机械臂技术相结合，能够自主完成拾取垃圾入桶等任务，不仅展示了家用机器人发展的未来形态，也让大众看到了具身智能机器人融入家庭生活的广阔前景。随着大模型技术和具身智能浪潮汹涌而至，家用机器人正迎来全新发
Java基础：Iterator迭代器重生之Java开发工程师 java 开发语言
一、什么是Iterator：迭代器(Iterator)是一个对象，它的工作是遍历并目标序列中的对象，它提供了一种访问一个容器(container)对象中的各个元素的方法，把访问逻辑从不同类型的集合类中抽象出来，又不必暴露该对象内部细节。通过迭代器，开发人员不需要了解容器底层的结构，就可以实现对容器的遍历。由于创建迭代器的代价小，因此迭代器通常被称为轻量级的容器。常常使用JDK提供的迭代接口进行Ja
圈子交友app小程序公众号/圈子社群创建必须要注意的几个点
技术选型与平台搭建技术选型：根据需求选择合适的开发技术和框架。例如，对于跨平台应用，可以考虑使用vue、uniapp等前端框架；后端则可以选择php等组合，以保证数据处理的效率和安全性。平台搭建：搭建稳定、易用、美观的App、小程序或公众号平台。注重用户体验，确保界面简洁、操作流畅。用户体验优化界面设计：注重UI/UX设计，确保界面美观、简洁、易用。这有助于提升用户的满意度和忠诚度。交互流程：优化
中小企业在选任务管理工具时，怎样确保提升团队效能？团队管理团队协作
在当今竞争激烈的商业环境中，中小企业面临着诸多挑战，如何高效管理任务、提升团队效能成为企业发展的关键。选择一款合适的任务管理工具，能够帮助中小企业优化工作流程、增强团队协作，从而在市场中占据更有利的地位。接下来，我们将深入探讨如何挑选适合中小企业的任务管理工具。一、中小企业任务管理现状与痛点（一）管理方式粗放许多中小企业在任务管理上仍采用较为传统和粗放的方式，如通过口头传达、简单的纸质记录或基础的
密码机服务器在云计算中的应用与挑战 SafePloy安策服务器云计算运维
随着云计算技术的迅猛发展和普及，密码机服务器作为一种高效、专业的数据安全解决方案，正在云计算领域中扮演着越来越重要的角色。本文将探讨密码机服务器在云计算中的应用及其面临的挑战。云计算技术涉及大量的数据传输和存储，数据的安全性和隐私性是一大挑战。密码机服务器，作为数据安全的核心设备，通过先进的加密算法和高速处理芯片，为服务器上的数据提供高强度、实时的加密解密服务。与传统的软件加密相比，硬件级别的加密
现场签约！YashanDB加入国家新一代自主安全计算系统产业集群数据库sql运维服务器
现场签约!YashanDB加入国家新一代自主安全计算系统产业集群12月11日，在2024第二届国家新一代自主安全计算系统产业集群融通生态大会上，深圳计算科学研究院(简称：深算院)与长沙市国链安全可靠计算机产业促进中心(简称：国链中心)共同签署了自主安全计算项目合作协议，崖山数据库作为国产数据库厂商代表，加入国家新一代自主安全计算系统产业集群。国家新一代自主安全计算系统产业集群全面贯彻落实国家“两个
手把手教你学simulink（79.1）--智能家居窗帘与窗户控制场景实例：基于Simulink设计和仿真一个智能窗帘与窗户控制系统，以实现对室内环境的有效管理小蘑菇二号手把手教你学 MATLAB 专栏手把手教你学 Simulink matlab simulink
目录智能窗帘与窗户控制系统场景下的天气适应性操作建模项目实例项目背景介绍系统架构1.传感器模块(Sensors)2.控制器模块(Controller)3.执行器模块(Actuator)4.通信模块(Communication)仿真实现步骤1.创建新的Simulink模型2.添加传感器模块光照传感器温度传感器天气传感器在Simulink中实现传感器模块3.添加控制器模块天气分析算法决策算法在Simu
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络盼小辉丶遗传算法与深度学习实战深度学习 keras cnn
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络0.前言1.卷积神经网络基本概念1.1卷积1.2步幅1.3填充1.4激活函数1.5池化2.使用Keras构建卷积神经网络3.CNN层的问题4.模型泛化小结系列链接0.前言卷积神经网络(ConvolutionalNeuralNetwork,CNN)的提出是为了解决传统神经网络的缺陷。即使对象位于图片中的不同位置或其在图像中具有不同占比，
万字长文，k8s之父带你阅读 deployment 源码 go
4.3deploymentcontroller01DeploymentController是Kube-Controller-Manager中最常用的Controller之一管理Deployment资源。而Deployment的本质就是通过管理ReplicaSet和Pod在Kubernetes集群中部署无状态Workload。Deployment与控制器模式在K8s中，pod是最小的资源单位，而po
202501015 C18298182575 数据库
为什么不遵循最左匹配原则会导致索引失效最左匹配原则原因为什么不遵循最左匹配原则会导致索引失效最左匹配原则原因_mob6454cc7a6087的技术博客_51CTO博客java事物失效原因Spring事务@Transactional常见的8种失效场景（通俗易懂）_事务失效的8大场景-CSDN博客sql优化方案sql优化的15个小技巧（必知五颗星），面试说出七八个就有了_sql优化常用的15种方法-C
仓库管理优化的四个要点 wms系统wms
仓库管理是一个涵盖多个步骤且操作复杂的流程，从货物的入库、存储到出库，每一步都需要精心策划与高效执行。那么，在关注仓库管理时，我们应聚焦于哪些核心要素呢？01库存准确性与出入库效率仓库管理的核心在于两点：库存的准确性和出入库的高效准确性。然而，许多仓库在实际操作中往往难以达到这一标准。库存数据的不准确，往往导致财务报表上的数字与实际库存存在偏差。例如，有的五金仓库虽然生意兴隆，业绩增长迅速，但老板
MYSQL数据库基础奋斗的小鸟~ mysql数据库数据库 mysql
目录一、数据库的基本概念1、数据库的组成1.数据2.表3.数据库2、数据库管理系统(DBMS)1.数据库管理系统介绍2.BMS主要包括以下功能：3、数据库系统原理(DBS)4、DBMS的工作模式二、数据库系统发展史1、第一代数据库(人工管理)2、第二代数据库（文件管理）3、第三代数据库（数据库系统管理）4、发展的三个阶段三、当今主流的数据库SQLServer(微软公司产品)Oracle（甲骨文公司
深入解析Vue.js组件开发：从基础到进阶冷夜雨. vue.js
Vue.js作为一款渐进式的JavaScript框架，其独特的设计理念和易用性使得它在现代前端开发中占据了重要地位。Vue组件是Vue.js中最核心的组成部分，它是构建应用的基础单元，也是Vue项目模块化和重用的关键所在。在这篇文章中，我们将深入探讨Vue.js的组件开发，涵盖从基础到进阶的各个方面，包括组件的创建、通信、生命周期、性能优化等内容，帮助你掌握Vue组件开发的核心技巧。一、Vue组件
编程语言大揭秘：各显神通的编程世界冷夜雨. python java c++c#javascript
在当今数字化的时代，编程语言犹如一把把神奇的钥匙，打开了通往不同技术领域的大门。从网页开发到人工智能，从数据分析到游戏制作，每一种编程语言都有其独特的优势与适用场景。今天，就让我们一同深入探索几种主流编程语言的奥秘，看看在什么情况下它们能发挥最大的威力。Python：万能胶水，快速开发的利器Python以其简洁、易读的语法著称，仿佛是用自然语言编写代码一般，新手程序员也能快速上手。它拥有庞大且丰富
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc