sooner高

PyTorch学习笔记(10)——上采样和PixelShuffle

去年曾经使用过FCN（全卷积神经网络）及其派生Unet，再加上在爱奇艺的时候做过一些超分辨率重建的内容，其中用到了毕业于帝国理工的华人博士Shi Wenzhe（在Twitter任职）发表的PixelShuffle《Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
》的论文。PyTorch 0.4.1将这些上采样的方式定义为Vision Layers，现在对这4种在PyTorch中的上采样方法进行介绍。

0. 什么是上采样？

上采样，在深度学习框架中，可以简单的理解为**任何可以让你的图像变成更高分辨率的技术。**最简单的方式是重采样和插值：将输入图片input image进行rescale到一个想要的尺寸，而且计算每个点的像素点，使用如双线性插值bilinear等插值方法对其余点进行插值。

Unpooling是在CNN中常用的来表示max pooling的逆操作。这是从2013年纽约大学Matthew D. Zeiler和Rob Fergus发表的《Visualizing and Understanding Convolutional Networks》中引用的：因为max pooling不可逆，因此使用近似的方式来反转得到max pooling操作之前的原始情况：

记住max pooling做的时候的size，比如下图的一个4x4的矩阵，max pooling的size为2x2，stride为2，反卷积操作需要记住最大值的位置，将其余位置至为0就行。

Deconvolution(反卷积)在CNN中常用于表示一种反向卷积，但它并不是一个完全符合数学规定的反卷积操作。

与Unpooling不同，使用反卷积来对图像进行上采样是可以习得的。通常用来对卷积层的结果进行上采样，使其回到原始图片的分辨率。
反卷积也被称为分数步长卷积(convolution with fractional strides)或者转置卷积(transpose convolution)或者后向卷积backwards strided convolution。
真正的反卷积如wikipedia里面所说，但是不会有人在实际的CNN结构中使用它。

1. `Vision Layer`

在PyTorch中，上采样的层被封装在torch.nn中的Vision Layers里面，一共有4种：

① PixelShuffle
② Upsample
③ UpsamplingNearest2d
④ UpsamplingBilinear2d

下面，将对其分别进行说明

1.1 PixelShuffle

正常情况下，卷积操作会使feature map的高和宽变小。

但当我们的stride= $\frac{1}{r} < 1$ 时，可以让卷积后的feature map的高和宽变大——即分辨率增大，这个新的操作叫做sub-pixel convolution，具体原理可以看PixelShuffle《Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
》的论文。

pixelshuffle算法的实现流程如上图，其实现的功能是：将一个H × W的低分辨率输入图像（Low Resolution），通过Sub-pixel操作将其变为rH x rW的高分辨率图像（High Resolution）。

但是其实现过程不是直接通过插值等方式产生这个高分辨率图像，而是通过卷积先得到 $r^2$ 个通道的特征图（特征图大小和输入低分辨率图像一致），然后通过周期筛选（periodic shuffing）的方法得到这个高分辨率的图像，其中 $r$ 为上采样因子（upscaling factor），也就是图像的扩大倍率。

定义

该类定义如下：

class torch.nn.PixleShuffle(upscale_factor)

这里的upscale_factor就是放大的倍数，数据类型为int。
以四维输入(N,C,H,W)为例，Pixelshuffle会将为(∗, $r^2C$ ,H,W)的Tensor给reshape成(∗,C,rH,rW)的Tensor。形式化地说，它的输入输出的shape如下：

输入: (N,C x upscale_factor $^2$ ,H,W)
输出: (N,C,H x upscale_factor,W x upscale_factor)

例子

>>> ps = nn.PixelShuffle(3)
>>> input = torch.tensor(1, 9, 4, 4)
>>> output = ps(input)
>>> print(output.size())
torch.Size([1, 1, 12, 12])

怎么样，是不是看起来挺简单的？我将在最后完整的介绍一下1）转置卷积 2）sub-pixel 卷积
3）反卷积以及pixelshuffle这几个知识点。

1.2 Upsample（新版本中推荐使用`torch.nn.functional.interpolate`）

对给定多通道的1维（temporal）、2维（spatial）、3维（volumetric）数据进行上采样。

对volumetric输入（3维——点云数据），输入数据Tensor格式为5维：minibatch x channels x depth x height x width
对spatial输入（2维——jpg、png等数据），输入数据Tensor格式为4维：minibatch x channels x height x width
对temporal输入（1维——向量数据），输入数据Tensor格式为3维：minibatch x channels x width

此算法支持最近邻，线性插值，双线性插值，三次线性插值对3维、4维、5维的输入Tensor分别进行上采样（Upsample）。

定义

该类定义如下：

class torch.nn.Upsample(size=None, scale_factor=None, mode='nearest', align_corners=None)

其中：

size 是要输出的尺寸，数据类型为tuple： ([optional D_out], [optional H_out], W_out)
scale_factor 在高度、宽度和深度上面的放大倍数。数据类型既可以是int——表明高度、宽度、深度都扩大同一倍数；亦或是tuple——指定高度、宽度、深度的扩大倍数。
mode 上采样的方法，包括最近邻（nearest），线性插值（linear），双线性插值（bilinear），三次线性插值（trilinear），默认是最近邻（nearest）。
align_corners 如果设为True，输入图像和输出图像角点的像素将会被对齐（aligned），这只在mode = linear, bilinear, or trilinear才有效，默认为False。

例子

>>> input = torch.arange(1, 5).view(1, 1, 2, 2).float()
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='nearest')
>>> m(input)
tensor([[[[ 1.,  1.,  2.,  2.],
          [ 1.,  1.,  2.,  2.],
          [ 3.,  3.,  4.,  4.],
          [ 3.,  3.,  4.,  4.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> m(input)
tensor([[[[ 1.0000,  1.2500,  1.7500,  2.0000],
          [ 1.5000,  1.7500,  2.2500,  2.5000],
          [ 2.5000,  2.7500,  3.2500,  3.5000],
          [ 3.0000,  3.2500,  3.7500,  4.0000]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> m(input)
tensor([[[[ 1.0000,  1.3333,  1.6667,  2.0000],
          [ 1.6667,  2.0000,  2.3333,  2.6667],
          [ 2.3333,  2.6667,  3.0000,  3.3333],
          [ 3.0000,  3.3333,  3.6667,  4.0000]]]])

>>> # Try scaling the same data in a larger tensor
>>>
>>> input_3x3 = torch.zeros(3, 3).view(1, 1, 3, 3)
>>> input_3x3[:, :, :2, :2].copy_(input)
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
>>> input_3x3
tensor([[[[ 1.,  2.,  0.],
          [ 3.,  4.,  0.],
          [ 0.,  0.,  0.]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> # Notice that values in top left corner are the same with the small input (except at boundary)
>>> m(input_3x3)
tensor([[[[ 1.0000,  1.2500,  1.7500,  1.5000,  0.5000,  0.0000],
          [ 1.5000,  1.7500,  2.2500,  1.8750,  0.6250,  0.0000],
          [ 2.5000,  2.7500,  3.2500,  2.6250,  0.8750,  0.0000],
          [ 2.2500,  2.4375,  2.8125,  2.2500,  0.7500,  0.0000],
          [ 0.7500,  0.8125,  0.9375,  0.7500,  0.2500,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000,  0.0000,  0.0000]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> # Notice that values in top left corner are now changed
>>> m(input_3x3)
tensor([[[[ 1.0000,  1.4000,  1.8000,  1.6000,  0.8000,  0.0000],
          [ 1.8000,  2.2000,  2.6000,  2.2400,  1.1200,  0.0000],
          [ 2.6000,  3.0000,  3.4000,  2.8800,  1.4400,  0.0000],
          [ 2.4000,  2.7200,  3.0400,  2.5600,  1.2800,  0.0000],
          [ 1.2000,  1.3600,  1.5200,  1.2800,  0.6400,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000,  0.0000,  0.0000]]]])

1.3 UpsamplingNearest2d

本质上其实就是对jpg、png等格式图像数据的Upsample(mode='nearest')。

定义

 class torch.nn.UpsamplingNearest2d(size=None, scale_factor=None)

输入输出：

例子

>>> input = torch.arange(1, 5).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])

>>> m = nn.UpsamplingNearest2d(scale_factor=2)
>>> m(input)
tensor([[[[ 1.,  1.,  2.,  2.],
          [ 1.,  1.,  2.,  2.],
          [ 3.,  3.,  4.,  4.],
          [ 3.,  3.,  4.,  4.]]]])

1.4 UpsamplingBilinear2d

跟1.3类似，本质上其实就是对jpg、png等格式图像数据的Upsample(mode='bilinear')。

定义

 class torch.nn.UpsamplingBilinear2d(size=None, scale_factor=None)

输入输出：

例子

>>> input = torch.arange(1, 5).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])

>>> m = nn.UpsamplingBilinear2d(scale_factor=2)
>>> m(input)
tensor([[[[ 1.0000,  1.3333,  1.6667,  2.0000],
          [ 1.6667,  2.0000,  2.3333,  2.6667],
          [ 2.3333,  2.6667,  3.0000,  3.3333],
          [ 3.0000,  3.3333,  3.6667,  4.0000]]]])

2. 知识回顾

本段主要转自《一边Upsample一边Convolve：Efficient Sub-pixel-convolutional-layers详解
》

2.1 Transposed convolution(转置卷积)

下面以一维向量进行卷积为例进行说明（stride=2），x为输入y为输出，通过1维卷积核/滤波器f来实现这个过程，x的size为8，f为[1, 2, 3, 4]，y为5，x中灰色的方块表示用0进行padding。在f权重中的灰色方块代表f中某些值与x中的0进行了相乘。下图就是1维卷积的过程，从x到y。

容易地，可以发现1维卷积的方式很直观，那么什么是转置卷积呢？故名思意，就是将卷积倒过来：

如上图所示，1维卷积核/滤波器被转过来了，这里进行一下额外的说明：
假设x = [ $x_1$ , $x_2$ , …, $x_5$ ]，y = [ $y_1$ , $y_2$ , …, $y_{12}$ ]，则最上面的白色块体对应的是 $y_3$ 。那么：
$y_3$ = $3x_1 + x_2$

2.2 Sub-pixel convolution

还是以一维卷积为例，输入为x = [ $x_1$ , $x_2$ , …, $x_5$ ]，输出为y = [ $y_1$ , $y_2$ , …, $y_{12}$ ]。sub-pixel convolution（stride=1/2）如图：

在1.1 PixelShuffle中说过，sub-pixel convolution的步长是介于0到1之间的，但是这个操作是如何实现的呢？简而言之，分为两步：

① 将stride设为1
② 将输入数据dilation(以stride=1/2为例，sub-pixel是将输入x的元素之间插入一些元素0，并在前后补上一些元素0)，或者说根据分数索引（fractional indices）重新创建数据的排列形式。

2.3 Deconvolution

这里以2维卷积来进行演示，输入一个4 x 4的单通道图像，卷积核取1个4 x 4的，假设这里取上采样比例为2，那么我们的目标就是恢复成一个8 x 8的单通道图像。

如上图，我们首先通过fractional indices从原input中创建一个sub-pixel图像，其中白色的像素点就是原input中的像素（在LR sapce中），灰色像素点则是通过zero padding而来的。

用一个4 x 4的卷积核来和刚才生成的sub-pixel图像进行stride=1的卷积，首先发现卷积核和sub-pixel图像中非零的像素进行了第一次有效卷积（图中紫色像素代表被激活的权重），然后我们将sub-pixels整体向右移动一格，让卷积核再进行一次卷积操作，会发现卷积核中蓝色像素的权重被激活，同理绿色和红色（注意这里是中间的那个8×8的sub-pixel图像中的白色像素点进行移动，而每次卷积的方式都相同）。

最后我们输出得到8 x 8的高分辨率图像（HR图像），HR图像和sub-pixel图像的大小是一致的，我们将其涂上颜色，颜色代表卷积核中权重和sub-pixel图像中哪个像素点进行了卷积（也就是哪个权重对对应的像素进行了贡献）。

Deconvlution的动态过程可见我之前翻译过的一篇文章《CNN概念之上采样，反卷积，Unpooling概念解释》

显然，我们可以看出，紫、蓝、绿、红四部分是相互独立的，那么，可以将这个4 x 4的卷积核分成4个2 x 2的卷积核如下：

注意，这个操作是可逆的。因为每个卷积权重在操作过程中都是独立的。

因此，我们可以直接对原始图像（未经过sub-pixel处理）直接进行2 x 2的卷积，并对输出进行周期筛选（periodic shuffling）来得到同样的8 x 8的高分辨率图像。

3. 说明

在新版本PyTorch中，这些插值Vision Layer都不推荐使用了，官方的说法是将其放在了torch.nn.functional.interpolate中，用此方法可以更个性化的定制用户的上采样或者下采样的需求。

4. 参考资料

[1] 一边Upsample一边Convolve：Efficient Sub-pixel-convolutional-layers详解
[2] 双线性插值(Bilinear Interpolation)
[3] torch.nn.functional.interpolate说明
[4] PyTorch 0.4.1——Vision layers

你可能感兴趣的:(算法,深度学习,PyTorch,PyTorch框架学习)

基于深度学习YOLOv8的海洋动物检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 目标检测人工智能开发语言
引言近年来，计算机视觉技术在各行各业中得到了广泛的应用，特别是在智能监控、自动驾驶、医疗诊断等领域。深度学习，尤其是卷积神经网络（CNN）的出现，极大地提高了计算机处理图像和视频的能力。在这一领域，YOLO（YouOnlyLookOnce）系列模型以其高效且准确的目标检测能力，成为了当下最为流行的深度学习模型之一。在海洋生物保护、海洋环境监测等应用中，快速识别和检测海洋动物种类对于科学研究和保护工
基于YOLOv5深度学习的木材表面缺陷检测系统：UI界面 + YOLOv5 + 数据集详细教程深度学习&目标检测实战项目 YOLO 深度学习 ui YOLOv5 人工智能计算机视觉
随着工业自动化的发展，木材加工行业对产品质量的要求日益提高。木材表面缺陷的检测是确保产品质量的重要环节。传统的人工检测方式不仅费时费力，而且容易受到人为因素的影响。基于深度学习的目标检测技术，尤其是YOLOv5，凭借其优越的实时性和准确性，成为木材表面缺陷检测的有效工具。本博客将详细介绍如何构建一个基于YOLOv5的木材表面缺陷检测系统，包括数据集准备、模型训练、UI界面开发及完整代码实现。目录目
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案） lusterku 动手学深度学习深度学习笔记线性回归
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案）线性回归的从零开始实现生成数据集读取数据集初始化模型参数定义模型定义损失函数定义优化算法训练练习1.如果我们将权重初始化为零，会发生什么。算法仍然有效吗？2.计算二阶导数时可能会遇到什么问题？这些问题可以如何解决？3.为什么在`squared_loss`函数中需要使用`reshape`函数？4.尝试使用不同的学习率，观察损失函数值下
Meta2d.js：2D图元组成的可视化引擎乐吾乐科技 2D可视化组态编辑器 vue.js 编辑器前端数据可视化 html
Meta2d.js：2D图元组成的可视化引擎。由乐吾乐科技自主研发，集实时数据展示、动态交互、数据管理等一体的全功能2D可视化引擎。【注意】Meta2d.js是一个不依赖任何前端框架的js图形引擎。使用Meta2d.js可以简单快速的开发自己的Web组态、Scada、智慧大屏的可视化产品，也可以开发类似Visio等的流程图、脑图等工具。Meta2d.js内置实时监控、动态交互、自动算法、可扩展等功
发文新思路！双通道CNN的惊人突破，准确率接近100%！沃恩智慧深度学习人工智能 cnn 人工智能神经网络
双通道CNN作为一种创新的卷积神经网络架构，正引领深度学习领域的新趋势。其核心优势在于并行卷积层设计，能够同时处理更多特征信息，从而显著提升模型的特征表示能力和识别精度。这种架构不仅提高了计算效率，还有效降低了过拟合风险，使其在复杂视觉任务中表现卓越。例如，最新的研究提出了一种名为DDTransUNet的混合网络，结合了Transformer和CNN的优势，通过双分支编码器和双重注意力机制，有效解
简单枚举 / 枚举排列 Zhouqi_Hua Henry学C++Henry的ACM学习笔记蓝桥杯 c++算法深度优先力扣
本文参考《算法竞赛入门经典》第七章《暴力枚举法》，提出的是暴力“列举”出所有可能性并一一试验的方法。目录1简单枚举2枚举排列2.1生成1~n的排列2.2生成可重集的排列2.3解答树2.4下一个排列一、简单枚举简单枚举就是枚举一些例如整数、子串的简单类型。但是如果拿到题目直接上手枚举，可能会导致枚举次数过多（甚至引起TLE）。因此在枚举前先要进行分析。比如例题除法（Division，Uva725）：
水下 SLAM 定位模组的设计与实现赵谨言论文经验分享毕业设计笔记
标题:水下SLAM定位模组的设计与实现内容:1.摘要摘要：本文介绍了水下SLAM定位模组的设计与实现。首先，对水下定位技术的背景和需求进行了分析。然后，详细阐述了模组的设计思路和关键技术，包括传感器选型、数据融合算法等。接着，介绍了模组的实现过程和实验结果，通过实际测试验证了模组的性能和可靠性。最后，对未来的研究方向进行了展望。关键词：水下SLAM；定位模组；传感器；数据融合2.引言2.1.研究背
基于Python实现的缓存淘汰替换策略算法，该算法将缓存分区 go5463158465 算法 python python 缓存算法
以下是一个基于Python实现的缓存淘汰替换策略算法，该算法将缓存分区，并根据不同分区的优先级进行淘汰，同时会自适应地调整缓存汰换的时机和力度，还会与GPTCache自带的LRU和FIFO策略进行对比。importtimefromgptcache.managerimportCacheBase,VectorBase,get_data_managerfromgptcache.processor.pre
技术面 - 手撕算法题整理程序员阿甘华为OD算法刷题笔记华为校招算法刷题笔记算法
LeetCode原题刷题策略：优先刷"hot100"的题目，其次"刷频次高"的题目，最后再刷剩余的题目编号频次难度hot100
数据结构与算法篇--时间复杂度推导思路 haoly1989 数据结构与编程技术算法数据结构
重点提示：时间复杂度是输入规模的函数时间复杂度等于基本操作计数思路1：渐近复杂度计算速度输入规模丢掉低阶项和常系数计算成本--------->运行时间--------->时间复杂度------------------>渐近时间复杂度关注点变化：绝对运行时间->运行时间的变化趋势->运行时间在大规模输入下的变化趋势好处：丢掉低阶项和常系数就是去除硬件、编译器、操作系统等次要因素的影响。思路2：认识时
当 LSTM 遇上 ARIMA！！奋进小青人工智能
大家好，我是小青ARIMA和LSTM是两种常用于时间序列预测的模型，各有优劣。ARIMA擅长捕捉线性关系，而LSTM擅长处理非线性和长时间依赖的关系。将ARIMA和LSTM融合，可以充分发挥它们各自的优势，构建更强大的时间序列预测模型。ARIMA算法ARIMA是一种经典的时间序列预测方法，适用于捕捉时间序列数据中的线性趋势和季节性模式。它通过整合自回归(AR)、差分(I)、移动平均(MA)三部分，
【LeetCode Hot100 子串】和为 k 的子数组、滑动窗口最大值、最小覆盖子串落啦啦数据结构与算法 leetcode 算法数据结构
子串1.和为k的子数组题目描述解题思路主要思路步骤时间复杂度与空间复杂度代码实现2.滑动窗口最大值题目描述解题思路双端队列的原理：优化步骤：Java实现3.最小覆盖子串题目描述解题思路滑动窗口的基本思路：具体步骤：算法的关键点：Java实现1.和为k的子数组题目描述给定一个整数数组nums和一个整数k，你需要在数组中找到连续子数组的个数，使得这些子数组的和等于k。解题思路我们可以通过前缀和的方法来
PyTorch Lightning LightningDataModule 介绍 qq_27390023 pytorch 人工智能 python
LightningDataModule是PyTorchLightning提供的数据模块，用于统一管理数据加载流程（包括数据准备、预处理、拆分、批量加载等）。它的核心作用是将数据处理逻辑与模型解耦，提高代码的可复用性和可读性。1.LightningDataModule的作用✅封装数据预处理：数据下载、清理、转换等步骤都可以在LightningDataModule中完成。✅统一数据加载流程：确保训练、
代码随想录算法训练营第三天 | 链表理论基础，203.移除链表元素，707.设计链表，206.反转链表白鹭鸣鸣！算法链表数据结构 java
代码随想录算法训练营第三天|链表理论基础，203.移除链表元素，707.设计链表，206.反转链表203.移除链表元素给你一个链表的头节点head和一个整数val，请你删除链表中所有满足Node.val==val的节点，并返回新的头节点。示例1：输入：head=[1,2,6,3,4,5,6],val=6输出：[1,2,3,4,5]示例2：输入：head=[],val=1输出：[]示例3：输入：he
【笔记】使用 Pytorch 进行分布式训练 LittleNyima 人工智能深度学习 pytorch 分布式
本文原文以CCBY-NC-SA4.0许可协议发布于技术相关｜使用Pytorch进行分布式训练，转载请注明出处。其实Pytorch分布式训练已经不算什么新技术了，之所以专门写一篇blog是因为今天训模型的时候出现了一个没见过的问题，在调试的时候发现自己平时都是用别人写好的分布式代码，没有深入研究过其中的实现细节，因此感觉有必要整理吸收一下。最简单的数据并行作为最简单的并行计算方式，使用nn.Data
实验随记2-Pytorch Lightning多机多卡训练晓岚和雪实验随记 pytorch 人工智能 python 深度学习分布式
本文章主要收录笔者在阅读时发现的一些比较优质的多机多卡训练教程~~，由于pytorchLightning多机多卡示例很少，因此需要等笔者最近做完实验验证后才能更新示例。不断完善中…~~及多机多卡训练细节。任务需求：实现多机多卡训练，模型可能继承torch.nn或者torch.lightning。示例实现5节点4GPU共计20卡训练。使用pytorch_lightning==1.9.4存在bug:启
PyTorch Lightning多GPU分布式日志介绍 qq_27390023 pytorch 人工智能 python
分布式日志是指在分布式系统中，多个节点（如多台机器或多个GPU）协同工作时，对系统运行状态、错误信息、性能指标等进行记录的过程。在多GPU/分布式训练环境下，多个进程会同时运行，普通的print()或logging可能会在所有GPU上重复输出，导致日志混乱。PyTorchLightning提供了一些分布式日志控制工具，确保日志仅在rank0进程打印，防止重复输出。lightning_utiliti
mysql sql脚本雪花算法梦空细雨 mysql sql 数据库
算法相关学习资料：https://edu.51cto.com/video/1451.html雪花算法在MySQLSQL脚本中的实现作为一名经验丰富的开发者，我将指导你如何实现MySQLSQL脚本中的雪花算法。雪花算法是一种生成唯一ID的算法，广泛应用于分布式系统中。雪花算法流程首先，我们通过一个表格来展示雪花算法的实现流程：步骤描述1创建雪花算法表2插入初始数据3生成唯一ID4使用唯一ID雪花算法
mysql版雪花算法_雪花算法如何生成id Pink-Champaign mysql版雪花算法
雪花算法生成id的方法：首先新建一个id生成的类；然后新建一个调用生成id的单例工具；最后使用函数【GuuidUtil.getUUID()】直接调用即可。【相关学习推荐：雪花算法生成id的方法：1、新建一个id生成的类SnowFlake/***@Auther:lyl*@Date:2019/11/2117:49*@Description:*/publicclassSnowFlake{/***起始的时
超级实用！一个基于python的简化版深度学习框架，包括深度学习神经网络的设计和深度学习模型的设计，适用于中小型项目的开发和实现大懒猫软件深度学习 python 神经网络 numpy pytorch 人工智能
一、运用Python技术开发深度学习框架需要具备的基础知识总结开发一个基于Python的深度学习框架是一个复杂的任务，需要具备多方面的基础知识。以下是一些关键领域的总结，帮助你更好地准备和理解开发深度学习框架所需的知识。1.Python编程基础语法和数据结构：掌握Python的基本语法、数据类型（如列表、字典、元组等）和控制流（如循环、条件语句等）。函数和模块：理解函数的定义和使用，以及如何组织代
排序算法整理（冒泡排序、选择排序、插入排序、希尔排序、快速排序、堆排序、计数排序、桶排序、基数排序） Fansv587 排序算法算法数据结构 python
排序算法是计算机科学中用于将数据元素按照特定顺序进行排列的算法，常见的排序算法有以下几类：比较排序冒泡排序：通过重复地走访要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。选择排序：首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排
动态规划之背包问题（01背包，完全背包，多重背包，分组背包） Fansv587 动态规划算法经验分享 python
0、1背包问题概述0-1背包问题是一个经典的组合优化问题，属于动态规划算法的典型应用场景。该问题描述如下：有一个容量为C的背包，以及n个物品，每个物品有对应的重量wiw_iwi和价值vi(i=1,2...n)v_i(i=1,2...n)vi(i=1,2...n)。对于每个物品，我们只有两种选择：要么将其放入背包，要么不放入，即“0-1”选择（选是1，不选是0）。目标是在不超过背包容量的前提下，选择
WebP2P+自研回音消除：视频通话SDK嵌入式EasyRTC构建高交互性音视频应用 Likeadust 音视频 p2p WebP2P webrtc
随着移动互联网时代的到来，手机端的扬声器大多采用外置设计，且音量较大。在这种情况下，扬声器播放的声音更容易被麦克风捕捉，从而导致回声问题显著加剧。这种设计虽然方便用户在免提模式下使用，但也带来了更复杂的音频处理挑战。回音消除算法的核心在于从麦克风采集的混合信号中分离出原始语音信号和回声信号，并将回声信号从混合信号中移除。EasyRTC采用的自研算法基于以下几种技术：自适应滤波器：通过实时调整滤波器
Python中的决策树算法探索 Soft_Leader 算法 python 决策树
在Python中，决策树算法是一种常用的机器学习技术，用于分类和回归问题。下面我们将探索如何使用Python中的scikit-learn库来实现决策树算法，并简要介绍其基本概念和用法。1.安装必要的库如果你还没有安装scikit-learn库，你可以使用pip来安装它：bash复制代码pipinstall-Uscikit-learn2.导入必要的库和模块python复制代码fromsklearn.
详解AI作画算法原理 Jimaks 后端 AI python ai作画 python 人工智能
在艺术与科技的交汇处，AI作画正以惊人的创造力刷新着我们对美的认知。这一领域融合了深度学习、计算机视觉和生成模型的前沿技术，让机器能够“想象”并创作出令人惊叹的图像。本文将深入浅出地探讨AI作画的核心算法原理，分析常见问题与易错点，并通过一个简单的代码示例，带领大家一窥AI艺术创作的奥秘。一、核心概念与原理1.生成对抗网络（GANs）GANs是AI作画中最著名的算法之一，由IanGoodfello
用大模型学大模型02-数学基础微积分 wyg_031113 人工智能
https://metaso.cn/s/uxPBB9C我正在学习深度学习相关的数学知识,学到了微积分核心概念：导数（尤其是偏导数）、梯度、链式法则；积分与最优化（如梯度下降法的数学推导）给我一个入门级的完整教程和实例好吧，我现在需要帮用户整理一个关于深度学习中微积分核心概念的入门教程和实例。用户提到了导数、偏导数、梯度、链式法则，还有积分和优化比如梯度下降法。我得先理清楚这些概念之间的联系，然后结
用大模型学大模型03-数学基础概率论 wyg_031113 概率论人工智能
https://metaso.cn/s/Jp0OU9w提示词:我正在学习深度学习相关的数学知识，学到了概率论与统计学部分，给我一个入门级的完整教程和实例。好的，我现在需要回答用户关于深度学习所需的概率论与统计学入门教程和实例的问题。用户希望得到一个完整的教程和实例，所以我要从我搜索到的资料中整理出相关的知识点和学习路径，并结合实例说明。首先，查看证据中的相关内容。提到花书学习笔记，涵盖了概率论、信
Xlua中C#引用Lua变量，导致Lua侧的GC无法回收的原因及解决方法浅陌sss 知识点记录 c#lua
1.引用关系导致：在XLua中，当C#端引用了Lua变量时，Lua的垃圾回收器（GC）不会回收这些被引用的变量。这是因为Lua的GC机制是基于引用计数和标记-清除算法的。当C#端持有对Lua变量的引用时，相当于在Lua的引用计数系统之外额外增加了一个引用，而Lua的GC无法感知到这个来自C#端的引用。代码示例：在下面的代码中，luaTable是C#端对Lua表myTable的引用。只要luaTab
江苏地区电子制造行业首选的设备运行监测系统SKF IMAX-8边缘计算盒子与DuodooBMS实现高效预测性维护邹工转型手札 Duodoo开源企业信息化开源开源人工智能制造
引言在电子制造行业中，设备高精度、高复杂度、高频率换线的生产特点对设备稳定性提出了严苛要求。传统维护方式依赖人工巡检和定期检修，存在响应滞后、成本高昂等问题。预测性维护（PredictiveMaintenance,PdM）通过实时数据分析和AI算法，能够提前识别设备潜在故障，大幅降低停机风险。然而，实现这一目标需要解决设备数据采集、边缘实时计算、平台深度融合等关键问题。本文将结合SKFIMAX-8
给你的小秘密加点隐私——Java实现AES加密全攻略程序员谷美 Java实战 java
概述现代对称加密算法，如高级加密标准（AES），是目前最常用的加密方法之一。本篇文章基于Java加密架构（JavaCryptographyArchitecture,JCA）循序渐进的带你实现加密算法，通过系列文章最终实现一个完成的文件加密系统。AES的工作原理(了解)AES通过一系列的轮（rounds）进行加密。轮的数量取决于密钥长度：128位密钥使用10轮。192位密钥使用12轮。256位密钥使
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他