Leon_winter

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)

文章目录

卷积(Convolution)
反卷积(Transposed Convolution)

padding=0, stride=1
padding = n(n>=1), stride = 1

Half (same) padding
Full padding

padding=0, strides=m(m>=2)
padding=n(n>=1), strides=m(m>=2)
最一般形式

上采样(UpSample, Interpolation)

卷积(Convolution)

卷积在我的另一篇blog中有介绍，这里不重复说明，只给出根据卷积的输入，计算输出尺寸的公式。

设输入到卷积层的输入的size为 $B, C_{in}, i_{H}, i_{W}, i_{D})$ ，分别表示Batch size，Input Channel，Input Height，Input Width，Input Depth，卷积层的卷积核尺寸Kernel_size为 $k_{H}, k_{W}, k_{D})$ ，填充padding为 $p_{H}, p_{W}, p_{D})$ ，步长stride为 $s_{H}, s_{W}, s_{D})$ 。则输出的size为 $B, C_{out}, o_{H}, o_{W}, o_{D})$ ，分别表示Batch size，Output Channel，Output Height，Output Width，Output Depth，则

$o_{H} =\Big\lfloor \frac{i_{H}+2*p_{H}-k_{H}}{s_{H}}\Big\rfloor+1$
$o_{W} =\Big\lfloor \frac{i_{W}+2*p_{W}-k_{W}}{s_{W}}\Big\rfloor+1$
$o_{D} =\Big\lfloor \frac{i_{D}+2*p_{D}-k_{D}}{s_{D}}\Big\rfloor+1$

其中 $\Big\lfloor·\Big\rfloor$ 表示向下取整，可以看出，H、W、D三个维度的计算是相同且独立的，其实这个公式十分好理解，对于H、W、D任何一个维度，输入网格数是 $i$ ，加上了padding之后，网格数变为 $i + 2 p$ ，那么 $i + 2 p - k$ 就是减去一个kernel_size后的网格数，这个时候除以stride在向下取整， $\Big\lfloor \frac{i+2*p-k}{s}\Big\rfloor$ 的含义就是卷积核移动的步数，而卷积核移动的步数在加上1(加上分子减去的那个kernel_size)，就是输出的网格数。

一般来说，kernel_size在H、W、D三个维度的值设定成一样的， padding、stride也同样经常设定成一样的。值得一提的是，因为这个向下取整的存在，让我们的反卷积操作变得较为复杂，因为对于不同的输入，输出可能一样，例如i=12,13,14对于k=3，s=3，p=0，其输出都是4，反卷积就需要特殊的设定，来返回成12,13或14。

反卷积(Transposed Convolution)

在有些应用场景，例如图像分割领域，我们输入图像尺寸(H,W)，经过了池化或者步长不为一的卷积层后，图像尺寸会变小为(H’,W’)，但我们又想让神经网络输出同原来一样的尺寸，就需要反卷积、上采样等操作返回原来的尺寸。

反卷积(Transposed Convolution，过去可能也叫Deconvolution，这一叫法逐渐被抛弃)，也叫分数步长卷积(fractionally strided convolutions)，在正向卷积中，步长一般是正整数，在反卷积的任务中，我们的目标是增大尺寸，步长就变成了分数，例如 $\frac{1}{2}$ 步长就对应正向卷积的步长2，在正向卷积中，我们很容易知道，步长stride=2，卷积核就平移两个像素位计算一次卷积，但是stride= $\frac{1}{2}$ ，卷积核如何平移 $\frac{1}{2}$ 个像素位呢？

很巧妙的，我们可以在原来相邻的两个像素位A,B之间加一位0，这样我们从位A平移到位B就需要平移两次，如果我们平移一次，就是stride= $\frac{1}{2}$ 了。因此，对于正向卷积步长stride=n，反卷积就在每两个像素位之间加上n-1个0，这样平移一位就是stride= $\frac{1}{n}$ 了。因此分数步长卷积并不是真的步长是分数，而是通过添加若干0，一次只平移一位的方法达到分数步长的目的。

为了解释反卷积，我们用一种比较直观的方法，利用连接模式(connectivity pattern)，输入经过正向卷积层后，输出的每一个像素位，蕴含了输入的哪些像素位的信息(也就是由哪些像素位计算得到)，我们认为输出的这个像素位同输入的有计算关系的像素位存在某种连接模式。

One way to understand the logic behind zero padding is to consider the connectivity pattern of the transposed convolution and use it to guide the design of the equivalent convolution.

接下来我们一步一步的看，一步一步的利用连接模式推出反卷积的计算公式。下面各图中，对于正向卷积，绿色图是是输入，蓝色图是输出，对于反卷积，蓝色图是输入，绿色图是输出，一般我们认为正向卷积和反卷积有相同的卷积核尺寸。

padding=0, stride=1

下图展示了，正向卷积参数 $input = 4, kernel\_size = 3, stride = 1, padding = 0)$ ，对应反卷积参数 $input' = 2, kernel\_size' = kernel\_size, stride' = 1, padding' = 2)$ ，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角的像素位有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图第一行两个像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第1张图片

因此对于正向卷积 $p a d d i n g = 0 ， s t r i d e = 1$ 情况，反卷积 $padding'=kernel\_size-1，strdie'=1$ ，反卷积输出满足(注意第一行是正向卷积计算公式)：

$\begin{aligned} output' & = input'+2*padding'-kernel\_size+1 \\ & = inputs'+kernel\_size-1 \end{aligned}$

padding = n(n>=1), stride = 1

下图展示了，正向卷积参数 $input = 5, kernel\_size = 4, stride = 1, padding = 2)$ ，对应反卷积参数 $input' = 6, kernel\_size' = kernel\_size, stride' = 1, padding' = 1)$ ，根据连接模式，正向卷积中，绿色图左上角的像素位和蓝色图左上角的3*3像素位有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-padding-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图左上角(3行*4列)像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第2张图片

因此对于正向卷积 $p a d d i n g = n (n > = 1) ， s t r i d e = 1$ 情况，反卷积 $padding'=kernel\_size-padding-1，strdie'=1$ ，反卷积输出满足(注意第一行是正向卷积计算公式)：

$\begin{aligned} output' & = input'+2*padding'-kernel\_size+1 \\ & = inputs'+kernel\_size-2*padding-1 \end{aligned}$

Half (same) padding

Half padding是 $p a d d i n g = n, s t r i d e = 1$ 卷积的特例，要求卷积核尺寸为奇数 $kernel\_size=2*n+1$ ，设定 $p a d d i n g = n$ 近似为卷积核尺寸的一半，所以叫Half padding，由于在这种设定下， $input\_size=output\_size$ ，所以又叫same padding，这种padding在实际应用中使用频率极高。

下图展示了，正向卷积参数 $input = 5, kernel\_size = 3, stride = 1, padding = 1)$ ，对应反卷积参数 $input' = 5, kernel\_size' = kernel\_size, stride' = 1, padding' = 1)$ ，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角的(2*2)像素位有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-padding-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图左上角(2行*3列)像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第3张图片

因此对于正向卷积 $kernel\_size=2*n+1，padding=n(n>=1)，stride=1$ 情况，反卷积 $padding'=kernel\_size-padding-1，strdie'=1$ ，反卷积输出满足(注意第一行是正向卷积计算公式)：
$\begin{aligned} output' & = input'+2*padding'-kernel\_size+1 \\ & = input' \end{aligned}$

Full padding

Full padding是 $p a d d i n g = n, s t r i d e = 1$ 卷积的特例，要求 $padding=kernel\_size-1$ 近似为卷积核尺寸，到达了padding的极限，所以叫Full padding。

下图展示了，正向卷积参数 $input = 5, kernel\_size = 3, stride = 1, padding = 2)$ ，对应反卷积参数 $input' = 7, kernel\_size' = kernel\_size, stride' = 1, padding' = 0)$ ，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角(3*3)像素位有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-padding-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图第一行到第三行以及第二列到第四列的交集的像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第4张图片

因此对于正向卷积 $p a d d i n g = n (n > = 1) ， s t r i d e = 1$ 情况，反卷积 $padding'=kernel\_size-padding-1，strdie'=1$ ，反卷积输出满足(注意第一行是正向卷积计算公式)：
$\begin{aligned} output' & = input'+2*padding'-kernel\_size+1 \\ & = inputs'-kernel\_size+1 \end{aligned}$

padding=0, strides=m(m>=2)

下图展示了，正向卷积参数 $input = 5, kernel\_size = 3, stride = 2, padding = 0)$ ，对应反卷积参数 $input' = 2, kernel\_size' = kernel\_size, stride' = 1, padding' = 2)$ ，这就需要上面讲的分数步长的膨胀原理了，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角的像素有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图左上角的像素位有连接关系，绿色图第一行第三个像素位，与蓝色图第一行的两个像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第5张图片

因此对于正向卷积 $p a d d i n g = 0 ， s t r i d e = m (m > = 2)$ 情况，反卷积 $padding'=kernel\_size-1，strdie'=1，dilation'=stride-1$ ，反卷积输出满足(注意第一行是正向卷积计算公式，只不过加入了膨胀系数)：
$\begin{aligned} output' & = input'+dilation*(input'-1)+2*padding'-kernel\_size+1 \\ & = stride*(input'-1)+kernel\_size \end{aligned}$

padding=n(n>=1), strides=m(m>=2)

下图展示了，正向卷积参数 $input = 5, kernel\_size = 3, stride = 2, padding = 1)$ ，对应反卷积参数 $input' = 3, kernel\_size' = kernel\_size, stride' = 1, padding' = 1)$ ，这同样需要上面讲的分数步长的膨胀原理，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角的像素位有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-padding-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图第一行前两个像素位有连接关系。

卷积(Convolution)，反卷积(Transposed Convolution)，上采样(UpSample, Interpolation)_第6张图片

因此对于正向卷积 $p a d d i n g = n (n > = 1) ， s t r i d e = m (m > = 2)$ 情况，反卷积 $padding'=kernel\_size-padding-1，strdie'=1，dilation'=stride-1$ ，反卷积输出满足(注意第一行是正向卷积计算公式，只不过加入了膨胀系数)：
$\begin{aligned} output' & = input'+dilation*(input'-1)+2*padding'-kernel\_size+1 \\ & = stride*(input'-1)+kernel\_size-2*padding \end{aligned}$

最一般形式

正如我们在分析正向卷积时说的，因为向下取整的关系，同样的输出尺寸可能有不同的输出尺寸，在正向卷积公式中，如果 $\frac{i+2*p-k}{s}$ 能够整除，我们可以利用之前讲的反卷积计算公式，此时 $i = s * N - 2 * p + k$ ，有没有向下取整都可以。

如果 $i = s * N - 2 * p + k + a$ ，且整数a满足 $，由于向下取整的存在，a会被截掉，在反卷积设计中，我们要想办法补上a，我们会在 i n p u t^{'} 的最右边和最上边补上a个zero padding。$

a = (i + 2p − k) mod s represents the number of zeros added to the top and right edges of the input

下图展示了，正向卷积参数 $input = 6, kernel\_size = 3, stride = 2, padding = 1)$ ，对应反卷积参数 $input' = 3, kernel\_size' = kernel\_size, stride' = 1, padding' = 1, a=1)$ ，根据连接模式，正向卷积中，绿色图左上角的像素只和蓝色图左上角的像素有连接关系，在正向卷积和反卷积有相同卷积核尺寸的前提下，在反卷积过程中，会在外围进行 $padding'=kernel\_size-padding-1$ 的填充，你可以验证，这样填充的反卷积，会严格满足各个像素位的连接关系，例如绿色图第一行第二个像素位，与蓝色图第一行前两个像素位有连接关系，绿色图第一行最后一个像素位，只与蓝色图第一行最后一个像素位有连接关系。

因此对于正向卷积 $p a d d i n g = n (n > = 1) ， s t r i d e = m (m > = 2)$ 情况，反卷积 $padding'=kernel\_size-padding-1，strdie'=1，dilation'=stride-1，a=(input + 2*padding − kernel\_size)~mod~s$ ，反卷积输出满足(注意第一行是正向卷积计算公式，只不过加入了膨胀系数和额外的填充a)：
$\begin{aligned} output' & = input'+dilation*(input'-1)+2*padding'+a-kernel\_size+1 \\ & =stride*(input'-1)+kernel\_size-2*padding+a \end{aligned}$

上采样(UpSample, Interpolation)

上采样(UpSample)操作其实是一个很大的范畴，反卷积也可以属于上采样操作，但这篇blog的上采样仅仅表示插值(Interpolation)，我们以pytorch的API为例，列举较为常见的双线性插值(bilinear)和最近邻插值(nearest)。

# 双线性插值
inputs = torch.FloatTensor(np.arange(4*4)).reshape(1,1,4,4)
m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=False)
upsample = m(inputs)

# 待插值输入inputs
tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]]]])
          
# 双线性插值结果upsample
tensor([[[[ 0.0000,  0.2500,  0.7500,  1.2500,  1.7500,  2.2500,  2.7500, 3.0000],
          [ 1.0000,  1.2500,  1.7500,  2.2500,  2.7500,  3.2500,  3.7500, 4.0000],
          [ 3.0000,  3.2500,  3.7500,  4.2500,  4.7500,  5.2500,  5.7500, 6.0000],
          [ 5.0000,  5.2500,  5.7500,  6.2500,  6.7500,  7.2500,  7.7500, 8.0000],
          [ 7.0000,  7.2500,  7.7500,  8.2500,  8.7500,  9.2500,  9.7500, 10.0000],
          [ 9.0000,  9.2500,  9.7500, 10.2500, 10.7500, 11.2500, 11.7500, 12.0000],
          [11.0000, 11.2500, 11.7500, 12.2500, 12.7500, 13.2500, 13.7500, 14.0000],
          [12.0000, 12.2500, 12.7500, 13.2500, 13.7500, 14.2500, 14.7500, 15.0000]]]])

# 最近邻插值
inputs = torch.FloatTensor(np.arange(4*4)).reshape(1,1,4,4)
m = torch.nn.Upsample(scale_factor=2, mode='nearest')
upsample = m(inputs)

# 待插值输入inputs
tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]]]])
          
# 最近邻插值结果upsample
tensor([[[[ 0.,  0.,  1.,  1.,  2.,  2.,  3.,  3.],
          [ 0.,  0.,  1.,  1.,  2.,  2.,  3.,  3.],
          [ 4.,  4.,  5.,  5.,  6.,  6.,  7.,  7.],
          [ 4.,  4.,  5.,  5.,  6.,  6.,  7.,  7.],
          [ 8.,  8.,  9.,  9., 10., 10., 11., 11.],
          [ 8.,  8.,  9.,  9., 10., 10., 11., 11.],
          [12., 12., 13., 13., 14., 14., 15., 15.],
          [12., 12., 13., 13., 14., 14., 15., 15.]]]])

最近邻插值的结果很好理解，双线性插值的结果不太好理解(其实找规律还是可以知道怎么实现的，但不知道为何要这样上采样)，关于双线性插值，我很想看pytorch的源代码，但貌似是C语言写得，不是很懂Cython，找不到代码文件。

参考文献：
A guide to convolution arithmetic for deep learning：https://arxiv.org/abs/1603.07285
部分卷积动图的地址：https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md
pytorch：Upsample

天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
Manus AI与多语言手写识别
ManusAI与多语言手写识别背景与概述手写识别技术的发展现状与挑战ManusAI的核心技术与应用场景多语言手写识别的市场需求与难点ManusAI的技术架构深度学习在手写识别中的应用多语言支持的模型设计数据预处理与特征提取方法多语言手写识别的关键挑战不同语言字符的多样性处理上下文语义与书写风格适应性低资源语言的训练数据获取解决方案与优化策略迁移学习在多语言任务中的应用端到端模型的优化与轻量化用户反
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python 全代码）全流程解析（二）
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python全代码）全流程解析（二）1环境配置和数据集预处理1.1环境配置1.1数据集预处理2深度学习模型训练和评估2.1深度学习模型训练2.1深度学习模型评估笑话一则开心一下喽完整代码如下：模型文件如下深度学习模型讲解---待续第一部分内容的传送门第三部分传送门1环境配置和数据集预处理1.1环境配置环境配置建议使用ana
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
如何使用目标检测深度学习框架yolov8训练钢管管道表面缺陷VOC+YOLO格式1159张3类别的检测数据集步骤和流程 FL1623863129 深度学习目标检测深度学习 YOLO
【数据集介绍】数据集中有很多增强图片，大约300张为原图剩余为增强图片数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1159标注数量(xml文件个数)：1159标注数量(txt文件个数)：1159标注类别数：3所在仓库：firc-dataset标注类别名称(注意yo
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少