ChenTsingZheng

4.Pyramid Channel-based Feature...论文阅读

Pyramid Channel-based Feature Attention Network for image dehazing

译为：基于金字塔通道的图像去雾特征注意网络
CVIU’2020的论文
作者：Xiaoqin Zhang,Tao Wang,Jinxin Wang,Guiying Tang,Li Zhao
全为温州大学的教授和学生

Abstract

这篇文章先说了——传统的基于 DL 的图像去雾方法通常会使用高层的特征（因为高层包含了更多的语义信息）来去雾，这样会导致忽略底层的特征(然而底层会包括更多的细节信息)。这片文章提出了一种基于金字塔通道的特征注意网络——利用通道注意机制，以金字塔的方式利用不同层次特征之间的互补性，用于单幅图像的去雾。

然后在 Abstract 里面讲述了一下他的模块构造：三尺度特征提取模块、基于金字塔通道的特征注意模块和图像重建模块。

三尺度特征提取模块同时提取不同尺度下的底层空间结构特征和高层上下文特征。

特征注意模块 PCFA：利用特征金字塔和通道注意机制，有效地提取互相依赖的通道映射。以金字塔的方式选择性地聚集更重要的特征，用于图像去雾。

重建模块：用于重建特征来恢复清晰图像。

接着在 PCFAN 中采用了一种结合均方误差损失部分和边缘损失部分的损失函数可以保留图像细节。然后吹一下这个模型的效果。

Conclusion

本文提出一种新的端到端去雾网络，成为基于金字塔通道的特征注意网络，来解决单幅图像去雾问题。该网络命名为 PCFAN，组成部分在 Abstract 中有和下文讲详细介绍。然后提出一种新的边缘丢失算法来帮助网络学习更详细的信息，然后该网络更为轻便易于实施和效率更高更有效。

Introduce

就是比较经典的去雾问题。大多数方法都是依赖于大气散射模型。表达如下：
$I (x) = t (x) J (x) + A (x) (1 - t (x))$
其中 $x$ 是指平面图像的像素坐标， $I$ 表示因为雾霾而退化的观测图像， $J$ 表示没有雾霾的场景图像。矩阵 $A$ 表示全球大气光，传输图 $t$ 是中等传输速率描述了到达相机传感器而不被散射的光的部分。
同时这个传输图t可以表达为 $t(x)=e^{-\beta d(x)}$ ,其中的 $\beta$ 是大气是散射系数，同时 $d (x)$ 是相机到场景的距离。然而，透射图和大气光在实践中是未知的。因此，很多图像去雾方法是从模糊图像I中估计 $t$ 和 $A$ ，然后通过大气散射模型获得未知的清晰图像 $J$ 。

以前的图像去雾方法：
更多地集中于使用先验知识（如暗通道先验知识、对比色线先验知识和雾线先验知识）恢复清晰图像。比如 He 提出的暗通道先验方法来估计传输映射。
深度学习方法:
最近，深度学习在各种计算机视觉任务中表现出了有效性。人们提出了各种基于卷积神经网络（CNN）的方法来估计透射图和大气光。一旦对透射图和大气光进行了估计，就可以通过大气散射模型恢复去雾图像。一般来说，CNN 中的低级特征部分指的是细节信息，而高级特征包含更多的语义信息。这两种方法对于恢复清晰图像都很重要，但大多数基于 CNN 的方法通常使用高级特征来实现图像去噪。此外，这些方法基于大气散射模型。如果估计的透射图和大气光不准确，则去雾效果将是低质量的。

右下角的图片为该文章恢复的图像

Related work

在这一部分中，将介绍关于图像去雾和注意机制的相关工作，如下所示。
通常可以分为基于图像先验的去雾方法和基于深度学习的去雾方法。

基于图像先验的去雾方法

He 等人（2010 年）提出了一种新的基于先验的方法，称为暗通道先验（DCP），以准确估计传输图。如果 RGB 颜色空间中至少有一个颜色通道在没有天空或明亮区域的 hazefree 图像中具有非常低的强度，则 DCP 适用。

在朱等人（2015）的工作中，证明了单幅图像去杂任务中颜色衰减先验的效率和有效性。该方法估计透过率并恢复场景辐射度，以去除单个图像中的薄雾

Berman 等人（2016）提出了一种基于非局部先验的图像去雾算法，其计算复杂度与图像大小成线性关系。该算法假设无雾图像的颜色可以由聚集在 RGB 颜色空间中的典型颜色近似。

为了解决去雾图像中抑制伪影的问题，Chen 等人（2016）利用梯度残差最小化（GRM）来抑制去雾图像中输入图像中不存在的边缘。

总结：尽管上述方法在去除雾霾方面取得了成功，但由于它们所依赖的假设，它们的脱雾性能并不总是令人满意。

深度学习去雾方法
最近，数据驱动的深度学习方法在许多计算机视觉任务中展示了其在特征表示方面的优越能力

蔡等人（2016）介绍了一种称为 DehazeNet 的端到端系统。它首先估计一个介质传输图，然后通过经典大气散射模型恢复一个无雾图像。此外，作者还设计了用于特征提取的特殊最大输出单元层和用于恢复 DehazeNet 中高质量图像的双边校正线性单元——BReLU，这个有兴趣可以自己去看看。

Ren 等人（2016）采用多尺度深度神经网络（MSCNN）来估计场景传输图。后面还有升级版的 MSCNN-HE 版本

Li 等人（2017 年）提出了一种基于 CNN 的图像去雾模型，称为一体式去雾网络（AOD-Net）。他们的轻型网络直接生成无雾图像，而不是单独估计大气光和用于去除雾霾的传输矩阵。

Zhang 和 Patel（2018）提出了用于端到端图像去雾的密集连接金字塔去雾网络（DCPDN）。该网络同时学习透射图、大气光和去雾图像，然后恢复 hazefree 图像。Chen 等人（2019）提出了一种端到端的门控上下文聚合网络（GCA），用于直接恢复最终的无雾图像。

注意机制
作为人类感知系统的一个重要属性（Itti 等人，1998 年），注意力机制可以被视为引导个体的视线集中在输入场景中最重要和信息最丰富的部分，而不是同时处理整个场景的指南。近年来，注意力机制得到了发展被引入深度学习方法来处理许多计算机视觉任务.
在将一些计算机视觉任务表示为顺序决策任务后，Mnih 等人（2014）提出了视觉注意的循环模型，并充分优化了不可微模型，以使用策略梯度算法学习特定于任务的策略。基于注意力的模型不是一次性处理整个输入图像，而是顺序地自适应地决定应该关注和处理哪些区域。Jaderberg 等人（2015）提出了空间变换网络，并引入了可微模块来缓解输入图像或多通道特征地图中的各种问题，包括对象旋转、比例变换、平移和杂波。为了在图像超分辨率中自适应提取信息丰富的高频通道注意特征，Zhang 等人（2018）采用通道注意机制来增强非常深的残余网络的表征能力。在通道注意模块中使用经典的全局平均池操作，考虑了有用的通道全局空间信息。Fu 等人（2019）提出了基于场景分割任务的自我注意机制的双注意网络（DANet）。提出的位置注意模块用于选择性地学习特征的空间相关性，而通道注意模块用于强调通道相关性。因此，使用这两个注意模块可以获得精确的分割结果。Liu 等人（2019）提出的用于图像去噪的 GridDehazeNet 是一种多尺度网络，带有通道式注意模块。基于通道的注意被用来重构不同尺度的特征，以及缓解一些多尺度网络中出现的瓶颈问题。

Pyramid channel-based feature attention network

1.Network architecture

$大致模型$

在这项工作中，我们结合了通道注意和金字塔操作的优点，提出了一种基于金字塔通道的特征注意网络（PCFAN）用于图像去模糊。PCFAN 的总体框架如图 2 所示。PCFAN 由三个模块组成，即三尺度特征提取模块、基于金字塔通道的特征注意模块和图像重建模块。三尺度特征模块包含三个阶段：第一个特征提取阶段由一个 3×3 卷积层和两个 RESBlock 组成（He 等人，2016）。在此阶段，特征图的深度（通道数）增加到 32。以下两个阶段均由 3×3 卷积和步幅 2 和两个重分组组成。它们将特征贴图的深度增加到 64 和 128，并将特征贴图的分辨率分别降低一半。与以往只使用第三阶段输出特征的工作不同，这三个阶段的所有输出都被输入到由多个通道注意块构成的基于金字塔通道的特征注意模块中。通道注意块用于在空间和通道维度上消除特征。最后，利用仅由一个卷积层组成的图像重建网络来重建清晰的图像。PCFAN 中的核心组件是通道注意块和基于金字塔通道的特征注意块，这将在以下部分详细介绍。

频道注意块：在这项工作中，为了确保网络捕捉到更多信息性特征，渠道注意机制（Zhang 等人，2018）被用于探索特征渠道之间的相互依赖关系。
通道详细结构信息如下图所示：

$频道注意块的详细结构$
假设这些特征 $\in R^{C\times W\times H},f=[f_1,f_2,...,f_C]$ 已给定，其中 $f_i\in R^{W\times H}$ 是 $f$ 的第 $i$ 个子特征，并且 $C$ 是 f 的通道数。首先，全局的 f 通道统计通过全局平均池化层来获得，下列公式所示：
$v_c=\frac{1}{WH}\sum^W_{i=1}\sum^H_{j=1}f_c(i,j),\mu=[v_1,v_2,...,v_c],$

其中 $v_c$ 表示通道特性，W 和 H 是各自特征的宽度和高度， $f_c(i,j)$ 指第 c 个特征的值在(i,j)点, $[., ., .]$ 是串联操作，因此 $\mu$ 是 $v_k(k=1,2,...C)$ ，然后，使用两个具有 ReLU 和 Sigmoid 激活函数的卷积来学习通道之间的线性和非线性相互作用。这些操作可以捕获聚合特征之间的通道依赖关系。其表述如下：
$\widetilde{y}=\sigma(\phi_2(\eta(\phi_1(\mu))))$
其中 $\phi,\eta$ 和 $\sigma$ 分别指卷积层，ReLU 和 Sigmoid 激活函数。 $\phi_1$ 旨在减少输入功能的通道。 $\eta$ 被 ReLU 激活后，然后使用卷积层 $\phi_2$ 将特征增加到原始通道数，最后通过以下方式获取该区块的输出特征 $F_{out}$ ：
$F_{out}=\widetilde{f}\bigotimes f$
其中，⊗ 是对应元素相乘， $f$ 是原始特征。
基于金字塔通道的特征注意模块：正如 Girshick（2015）和 He 等人（2015）所述，金字塔操作可以从 CNN 的多个层中提取特征，同时将它们融合以生成更有效的特征。然而，这些方法通常使用直观的融合策略，比如加法或级联。因此，我们提出了一种基于金字塔通道的特征注意模块（PCFA），它结合了特征金字塔和通道注意机制的优点。

2. Loss function

为了优化所提出的网络，使用两个损失函数。

MSE loss.
均方误差（MSE）损失用于测量清晰图像和输出去模糊图像之间像素方向的差异。MSE 的定义如下：
$ℒ_{MSE}=\frac{1}{CWH}\sum^C_{c=1}\sum^W_{i=1}\sum^H_{j=1}(I^{clear}_{c,i,j}-\widetilde{I}^{dehaze}_{c,i,j})^2$

其中，C，W，H 分别代表一张图片的通道数，宽度和高度。 $I^{clear}_{c,i,j}$ 是地面在通道 c 上(i,j)的真实值， $\widetilde{I}^{dehaze}_{c,i,j}$ 是对应于 PCFAN 生成的去雾图像的值。
Edge loss.
为了更详细地恢复清晰的图像，我们在网络中引入了边缘损失函数。首先是卷积运算 Conv 使用拉普拉斯算子（Trudinger，1983）获得清晰图像和去模糊图像的边缘图像。然后使用 Tanh 激活函数将边缘图像的值映射到 $[0, 1]$ .
最后是像素距离 $L_1 Norm)$ 用于测量清晰边缘图像和去模糊边缘图像之间的差异。边缘损失函数由下式给出：
$ℒ_{edge}=\parallel Tanh(Conv(I^{clear},k_{laplace}))-Tanh(Conv(\widetilde{I}^{dehazed},k_{laplace}))\parallel_1$
Total loss.
总体损失：在训练阶段，通过组合这两个损失函数来定义总损失，并由下式给出：
$ℒ=ℒ_{mse}+\alpha \cdot ℒ_{edge}$
其中 $\alpha$ 是用于产生最终损失的超参数 ℒ. 在这项工作中， $\alpha$ 设置为 0.01。

Experiments

在本节中，我们在一个合成数据集和一个真实数据集上进行了大量实验，以证明所提出的网络的有效性。将所提出的网络与最先进的基于图像先验的方法和基于学习的方法进行比较，包括 DCP（He et al.CVPR’09）、DehazeNet（Cai et al.TIP’16）、MSCNN（Ren et al.ECCV’16）、AOD Net（Li et al.ICCV’17）、GFN（Ren et al.CVPR’18）、DCPDN（Zhang et al.CVPR’18）、EPDN（Qu et al.CVPR’19）和 FAMEDNet（Zhang TIP’20）。此外，还进行了消蚀研究，以验证边缘损失函数和基于金字塔通道的特征注意模块的有效性。

Experimental settings

数据集:很难收集大量真实世界的朦胧图像及其无霾图像。因此，数据驱动的方法通常依赖于合成的模糊图像，这些模糊图像是使用适当的散射系数从基于大气散射模型的清晰图像生成的 $\beta$ 和大气光 $\alpha$ .在这项工作中，一个名为 RESIDE（Li 等人，2018a）的大规模合成数据集被用来训练和测试提议的 PCFAN。它分为五种不同的类型子集：室内训练集（ITS）、室外训练集（OTS）、综合客观测试集（SOTS）、现实世界任务驱动测试集（RTTS）和混合主观测试集（HSTS）。ITS、OTS 和 SOT 是合成数据集，RTT 中的图像来自真实场景，HST 包含合成图像和真实图像。ITS 包含 1399 个清晰图像生成的 13990 个模糊图像，SOTS 包含 500 个室内模糊图像和 500 个室外模糊图像。在这项工作中，ITS 和 SOTS 分别用作训练集和测试集。设置与之前方法中使用的设置相同（Qu 等人，2019 年）。此外，在 RTTS 上进行了一些实验，证明了该网络的泛化能力。
实现:在训练所提出的网络时，所有图像都在 RGB 空间中处理。为了优化提议的网络，采用了批量为 1 的 Adam（Kingma and Ba，2014）优化器，其中 $\beta_1$ 和 $\beta_2$ 的值分别为 0.5 和 0.999。学习率设置为 0.0001.提出的网络是用 PyTorch 框架实现的。此外，培训和测试也在配备 Intel Xeon Silver 4114 CPU、32 GB RAM 和 NVIDIA Tesla P100 GPU 的 PC 上进行。为了进行公平比较，本文中的峰值信噪比定量结果是在去噪结果的基础上使用 PYTHON 代码计算的。 $\times log_{10}\frac{(MAX)^2}{MSE}$ ,(我找到的这一篇论文在这里出现错误，不知道是不是论文中打错了还是谷歌学术下载过来显示错误)其中 MAX 是每张图像的最大像素值。MSE 用来评估一张真实场景和去雾后的图像的误差。
质量措施:为了评估该网络的性能，本工作考虑了两个方面：一个是客观测量，另一个是主观评估。对于前者，研究了两个评估标准：峰值信噪比（PSNR）和结构相似性指数（SSIM）（Wang 等人，2004）。对于后者，在 SOTS 和 RTTS 数据集上，将所提出的网络与六种最先进的方法进行可视化比较。

Ablation study

为了进一步证明建议的 PCFAN 的有效性，进行了消融实验，以验证建议的 PCFAN 的所有部分是否有效。该 PCFAN 的核心组件是基于金字塔通道的特征注意模块（PCFA）、通道注意块和边缘丢失函数。因此，通过考虑 PCFA 模块中不同的通道注意块和边缘损失函数，进行了消融实验。如第 3 节所述，有四个重要的通道注意块对 PCFAN 的性能有很大影响。

我只取其中的Edge的图像来讲一下：
翻译下来就是：当在不使用边缘损耗的情况下训练所提出的网络时，损耗曲线会波动，并且模型不会收敛到参数空间中的某一点。如果考虑了边缘损耗，则边缘损耗曲线更稳定、更平滑，网络的优化是成功的。
下面就是消融实验的对比的表：

Comparisons with state-of-theart methods

将所提出的网络在合成数据集上的结果与最先进的方法进行了比较。一些方法，如DCP、DehazeNet和GRM，首先估计透射图和大气光，然后借助大气散射模型来恢复dehazed图像。其他方法，如DCPDN和EPDN，直接学习模糊图像和去模糊图像之间的映射，并使用该映射恢复去模糊图像。图6。显示了SOTS室内和室外数据集视觉效果的定性比较。基于先前的方法，如DCP和GRM，往往会产生比地面真相更暗的图像，因为这些方法往往无法准确估计图像的模糊厚度。此外，图像的颜色失真会降低图像的质量。（例如，图6中的建筑、天空、地板和椅子（DCP、GRM））。对于基于学习的方法，DehazNet和GCA的结果中有更多的模糊性。这会导致颜色失真问题。虽然AOD网络可以减少颜色失真，但它会受到光环效应的影响。（例如，参见图6（AOD）中椅子和建筑物的边界）。虽然EPDN取得了更好的效果，但仍存在一些混浊和颜色失真。与这些方法相比，该方法在去除雾霾方面取得了最佳的视觉效果。定量比较结果如表1所示，其中数字值是SOTS数据库中平均PSNR和SSIM的结果。结果表明，PCFAN在图像去杂方面的性能最好。具体来说，在SOTS的室内数据集上，PCFAN在比较的方法中排名第一。

深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
典型的几种神经网络 Victor Zhong AI 框架神经网络人工智能深度学习
骨干网络CNN(卷积神经网络)RNN(循环神经网络)三级目录CNN(卷积神经网络)包括输入层、隐藏层、输出层：输入层一般为一张图片（w,h,d）,输入层数据一般要做归一化处理;隐藏层包含特有的卷积层（卷积核有权重系数）、池化层（没有权重系数）、全连接层，还有残差块？和Inception模块？。；输出层：RNN(循环神经网络)单向的RNN示意图：三级目录
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南》副标题：基于2025年英特尔Loihi3芯片的工业级部署实战（附能耗对比&代码库）封面建议：脉冲神经网络动态脉冲传导图覆盖在神经形态芯片显微结构上，标注「能效比：传统GPU的1/800」一、2025生物启发AI的临界点突破生物神经特性事件
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
聚焦的伟力：注意力机制与Transformer的创世纪田园Coder 人工智能科普人工智能科普
当LSTM和GRU凭借其精密的门控系统，成功驯服了时间的长河，让神经网络能够跨越数十甚至数百步记住关键信息，并在机器翻译、文本生成等领域大放异彩时，一个看似微小却影响深远的瓶颈逐渐浮出水面，尤其是在序列到序列（Seq2Seq）框架中。在标准的Seq2Seq模型（如用于神经机器翻译）里，编码器（通常是一个RNN如LSTM）需要将整个输入序列（如一个英语句子）的信息压缩成一个固定长度的上下文向量（Co
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
【网络通信安全】深入解析 OSPF 协议：从概念到 eNSP 实战配置（附完整代码与排错指南）不羁。。网络通信安全智能路由器网络
目录一、OSPF协议核心概念：为什么它是企业网络的“神经网络”？1.协议本质与设计目标2.核心组件与工作原理（1）链路状态数据库（LSDB）（2）区域划分原则（3）路由器角色二、实验环境搭建：3台路由器构建跨区域OSPF网络1.网络拓扑图2.设备与IP规划表三、逐设备配置详解：从接口到OSPF进程的全流程操作1.基础配置：接口IP与设备命名（以R1为例）2.OSPF进程配置：区域划分与网络宣告（1
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Happy-LLM 第二章 Transformer HalukiSan transformer 深度学习人工智能
Transform架构图片来自[Happy-llm](happy-llm/docs/chapter2/第二章Transformer架构.mdatmain·datawhalechina/happy-llm)，若加载不出来，请开梯子注意力机制前馈神经网络每一层的神经元都与上下两层的每一个神经元完全连接数据在其中只向前流动，用于处理静态的数据，进行图像识别或者分类，但是该网络没有记忆能力，数据在它里面没
PHP接单涨薪系列（九）之计算机视觉实战：PHP+Stable Diffusion接单指南（2025高溢价秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI php 计算机视觉 stable diffusion
案例场景某电商公司使用本方案后，产品图制作成本降低90%，广告转化率提升35%，单月节省设计费用超¥80,000。本文将彻底解密如何用PHP+AI视觉技术接取高单价设计外包，让你在竞争激烈的市场中脱颖而出！一、视觉设计市场的AI革命1.1传统设计vsAI设计设计任务传统流程AI流程需求沟通初稿设计反复修改最终交付AI生成微调即时交付2025年设计市场数据对比：指标传统设计AI设计提升幅度单图制作时
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
Day36 复习日 cylat python打卡深度学习机器学习人工智能 python 神经网络
目录一、对之前的信贷项目，利用神经网络训练下二、尝试进入nn.Module中，查看他的方法模型训练与评估相关参数管理相关模块管理相关设备相关钩子函数相关一、对之前的信贷项目，利用神经网络训练下importtorchimporttorch.nnasnnimporttorch.optimasoptimfromsklearn.model_selectionimporttrain_test_splitfr
【python深度学习】DAY 51 复习日抽风的雨610 【打卡】Python训练营 python 深度学习开发语言
作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高1.读取数据使用CIFAR-10图像数据importtorchfromtorchvisionimportdatasets,transforms#数据预处理transform=transforms.Compose([transforms.ToTensor(),transforms.
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
深度学习数据集加载 Ethan@LM 深度学习人工智能
数据集结构E:\Mytest\test20250622\pythonProject\dataset├──rose│├──rose1.jpg│├──rose2.jpg│└──...└──sunflower├──sunflower1.jpg├──sunflower2.jpg└──...主要只有的两个类fromtorch.utils.dataimportDatasetfromtorchvisionimp
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
ConvNeXT：面向 2020 年代的卷积神经网络
摘要视觉识别的“咆哮二十年代”始于VisionTransformer（ViT）的引入，ViT很快取代了ConvNet，成为图像分类任务中的最新最强模型。然而，vanillaViT在应用于目标检测、语义分割等通用计算机视觉任务时面临困难。HierarchicalTransformer（如SwinTransformer）重新引入了若干ConvNet的先验知识，使Transformer成为实用的通用视觉
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构努力毕业的小土博^_^ 优秀论文推荐深度学习学习架构
【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构文章目录【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构结果与讨论3.1消融区制图欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校硕博生毕业要
OpenCV中DPM（Deformable Part Model）目标检测类cv::dpm::DPMDetector 村北头的码农 OpenCV opencv 目标检测人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV中用于基于可变形部件模型（DPM）的目标检测器，主要用于行人、人脸等目标的检测。它是一种传统的基于特征的目标检测方法，不依赖深度学习，而是使用HOG特征+部件模型来进行检测。示例代码#include#include#includeusingnamesp
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc