追梦Hocking

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记

源码下载：

CVPR2022ImageDehazingTransformerwithTransmission-Aware3D代码-深度学习文档类资源-CSDN下载

Abstract

尽管卷积神经网络（CNNs）的单图像去模糊已经取得了良好的进展，但卷积固有的等方差和局部性仍然是去雾性能的瓶颈。虽然 Transformer占据了各种计算机视觉任务，但直接利用 Transformer进行图像去雾具有挑战性： 1)往往会导致模糊和粗糙的细节，不适合图像重建；2) Transformer的位置嵌入以逻辑或空间位置顺序提供，忽略了变化的雾霾密度，导致去雾性能次优。

本研究的关键见解是研究如何结合CNN和 Transformer进行图像去雾。为了解决 Transformer与CNN之间的特征不一致问题，我们提出通过学习基于 Transformer特征的调制矩阵（即系数矩阵和偏差矩阵） (i.e., coefficient matrix and bias matrix)
来调制CNN特征，而不是简单的特征加法或连接。特征调制自然地继承了变压器的全局上下文建模能力和CNN的局部表示能力。我们通过一种新的传输感知的三维位置嵌入模块，将一个与雾霾密度相关的先验引入 Transformer，该模块不仅提供了相对位置，而且还暗示了不同空间区域的雾霾密度。大量的实验表明，我们的方法，DeHamer，在几个图像去模糊基准上达到了最先进的性能。

1. Introduction

单图像去雾的目的是恢复由于空间雾霾密度变化而导致对比度降低和颜色暗淡的模糊对应物的无雾霾图像。这项任务是一个长期的和具有挑战性的问题，具有广泛的应用，例如监控系统和自动驾驶系统。为了解决这一不适定问题，基于先验的方法，如暗通道先验（DCP）[14]和颜色衰减先验（CAP）[37]，采用先验作为外部信息来估计模糊图像形成模型的参数。这些方法的鲁棒性有限的，特别是面对具有挑战性的场景。基于cnn的学习能力，基于cnn的脱雾网络通过估计成像模型的参数[25]或直接学习无雾对应的[20]，取得了令人印象深刻的性能。然而，这些网络仍然受到建模长期依赖关系和平移等方差[12]的卷积的局部性质的瓶颈。全球背景和空间变化的操作对于去除雾霾的[8]尤为重要。

虽然 Transformer已经席卷了许多计算机视觉任务[6,21,31]，直接使用它在图像脱雾退出一些固有问题： 1)尽管 Transformer能够提供远程功能依赖通过级联自我关注，即使在早期阶段，它 缺乏保留局部功能细节的能力，从而导致 图像重建的模糊和粗糙的细节；2)以往的位置嵌入方法忽略了 不同雾霾密度区域之间的差异，影响了图像脱雾性能。

为了克服这些障碍，我们提出了几种新的设计，使 Transformer的力量到图像去模糊。其主要思想如图1所示。具体来说 Specifically，我们试图结合 Transformer的 全局建模能力和CNN局部表征能力用于图像去雾。为了实现这一目标，给定一个模糊图像 a hazy image，我们通过 a Transformer模块分别提取层次全局特征，而由CNN模块获得的相应层次局部特征。提出了一种感知传输（通过 先验信息表示雾密度）的三维位置嵌入模块，该模块为变压器提供了相对位置信息和雾密度信息，从而提高了图像去雾性能。我们建议不是简单地连接或添加变压器特征和CNN特征，而是通过一个学习 调制矩阵的特征调制模块来集成这些特征， 从而解决了特征不一致的问题。利用调制后的特征，利用 CNN解码器模块来放大图像的分辨率，并渲染无雾图像的局部细节。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第2张图片

本研究的启发设计可以为基于 Transformer的图像重建提供指导，特别是如何1)通过特征调制继承变形器特征和CNN特征的优势，2)通过位置嵌入将先验信息引入变压器。实验和比较表明，我们的方法（称为DeHamer）优于最先进的图像脱雾方法。

简而言之，我们的贡献如下：

与纯基于cnn的图像模糊网络相比，我们的工作是第一次通过新的设计将Transformer的能力引入图像去雾中。
我们提出了一种新的传输感知三维位置嵌入，将雾霾密度相关的先验信息涉及到Transformer。
在图像去模糊基准数据集上的大量实验证明了我们的方法与最先进的方法相比的突出性能。

2. Related Work

图像去雾。对于单幅图像的去模糊处理，现有的解决方案主要可分为基于 物理模型的方法和基于深度学习的方法。早期的方法采用雾霾或图像退化相关的先验来估计透射图和全球大气光，这些是雾霾图像形成模型如大气散射模型[22]的关键参数。沿着这条线，DCP [14]假设非雾霾区域的像素在至少一个颜色通道中具有低强度。随后，提出了多种先验，如色线先验（CLP）[13]和雾霾线先验（HLP）[3]。

随着 CNNs的成功，基于数据驱动的网络在图像去模糊[7,18,19,34]方面取得了很好的效果。这些方法采用CNNs来估计大气散射模型的关键参数或直接学习无雾图像。例如，Zhang等人[33]提出了一个密集连接的金字塔网络来估计透射图和大气光。这些估计的参数用于获得无雾霾图像。为了避免多参数估计过程中的累积误差，研究了端到端网络来直接估计无雾图像。例如，Li等人[17]通过重新构建大气散射模型，提出了一个端到端图像去雾的一体化网络。Liu等人[20]提出了一个包括预处理，主干和后处理的网格网。在网格网络中，采用基于注意力的多尺度估计来实现鲁棒的去模糊结果。Singh等人[26]提出了一种用于图像去模糊的反投影金字塔网络，该网络包含迭代的U-Net块和金字塔卷积块。提出了基于物理模型的特征学习的图像去模糊[10]。除L1和L2损失外，各种损失如对比损失[30]和对抗损失[8,11]已被用于图像去雾网络。

与以往的图像去模糊方法不同，我们将 Transformer的远程建模能力引入到图像去模糊方法中，并通过一系列新的设计，有效地将这种能力与 CNN的局部表示能力结合起来。与以往的位置嵌入方法不同，我们通过三维位置嵌入，将与雾霾密度相关的先验和空间位置信息引入到变压器中。与对参考图像或语义信息施加约束以对齐内容特征的自适应实例归一化[15,16,29]相比，我们利用特征调制来继承CNN和变换器的优势。这些设计产生了最先进的脱雾性能，并为基于变压器的图像重建提供了见解。

视觉Transformer。 Transformer[28]已成功地应用于自然语言处理任务中。基于其通过堆叠自注意和前馈建模远程依赖的强大能力，它启发了计算机视觉界研究如何将变压器应用于相关任务，如目标检测[5]、图像分割[31]和自动驾驶[23]。例如，Strudel等人[31]将视觉变压器（ViT）扩展到语义分割，而Xie等人[12]在Swin变压器[21]上构建了自监督学习。Chen等人[6]提出了一种用于多任务图像恢复的变压器骨干网；然而，该变压器依赖于大规模的训练数据来获得最佳性能。在现实世界中，图像增强和恢复任务的 大规模配对训练数据是稀缺的。

虽然视觉变压器在提高视觉任务的性能方面做出了很大的努力，但仍然难以直接按照现有的方案有效地将变压器引入图像去模糊任务中。这是因为 Transformer缺乏局部表征能力，不适合图像去雾。因此，我们积极探索精致的设计，结合 Transformer和CNN的最佳世界。

3. Methodology

我们的方法的概述结构如图2所示。给定一个模糊的图像，我们首先通过一个传输感知的三维位置嵌入模块，将一个 与雾密度相关的先验引入到一个 Transformer 模块中。然后，我们的网络通过 Transformer模块和CNN编码器模块分别提取全局特征和局部特征。然后，我们将 Transformer特征作为条件信息，并将其输入一个特征调制模块来预测调制矩阵（即系数矩阵和偏置矩阵），这些调制矩阵用于对相应 的CNN编码器特征进行扩展和移动。这样，调制后的 编码器特征增强了局部特征的全局建模能力。根据该方案，对分层变压器特征和CNN编码器特征进行了 自适应集成。最后，通过 CNN解码器模块获得无雾图像，逐步放大分辨率，呈现局部细节。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第3张图片

在下面的内容中，我们将详细介绍这些模块。更详细的网络结构和参数可以在补充材料中找到。

3.1. 3D Position Embedding

在 vision Transformer中，位置嵌入是保留空间位置信息的关键。然而，以往的位置嵌入是按 逻辑或空间位置顺序提供的，这忽略了模糊图像中不同空间区域的变化雾霾密度。此外，变化雾霾密度对现有的图像去雾霾方法提出了挑战。

为了解决这一问题，我们提出了一种新的图像去雾方法，传输感知三维位置嵌入，将雾密度相关的先验信息（如 transmission map） 嵌入到位置编码器中。这种方式表明了不同空间区域的雾霾密度。我们期望具有 相似雾霾密度的区域在脱雾过程中可能具有相似的 非线性映射关系。

为了实现这一点，我们首先计算输入的模糊图像 I 的暗通道先验[14]：

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第4张图片

其中，Ω(x)是一个以x为中心的局部块。假设 大气背景光的值为1，DCP (I)将为1-t，其中t为透射图[14]。注意，我们选择 暗通道先验生成雾霾密度信息是基于它的鲁棒性能的图像去雾密度。在我们的方法中也可以用其他的先验。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第5张图片

3.2. Network Structure

Transformer模块。为了实现全局环境来处理空间变化的雾霾，我们采用了一种具有很强的建模远程依赖能力的变压器。具体来说，我们采用Swin Transformer[21]作为骨干backbone，基于其有效性和效率之间的良好权衡，提取分层变压器特征。其他的变压器骨干也可以在我们的框架中使用。虽然更大的图像补丁可以提高Swin Transformer[21]的计算效率，但它会在每个补丁周围产生明显的边界伪影。因此，我们没有使用默认的图像补丁大小，即4，而是将补丁大小设置为2。我们只采用三阶段Swin Transformer，其中采用轻量级Transformer参数，即注意头的深度和数量分别设置为[2,2,2]和[3,6,9]。我们并没有通过使用更多的参数来发现明显的收益。

CNN编码器模块。为了获得局部特征，我们采用三个卷积块来提取与三阶段Transformer特征相对应的分层卷积特征。在每个卷积块中，两个卷积层之后是ReLU激活函数。在最后一个卷积层之后，采用最大池化层来减小图像的大小。目的是确保CNN特征的大小与Swin变压器相应特征的大小一致。为了实现更大的接受域，我们在每个卷积块的末端使用了一个金字塔池化模块（PPM）[35]，它在四个不同的尺度下融合了特征。

功能调制模块。我们发现，与具有局部注意和清晰细节的CNN特征相比，Transformer提取的特征具有独特的特征，如远程注意，但粗糙的纹理，见图4。我们认为这种差异是基于基于自我注意的变压器特征和基于卷积的CNN特征的本质。因此，直接利用常用的特征融合方法，如连接和加法，可能会产生次优性能。

受风格转移和条件图像增强[16,29]的启发，我们将变换器特征作为条件信息，来预测调制矩阵，然后对CNN特征进行调制。这样，我们期望将变压器的长期关注转移到CNN特征上，而不损害CNN特征的细节，这可以表示为：

CNN解码器模块。最后，我们利用足够的特征表示来重建与输入的模糊图像相同大小的无雾对应物。更具体地说，我们首先将调制后的特征、相应的CNN编码器特征和上采样的解码器特征连接起来。在这里，由于粗纹理，我们放弃了相应的变压器特征。然后，将这些连接的特征输入到一个由三个卷积层组成的卷积块中。然后，我们采用包含多条全卷积流的多尺度残差块[32]，产生空间精确的特征，自适应地选择图像去模糊的有效特征。在每个卷积块之后，将遵循一个2×的上采样操作，以扩大分辨率。经过三个卷积块后，这些特征被发送到一个卷积层，以生成一个高质量的无雾霾图像。

4. Experiments

4.1. Experimental Settings

实施细节。我们的方法是在NVIDIA Tesla V100 GPU上使用PyTorch实现的。我们使用带有默认参数的当优化器来优化我们的方法。我们将初始学习速率设置为0.0001，并利用余弦退火策略来调整学习速率直到收敛。我们 不使用复杂的损失函数，我们只使用L1损失来优化我们的网络。我们随机裁剪图像块进行训练，在训练过程中，将图像块的大小从128×128逐渐扩大到全尺寸。

训练和测试数据集。在之前的工作[10,20,30]之后，我们使用 RESIDE[18]的ITS和OTS子集作为训练数据集，并对包含500张室内和500张室外模糊图像的SOTS子集进行评估。此外，我们还在实验中加入了真实世界的 Dense Haze[1]和NH-HAZE [2]数据集。 Dense Haze由45张训练图像、5张验证图像和5张测试图像组成。 NH-HAZE的朦胧图像被捕捉到在密集和均匀的朦胧场景中。NH-Haze还包括45张训练图像，5张验证图像和5张测试图像，分别在密集和非均匀的模糊的场景。

比较方法和评价指标。我们将我们的方法与一种基于先验的方法（DCP [14]）和六种最先进的基于深度学习的方法 six state-of-the-art deep learning-based meth ods（（DCP[14]）[4]，AODNet[17]，（DCP[14]）[20]，FFANet[24]，MSBDN[9]，UHD[36]）.如果这些方法可以公开使用，我们将 使用这些方法发布的代码进行公平比较，否则我们将使用与我们的方法 相同的训练数据对它们进行再训练。我们使用常用的PSNR（dB）和SSIM来量化不同方法的脱雾性能。

4.2. Experiments on Synthetic Hazy Images

我们首先比较了在合成模糊图像数据集上的不同方法。从SOTS-室外和SOTS-室内测试集采样的模糊图像的视觉比较分别如图6和图7所示。如图所示，所比较的方法要么对结果保持模糊，要么产生效果颜色偏差，而我们的方法的结果最接近地面真实图像。结果的PSNR和SSIM分数也反映了我们的方法的性能。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第8张图片

此外，表1还对所有测试集的定量结果进行了比较。如上所述，我们的方法在sots-户外游戏上获得了最高的PSNR和SSIM分数。此外，我们的方法的PSNR分数在sots室内比较方法中是最高的，而我们的SSIM评分（0.9881vs0.9886）仅比最先进的FFANet [24]低0.0005。结果表明，我们的方法具有良好的性能，得益于变压器和CNN与新的设计。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第10张图片

4.3. Experiments on Real Hazy Images

为了进一步验证我们的方法的性能，我们比较了从 Dense-Haze和NH-HAZE测试集采样的真实模糊图像的不同方法。可视化结果分别如图8和图9所示。如图8(a)和图9(a)所示，真实的模糊图像 非常具有挑战性，特别是在 非均匀的模糊场景中捕获的模糊图像。与图8中不同方法的结果相比，只有我们的方法才能去除雾霾，恢复与 地面真实图像相似的颜色。此外，我们的结果看起来比比较的结果更令人满意。对于结果在图9中，只有网格模糊网[20]、MSBDN [9]和我们的方法可以揭示在密集、模糊的场景中捕获的输入图像的结构。相比之下，我们的方法获得了 更真实的结果，并且在 颜色和细节方面更类似于地面真实图像。

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记_第11张图片

对真实模糊图像的定量结果的比较见表2。对于PSNR和SSIM分数，我们的方法在所有测试集上都取得了最好的性能。我们的方法在这两个测试集上的PSNR分数超过了当前的方法1-4 dB。在这些具有挑战性的数据集上的结果进一步证明了我们的方法的有效性和优势。

4.4.消融研究

我们进行了消融研究，以调查我们的设计对图像脱雾性能的影响。研究包括以下消融模型： w/ 2DPE： 2D位置嵌入，即去除我们的变压器模块中的雾霾密度位置；w/o变压器：去除变压器模块，即U-Net样CNN进行图像去模糊；w/o ConvE：删除CNN编码器模块，即变压器模块后跟CNN解码器；没有PPM：删除CNN编码器模块中的金字塔整形模块；w/添加和w/ cat：用添加的特征或特征连接替换特征调制块；没有MRB：去除CNN解码器模块中的多尺度残余块。

这些模型使用与我们的方法相同的训练数据（即完整的模型）进行训练。消融模型在NH-HAZE测试集上的定量结果如表3所示。观察表3，我们可以看到所有的模块都可以提高我们的方法的脱雾性能，这表明了我们的设计的有效性。w/ 2DPE的结果表明，变压器模块中嵌入的雾霾密度信息对于图像去雾化至关重要，将PSNR/SSIM从18.90/0.6373提高到20.66/0.6844。此外，去除变压器模块或CNN编码器模块会显著降低性能，说明变压器与CNN的结合是有效的。与常用的特征添加和连接相比，对CNN特征进行了调制以变压器特性为条件，更适合于将变压器特性与CNN特性结合起来。

图10显示了对消融模型的一些可视化比较。如图所示，w/ 2DPE对结果保持模糊，如红色箭头所示。变压器不能很好地处理浓雾霾，而变压器在结果中产生粗糙的细节。无添加无法恢复颜色检查器的颜色，剩余的烟雾可以在其结果中找到。相比之下，我们的完整模型获得了视觉上更令人愉悦的结果，消除了密集的雾霾，恢复了相对较好的细节。视觉比较再次证明了我们的模块的有效性。

5. Conclusion

在此工作中，我们提出了一种新的单图像去模糊处理方法。这项工作的关键见解是有效地整合变压器特征和CNN特征，并将任务特定于之前的领域知识引入变压器，以提高性能。利用特征调制使我们的方法能够享受变压器和CNN的最佳世界。此外，我们发现通过三维位置嵌入可以有效地将先验信息引入变压器，进一步提高了脱雾性能。广泛的比较表明，我们的方法在合成和真实的基准数据集上达到了最先进的性能。

理解不同层的表示（layer representations）科学禅道高维表示人工智能深度学习
在机器学习和深度学习领域，特别是在处理音频和自然语言处理（NLP）任务时，"层的表示"（layerrepresentations）通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的不同层次的信息。1.层的表示（layerrepresentations）为了更好地理解这一概念，我们可以从以下几个方面进行解释：1.深度神经网络结构深度神经网络（DNN）通常由多个层组成，每
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
【5分钟力扣】1160.拼写单词（python3实现）金鞍少年金鞍少年的刷题之路字符串 leetcode 力扣1160题 python拼写单词
文章目录一、前言二、题目三、哈希表解法3.1哈希表基本概念3.2解题思路3.3代码实例四、字符串比较解法4.1解题思路4.2代码实例一、前言如果放弃太早，你永远都不知道自己会错过什么。每天五分钟，看懂一道简单、中等难度的算法题，尽可能将复杂的题讲清楚。疯狂学习python中，2020-07-20更新二、题目给你一份『词汇表』（字符串数组）words和一张『字母表』（字符串）chars。假如你可以用
Open3D 进阶（31）渐进三角网(PTD)地面滤波点云侠点云进阶线性代数算法计算机视觉 python
目录一、算法原理1、PTD算法2、实现流程二、代码实现三、参数指南四、结果展示。一、算法原理1、PTD算法渐进三角网地面滤波算法（ProgressiveTINDensification,PTD）是一种广泛应用于机载LiDAR点云数据处理的滤波方法，旨在从复杂场景中精确分离地面点，以生成数字高程模型（DEM）。2、实现流程 PTD的核心思想是迭代加密三角网，逐步逼近真实地形：实现流程主要包括以
怎么对教育视频进行加密？提高视频的安全性！菜包eo 音视频
前言在数字教育蓬勃发展的当下，知识版权保护成为行业核心命题。教育视频作为知识传播的重要载体，其加密技术的优劣直接关乎机构的核心竞争力与用户权益。本文将深入剖析高安全性视频加密方案，解锁教育内容防护的关键密码。一、VRM分片错序视频加密采用分布式编码技术，将视频文件物理切片，每片视频进行多种算法混合型加密，同时结合独立研制密码本，将关键数据进行错序混淆，对视频文件进行最高级别加密，这样经过加密的视频
C++实现一个基于多态的职工管理系统（附源码） loveCC_orange C/C++c++面试华为后端开发多态
之前为了找实习，学了Python，刷了五六十道算法题，然后就开始投简历面试了，结果就是各个大厂一轮游，要Python开发的岗位又少的可怜。但所幸华为的实习面试通过了~本来以为这样就可以等着拿offer了，结果泡池子失败，今年华为的RAN研究部offer数量缩水，由于没在前四之列，所以就被pass掉了。然后又重新开始海投简历找实习。在无数次碰壁之后，深感自己才疏学浅，学的东西还是太少了。于是继续刷题
【AI大模型】26、算力受限下的模型工程：从LoRA到弹性智能系统的优化实践无心水 AI大模型人工智能搜索引擎 LoRA 大语言模型微调模型压缩知识蒸馏量化技术
引言：算力瓶颈与模型工程的突围之路在人工智能领域，大语言模型的发展正呈现出参数规模爆炸式增长的趋势。从GPT-3的1750亿参数到PaLM的5400亿参数，模型能力的提升往往伴随着对算力资源的极度渴求。然而，对于大多数企业和研究者而言，动辄数百GB的显存需求、数十万块GPU的训练集群显然是难以企及的"算力鸿沟"。当面对"无米之炊"的困境时，模型工程技术成为突破算力瓶颈的核心路径——通过算法创新而非
Python编程：使用 YOLO 目标检测倔强老吕 python 开发语言
YOLO（YouOnlyLookOnce）是一种基于深度学习的实时目标检测算法，由JosephRedmon等人于2016年首次提出。与传统的两阶段目标检测方法（如R-CNN系列）不同，YOLO将目标检测任务视为一个单一的回归问题，直接在图像上进行一次推理即可预测边界框和类别概率。YOLO的核心思想单次前向传播（SingleShotDetection）：YOLO只需对输入图像进行一次神经网络推理，就
基于YOLOv8和Faster R-CNN的输电线路异物目标检测项目检测输电线异物数据集输电线缺陷数据集绝缘子如何使用YOLOv8和Faster R-CNN训练输电线路异物目标检测数据集 QQ67658008 YOLO r语言 cnn 输电线路绝缘子线路异物目标检测
电力篇-输电线路缺陷数据集输电线路异物目标检测数据集16000张5种检测目标：‘burst’-爆裂‘defect’-缺陷‘foreign_obj’-异物‘insulator’-绝缘体‘nest’-窝（巢）带标注-YOLO格式可直接用于YOLO系列目标检测算法模型训练如何使用YOLOv8和FasterR-CNN训练输电线路异物目标检测数据集的详细步骤和代码。假设数据集包含16000张图片和5种检测目
不懂的还在争论AI，懂行的已用Python+DeepSeek变现！逆袭机会就在AI应用层渡难繁辰 python开发人工智能拥抱AI 人工智能 python ai
最近总有种错觉：AI时代轰轰烈烈，普通人却只能当看客？大模型训练动辄千万美金，算法高深莫测，似乎离我们太远。别急，AI真正的革命性力量，正从神秘实验室涌向普通人的键盘——它的名字叫“AI应用层”。而拿到这张船票的钥匙，就是你早该学起来的：Python。当质疑者还在争论“AI能否取代人类”，行动派已用DeepSeek+LangChain开发智能应用月入五位数！巨头烧钱搭台，我们轻量唱戏！科技大佬砸重
【学习】《算法图解》第六章学习笔记：广度优先搜索自学也学好编程程序人生
前言《算法图解》第六章为我们介绍了一种基础且强大的图搜索算法——**广度优先搜索(Breadth-FirstSearch,BFS)**。这种算法能够系统地探索图中的节点，常用于解决两类核心问题：一是判断从一个节点到另一个节点是否存在路径；二是在无权图中找到两个节点之间的最短路径。本笔记将深入探讨图的基本概念、BFS的工作原理、其实现方式以及相关的性能分析。一、图（Graph）简介在讨论BFS之前，
MATLAB算法实战应用案例精讲-【数模应用】主效应&交互效应&单独效应林聪木 matlab 算法开发语言
目录前言几个相关概念因素和水平主效应单纯主效应交互作用效应或影响（effect）因素之间的相互制约和影响两因素交互作用三因素及多因素交互作用几个高频面试题目什么是主效应,交互效应,单独效应？回归分析中是必须加入控制变量的吗？如果假如控制变量之后，显著性不高了该怎么办？控制变量说明控制变量选择控制变量处理主效应和交互效应的联系与区别如何依据主效应和交互效应描述结果？算法原理数学模型主效应二分变量交互
【学习】《算法图解》第七章学习笔记：树自学也学好编程程序人生
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
常见排序方法大全实相无相算法排序算法数据结构
这篇文章主要讨论各种常见的排序算法，包括冒泡排序、插入排序、选择排序、快速排序、堆排序、希尔排序、归并排序、基数排序等。每种排序算法都有它自己的特点。本文将对这些算法的工作原理、特点、时间复杂度等方面进行介绍，并且给出实现示例。一：基本定义冒泡排序（BubbleSort）：是一种简单的排序算法，它重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。插入排序（Insert
【机器学习&深度学习】前馈神经网络（单隐藏层）一叶千舟深度学习【理论】机器学习深度学习神经网络
目录一、什么是前馈神经网络？二、数学表达式是什么？三、为什么需要“非线性函数”？四、NumPy实现前馈神经网络代码示例五、运行结果六、代码解析6.1初始化部分6.2前向传播6.3计算损失（Loss）6.4反向传播（手动）6.5更新参数（梯度下降）6.6循环训练七、训练过程可视化（思维图）八、关键问题答疑Q1：为什么需要隐藏层？Q2：ReLU是干嘛的？Q3：学习率怎么选？九、总结学习建议在机器学习中
Python性能优化指南：让你的代码提速10倍的实用技巧天天进步2015 python python
Python以其简洁易用著称，但在性能方面常被诟病。其实，通过一些实用的优化技巧，你的Python代码性能完全可以提升数倍甚至十倍。本文将结合实际经验，系统介绍Python性能优化的常见思路与方法，并给出具体案例，助你写出高效的Python程序。1.算法与数据结构优化优先选择合适的数据结构：如查找用set/dict，顺序存储用list。避免不必要的嵌套循环，能用集合操作、字典映射解决的，绝不用暴力
【行云流水a】淘天联合爱橙开源强化学习训练框架ROLL OpenRL/openrl PPO-for-Beginners: 从零开始实现强化学习算法PPO 强化学习框架verl 港大等开源GoT-R1 行云流水AI笔记开源算法
以下是DQN（DeepQ-Network）和PPO（ProximalPolicyOptimization）的全面对比流程图及文字解析。两者是强化学习的核心算法，但在设计理念、适用场景和实现机制上有显著差异：graphTDA[对比维度]-->B[算法类型]A-->C[策略表示]A-->D[动作空间]A-->E[学习机制]A-->F[探索方式]A-->G[稳定性]A-->H[样本效率]A-->I[关键
LeetCode Hot100(二分） asom22 LeetCode Hot100 题解 leetcode 算法职场和发展
35.搜索插入位置题意给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为O(logn)的算法。题解首先理解二分的做法，我们对于一个有序的序列，每一次都查询他中间的位置，如果当前位置大于他，那就肯定在大于他的那侧，反之就在他小于他的那侧，代码实现如下代码importjava.util.ArrayList;im
微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
随机近似算法：步长序列选择的理论与金融实践
随机近似算法：步长序列选择的理论与金融实践摘要随机近似算法作为统计学习与优化的核心工具，其收敛性与稳定性高度依赖步长序列的设计。本文系统阐述步长序列的理论约束与工程选择策略，并结合金融波动率估计场景，展示算法在动态系统参数估计中的实践价值。1.随机近似算法的数学框架随机近似算法通过随机样本的迭代更新逼近目标参数，其核心迭代式为：θn+1=θn+an(Yn−g(θn))\theta_{n+1}=\t
DAY 43 复习日 yizhimie37 python训练营打卡笔记深度学习
@浙大疏锦行https://blog.csdn.net/weixin_45655710第一步：寻找并准备图像数据集在Kaggle等平台上，你可以找到大量用于图像分类任务的数据集，例如英特尔图像分类数据集(IntelImageClassification)或手写数字识别数据集(DigitRecognizer)。对于初学者，一个更便捷的选择是使用像TensorFlow或PyTorch这样深度学习框架内
浏览器的垃圾回收机制甘露寺 js 浏览器 javascript 前端
深入解析现代浏览器的垃圾回收机制：分代回收与标记清除算法本文详细探讨了Chrome、Firefox等现代浏览器中JavaScript引擎的垃圾回收（GC）原理，重点讲解分代回收策略和标记清除/整理算法的工作流程，并通过示例帮助理解内存自动管理背后的机制。为什么需要垃圾回收？JavaScript是一种自动内存管理的语言。开发者通常不需要手动分配或释放内存（如C/C++中的malloc/free）。这
在MATLAB中使用GPU加速计算及多GPU配置东北豆子哥 CUDA 数值计算/数值优化 Matlab/Octave matlab
文章目录在MATLAB中使用GPU加速计算及多GPU配置一、基本GPU加速使用1.检查GPU可用性2.将数据传输到GPU3.执行GPU计算二、多GPU配置与使用1.选择特定GPU设备2.并行计算工具箱中的多GPU支持3.数据并行处理（适用于深度学习）三、高级技巧1.异步计算2.优化GPU内存使用3.使用GPU加速函数四、注意事项在MATLAB中使用GPU加速计算及多GPU配置MATLAB提供了强大
点云从入门到精通技术详解100篇-点云滤波算法及单木信息提取格图素书人工智能
目录知识储备点云滤波算法及单木信息提取点云条件滤波单木信息提取1.点云预处理2.点云密度计算3.密度阈值筛选4.骨架提取5.骨架细化优化方向前言国内外研究现状激光雷达研究现状点云数据的滤波算法研究现状单木分割应用现状LiDAR工作原理与点云数据的组成2.1LiDAR系统的内部结构2.1.1激光测距单元2.1.2光学机械扫描单元2.1.3惯性导航系统INS2.1.4动态差分GPS2.2定位原理2.3
Golang动态路由实现：灵活处理URL路径 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
Golang动态路由实现：灵活处理URL路径关键词：Golang动态路由、URL路径处理、参数化路由、通配符匹配、路由算法、HTTP框架、RESTful设计摘要：本文深入探讨Golang中动态路由的实现原理与实践方法，从基础概念到复杂场景逐步解析。通过对比标准库与第三方框架的路由机制，详细讲解参数捕获、通配符匹配、正则表达式路由等核心技术。结合具体代码示例演示如何构建高性能路由系统，涵盖路由匹配算
动态规划之01背包问题蓝澈1121 数据结构与算法动态规划算法 java
动态规划算法动态规划算法介绍动态规划(DynamicProgramming)算法的核心思想是：将大问题划分为小问题进行解决，从而一步步获取最优解的处理算法动态规划算法与分治法类似，其基本思想也是将待解决问题分解成若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解与分治法不同的是，适合于动态规划求解的问题。经分解得到子问题往往不是互相独立的。（即下一个子阶段的求解是建立在上一个子阶段的基
CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
分布式系统ID生成方案深度解析：雪花算法 vs UUID vs 其他主流方案可曾去过倒悬山算法后端
分布式系统ID生成方案深度解析：雪花算法vsUUIDvs其他主流方案在分布式系统中，如何高效生成全局唯一ID是一个关键挑战。本文将深入剖析雪花算法、UUID及多种主流ID生成方案，帮助开发者根据业务场景选择最佳方案。一、为什么需要分布式ID？在分布式系统中，传统数据库自增ID存在明显瓶颈：单点故障：依赖单数据库实例扩展困难：分库分表时ID冲突安全风险：连续ID暴露业务量性能瓶颈：高并发下成为系统瓶
C#哈希加密：原理、实现与应用阿蒙Armon C#工作中的应用 c#哈希算法开发语言
C#哈希加密：原理、实现与应用在当今数字化时代，数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术，在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实际应用，并通过代码示例展示如何在C#中实现哈希加密。一、哈希加密基础哈希加密（也称为哈希函数或散列函数）是一种将任意长度的输入数据转换为固定长度输出的算法。这个固定长度的输
java 学习底层代码算法好学且牛逼的马 java
#33写算法题黑马的视频争取简单的过一遍要考试啦密码的写底层代码秘密的底层代码有点长啊看不懂难找了几个视频课看看吧想看中文版jdkapi吧算了慢慢看先把几个顶级父类给看会了objectsystemstringstringbuilder算法单路递归packagecom.itheima.Recursion;publicclasssingleRecursion{ publicstaticvoidma
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

CVPR 2022 Image Dehazing Transformer with Transmission-Aware 3D Position Embedding 个人学习笔记

你可能感兴趣的:(图像去雾算法,计算机视觉,深度学习)