XD207R

Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising

Abstract

图像去噪的判别模型学习由于其良好的去噪性能，近年来受到了人们的广泛关注。本文通过研究前馈去噪卷积神经网络(DnCNNs)的构建，将深度架构、学习算法和正则化方法在图像去噪方面的进展向前推进了一步。具体来说，利用残差学习和批处理归一化来加速训练过程，提高去噪性能。与通常在特定噪声水平上训练加性高斯白噪声（AWGN）的特定模型的现有判别去噪模型不同，我们的DnCNN模型能够处理具有未知噪声水平的高斯去噪（即，盲高斯去噪）。利用残差学习策略，DnCNN隐式去除隐藏层中隐藏的干净图像。这一特性促使我们训练单个DnCNN模型来处理多个常规图像去噪任务，如高斯去噪、单图像超分辨率和JPEG图像解块。我们的大量实验表明，我们的DnCNN模型不仅可以在几个常规的图像去噪任务中显示出较高的有效性，而且可以通过受益于GPU计算而有效地实现。

I. INTRODUCTION

图像去噪是低级视觉中经典但仍然活跃的主题，因为它是许多实际应用中不可或缺的一步。图像去噪的目标是从噪声观察y中恢复干净图像x，其遵循图像退化模型y = x + v。一个常见的假设是v是具有标准偏差σ的加性高斯白噪声（AWGN）。从贝叶斯观点来看，当已知可能性时，图像先验建模将在图像去噪中起核心作用。在过去的几十年中，各种模型已经被用于建模图像先验，包括非局部自相似（NSS）模型[1]，[2]，[3]，[4]，稀疏模型[4]，[5] ，[6]，梯度模型[7]，[8]，[9]和马尔可夫随机场（MRF）模型[10]，[11]，[12]。特别是，NSS模型在最先进的方法中很受欢迎，如BM3D [2]， LSSC [4]， NCSR[6]和WNNM[13]。

尽管基于图像先验的去噪方法具有很高的去噪质量，但大多数方法都存在两个主要缺点。首先，这些方法在测试阶段通常涉及到一个复杂的优化问题，使得去噪过程耗时[6]，[13]。因此，大多数基于先验的方法很难在不牺牲计算效率的情况下获得高性能。其次，模型一般是非凸的，涉及多个人工选择的参数，为提高去噪性能提供了一定的余地。

为了克服基于先验的方法的局限性，最近开发了几种判别学习方法以在截断推理过程的背景下学习图像先验模型。得到的模型能够摆脱测试阶段的迭代优化过程。Schmidt和Roth[14]提出了一种级联收缩场(CSF)方法，将基于随机场的模型和展开的半二次优化算法结合在一个学习框架中。Chen等人[15]、[16]提出了一种可训练的非线性反应扩散(TNRD)模型，该模型通过展开固定数量的梯度下降推理步骤，先验学习专家改进的[12]图像域。其他一些相关的工作可以在[17][18]中找到。虽然CSF和TNRD在弥合计算效率和去噪质量之间的差距方面显示出了有希望的结果，但它们的性能本质上局限于先验的指定形式。具体来说，CSF和TNRD所采用的先验是基于分析模型的，在获取图像结构的全部特征方面受到了限制。此外，参数是通过逐阶段贪婪训练和各个阶段之间的关节微调来学习的，涉及到许多手工制作的参数。另一个不可忽略的缺点是它们训练了特定噪声水平的特定模型，在盲图像去噪中受到限制。

在本文中，我们将图像去噪作为一个普通的判别学习问题，而不是使用显式图像先验来学习判别模型，利用前馈卷积神经网络(CNN)将噪声从噪声图像中分离出来。使用CNN的原因有三方面。首先，[19]架构非常深的CNN有效地提高了挖掘图像特征的能力和灵活性。第二，CNN训练的正则化和学习方法取得了长足的进步，包括整流线性单元(ReLU)[20]、批量归一化[21]和残差学习[22]。这些方法可用于CNN中，加快训练过程，提高去噪性能。第三，CNN非常适合在现代强大的GPU上进行并行计算，可以用来提高运行时性能。

我们将提出的去噪卷积神经网络称为DnCNN。不是直接输出去噪图像 $\hat{X}$ ，而是将所提出的DnCNN设计成预测残留图像 $\hat{V}$ ，即噪声观察和潜在清洁图像之间的差异。也就是说，所提出的DnCNN通过隐层中的操作隐式地删除了隐藏的干净图像。进一步引入批量归一化技术，稳定和提高DnCNN的训练性能。结果表明，残差学习和批处理归一化是相互促进的，两者的集成可以有效地加快训练速度，提高去噪性能。

虽然本文旨在设计一种更有效的高斯降噪器，但我们观察到当v是地面实况高分辨率图像与低分辨率图像的双三次上采样之间的差异时，高斯降噪的图像劣化模型可以转换为单个图像超分辨率（SISR）问题;类似地，JPEG图像去块问题可以通过将v作为原始图像和压缩图像之间的差异来通过相同的图像劣化模型来建模。从这个意义上讲，SISR和JPEG图像去块可以被视为一般图像去噪问题的两种特殊情况，尽管在SISR和JPEG去块中，噪声与AWGN有很大不同。很自然地会问是否有可能训练CNN模型来处理这种一般的图像去噪问题？通过分析DnCNN与TNRD之间的联系[16]，我们提出扩展DnCNN来处理几种一般的图像去噪任务，包括高斯去噪，SISR和JPEG图像去块。

大量实验表明，我们用一定噪声水平训练的DnCNN可以产生比BM3D [2]，WNNM [13]和TNRD [16]等最先进方法更好的高斯去噪效果。对于具有未知噪声水平的高斯去噪（即盲高斯去噪），具有单个模型的DnCNN仍然优于BM3D [2]和TNRD [16]针对特定噪声水平进行训练。当扩展到几个一般图像去噪任务时，DnCNN也可以获得有希望的结果。此外，我们展示了仅针对三种一般图像去噪任务训练单个DnCNN模型的有效性，即，盲高斯去噪，具有多个放大因子的SISR，以及具有不同质量因子的JPEG解块。

这项工作的贡献总结如下：

1）提出了一种端到端可训练的深度CNN高斯去噪算法。与现有的基于深度神经网络的直接估计潜清洁图像的方法相比，该网络采用残差学习策略从噪声观测中去除潜清洁图像。

2）我们发现残差学习和批处理归一化对CNN的学习有很大的帮助，不仅可以加快训练速度，而且可以提高去噪性能。对于具有一定噪声水平的高斯去噪，DnCNN在定量指标和视觉质量上都优于最先进的方法。

3）我们的DnCNN可以很容易地扩展到处理一般的图像去噪任务。我们可以训练单一的DnCNN模型进行高斯盲去噪，并且比针对特定噪声水平训练的其他方法获得更好的性能。此外，有希望解决三个一般的图像去噪任务，即盲高斯去噪，SISR和JPEG去块，只有一个DnCNN模型。

本文的其余部分组织如下。第二节简要介绍了有关工作。第三节首先给出了所提出的DnCNN模型，然后将其扩展到一般的图像去噪。在第四节中，我们进行了广泛的实验来评估DnCNNs。最后，第五节提出了一些结束语。

II. RELATED WORK

A. Deep Neural Networks for Image Denoising
针对深度神经网络去噪问题，已有多种尝试。在[23]中，Jain和Seung提出利用卷积神经网络(tional neural network, CNNs)进行图像去噪，并声称CNNs具有与MRF模型相似甚至更好的表示能力。在[24]中，多层感知器(MLP)成功应用于图像去噪。[25]采用叠加稀疏去噪自编码器方法对高斯噪声进行去除，与K-SVD[5]效果相当。在[16]中，提出了一种可训练的非线性反应扩散(TNRD)模型，该模型通过展开一定数量的梯度下降推理步骤，可表示为前馈深度网络。在上述基于深度神经网络的方法中，MLP和TNRD均能达到较好的性能，能够与BM3D相竞争。然而，对于MLP[24]和TNRD[16]，针对一定的噪声水平，训练一个特定的模型。据我们所知，CNN对于一般图像去噪的研究还没有展开。

B. Residual Learning and Batch Normalization
近年来，卷积神经网络由于能够方便地获取大规模数据集和深度学习方法的进步，在处理各种视觉任务方面取得了巨大的成功。训练CNN模型的代表性成果有:校正线性单元[20]、深度与宽度折衷[19]、[26]、参数初始化[27]、基于梯度的优化算法[28]、[29]、[30]、批处理归一化[21]、残差学习[22]。其他因素，如在现代强大的gpu上高效的训练实施，也有助于CNN的成功。对于高斯去噪，从一组高质量的图像中容易产生足够的训练数据。本文主要研究CNN图像去噪的设计与学习。接下来，我们将简要回顾与DnCNN相关的两种方法，即，残差学习和批处理归一化。

1) Residual Learning:
CNN的残差学习[22]最初是为了解决性能下降的问题，即，随着网络深度的增加，训练精度也开始下降。通过假设残差映射比原始的未引用映射更容易学习，残差网络明确地学习了几个叠加层的残差映射。利用这种残差学习策略，可以很容易地训练出深度极高的CNN，提高了图像分类和目标检测[22]的准确率。

提出的DnCNN模型也采用残差学习公式。与使用许多残差单元（即，同一性快捷方式）的残差网络[22]不同，我们的DnCNN使用单个残余单元来预测残留图像。通过分析残差学习公式与TNRD[16]的关系，进一步解释了残差学习公式的原理，并将其扩展到解决几种常用的图像去噪任务。需要注意的是，在残差网络[22]出现之前，在单图像超分辨率[31]和彩色图像去马赛克[32]等低阶视觉问题中，已经采用了残差图像预测策略。然而，据我们所知，目前还没有直接对残差图像进行去噪预测的工作。

2）Batch Normalization:

小批量随机梯度下降（SGD）已广泛用于训练CNN模型。尽管小批量SGD具有简单性和有效性，通过内部协变位移，其训练效率大大降低[21]，即训练期间内部非线性输入分布的变化。为了减轻内部协变位移的影响，提出了批量归一化[21]的方法，即在每一层非线性之前，结合归一化步骤和尺度和位移步骤。对于批处理规范化，每次激活只添加两个参数，并且可以通过反向传播更新它们。批处理规范化具有训练快、性能好、初始化灵敏度低等优点。有关批处理规范化的详细信息，请参阅[21]。

到目前为止，基于cnn的图像去噪的批处理归一化研究尚未开展。我们通过实证发现，将残差学习和批处理归一化相结合，可以得到快速稳定的训练和较好的去噪效果。

III. THE PROPOSED DENOISING CNN MODEL

在本节中，我们提出了所提出的去噪CNN模型，即DnCNN，并扩展它以处理几个一般的图像去噪任务。通常，针对特定任务训练深度CNN模型通常涉及两个步骤：（i）网络架构设计和（ii）从训练数据学习模型。对于网络架构设计，我们修改VGG网络[19]以使其适用于图像去噪，并根据最先进的去噪方法中使用的有效色块大小设置网络的深度。对于模型学习，我们采用残差学习公式，并将其与批量归一化相结合，实现快速训练，提高去噪性能。最后，我们讨论了DnCNN与TNRD[16]之间的联系，并将DnCNN扩展到几个一般的图像去噪任务中。

A.Network Depth

根据[19]中的原则，我们将卷积过滤器的大小设置为3x3，但是删除所有池化层。因此，深度为d的DnCNN感受野应为(2d+1)x (2d+1)。增加感受野大小可以利用较大图像区域中的上下文信息。为了在性能和效率之间进行更好的权衡，架构设计中的一个重要问题是为DnCNN设置适当的深度。

已经指出，去噪神经网络的感受野大小与去噪方法的有效patch大小相关[23]，[24]。此外，高噪声水平通常需要更大的有效patch大小来捕获更多的上下文信息以进行恢复[34]。因此，通过固定噪声水平σ= 25，我们分析了几种主要去噪方法的有效patch尺寸，以指导我们的DnCNN的深度设计。在BM3D [2]中，非局部相似贴片在大小为25x25的局部窗口中自适应搜索两次，因此最终有效贴片大小为49x49。与BM3D类似，WNNM[13]使用了更大的搜索窗口，并迭代执行非局部搜索，从而产生了相当大的有效patch大小(361x361)。MLP[24]首先使用大小为39x39的patch生成预测的patch，然后使用大小为9x9的filter对输出的patch进行平均，其有效patch大小为47x47。具有五个阶段的CSF [14]和TNRD [16]涉及总共十个卷积层，其滤波器尺寸为7×7，并且它们的有效patch尺寸为61×61。

表I总结了在噪声水平σ= 25的不同方法中采用的有效patch尺寸。可以看出，EPLL [33]中使用的有效patch尺寸最小，即36x36。
有趣的是，验证感受野大小类似于EPLL的DnCNN能否与主流去噪方法竞争。因此，对于具有一定噪声水平的高斯去噪，我们将DnCNN的感受野大小设置为35x35，对应深度为17。对于其他一般的图像去噪任务，我们采用较大的感受野，深度设置为20。

B.Network Architecture

我们的DnCNN的输入是噪声观察y = x + v。诸如MLP [24]和CSF [14]之类的判别去噪模型旨在学习映射函数F（y）= x来预测潜在的清洁图像。对于DnCNN，我们采用残差学习公式来训练残差映射 $R(y)\approx v$ ，然后我们得到。形式上，所需残差图像与噪声输入的估计残差图像之间的平均均方误差

$l(\Theta )=\frac{1}{2N}\sum_{i=1}^{N}||R(y_{i};\Theta)-(y_{i}-x_{i})||_{F}^{2}$ (1)

可以采用损失函数来学习DnCNN中的可训练参数Θ。这里表示N个噪声干净的训练图像（patch）对。图1示出了用于学习R（y）的所提出的DnCNN的架构。在下文中，我们将解释DnCNN的体系结构和减少边界伪影的策略。

1）Deep Architecture:

给定深度为D的DnCNN，有三种类型的层，如图1所示，具有三种不同的颜色。（i）Conv + ReLU：对于第一层，使用64个大小为3x3xc的滤波器来生成64个特征图，然后将整流线性单元用于非线性。这里c表示图像通道的数量，即灰度图像的c = 1，彩色图像的c = 3。（ii）Conv + BN + ReLU：对于 $2\sim (D-1)$ 层，使用64个大小为3x3x64的过滤器，并在卷积和ReLU之间添加批量标准化[21]。（iii）Conv：对于最后一层，使用大小为3x3x64的c个滤波器来重建输出。

综上所述，我们的DnCNN模型有两个主要特点:采用残差学习公式来学习R(y)，并结合批量归一化来加速训练，提高去噪性能。通过与ReLU的卷积，DnCNN可以通过隐藏层逐步将图像结构从噪声观测中分离出来。这种机制类似于在EPLL和WNNM等方法中采用的迭代噪声去除策略，但是我们的DnCNN是采用端到端的方式进行训练的。稍后我们将对残差学习和批处理规范化相结合的原理进行更多的讨论。

2）Reducing Boundary Artifacts:

在许多低级别的视觉应用程序中，通常要求输出图像的大小与输入图像的大小保持一致。这可能会导致边界伪影。在MLP[24]中，预处理阶段对噪声输入图像的边界进行对称填充，而在CSF[14]和TNRD[16]中，每个阶段之前都进行相同的填充策略。与上述方法不同，我们在卷积之前直接填充零，以确保中间层的每个特征图具有与输入图像相同的大小。我们发现简单的零填充策略不会导致任何边界伪影。这个好的属性可能归因于DnCNN的强大能力。

C. Integration of Residual Learning and Batch Normalization for Image Denoising

图1所示的网络既可以训练原映射F(y)预测x，也可以训练残差映射R(y)预测v。根据[22]，当原映射更像恒等映射时，残差映射更容易优化。值得注意的是，噪声观测y更像潜在的干净图像x，而不是残留图像v(尤其是在噪声水平较低的情况下)。因此，F(y)比R(y)更接近恒等映射，残差学习公式更适合图像去噪。

图2显示了在基于梯度的优化算法和网络体系结构的相同设置下使用这两种学习公式获得的平均PSNR值，有/无批次归一化。注意，采用两种基于梯度的优化算法：一种是具有动量的随机梯度下降算法（即SGD），另一种是Adam算法[30]。首先，我们可以观察到残差学习公式比原映射学习收敛更快、更稳定。同时，如果没有批处理归一化，传统SGD的简单残差学习无法与TNRD (28.92dB)等最先进的去噪方法竞争。我们认为这种不足的表现是由于训练过程中网络参数的变化所引起的内部协变漂移[21]造成的。因此，我们采用批处理规范化来解决这个问题。其次，我们观察到，通过批量归一化，学习残差映射(红线)比学习原始映射(蓝线)收敛更快，去噪性能更好。其中，SGD和Adam优化算法都能使具有残差学习和批处理归一化的网络获得最好的结果。也就是说，去噪效果最好的不是SGD或Adam算法，而是残差学习公式和批处理归一化的集成。

实际上，我们可以注意到，在高斯去噪中，残差图像和批处理归一化都与高斯分布有关。在高斯去噪中，残差学习和批处理归一化很有可能相互受益。下面的分析可以进一步验证这一点。

一方面，残差学习得益于批处理规范化。这很简单，因为批处理规范化为CNNs提供了一些优点，比如减轻了内部协变移位问题。从图2中可以看出，虽然没有批处理归一化的残差学习(绿线)收敛速度较快，但仍不如批处理归一化的残差学习(红线)。
另一方面，批处理规范化得益于残差学习。如图2所示，在没有残差学习的情况下，批处理归一化甚至会对收敛产生一定的不利影响(蓝线)。通过残差学习，可以利用批处理归一化来加速训练，提高性能(红线)。注意，每个小批量是一小组（例如，128个）图像。在没有残差学习的情况下，输入强度和卷积特征与它们的相邻特征相关联，并且层输入的分布也依赖于每个训练小批量中的图像的内容。通过残差学习，DnCNN通过隐层中的操作隐式地去除隐藏的干净图像。这使得每一层的输入都是高斯分布的，相关性较低，与图像内容的相关性也较低。因此，残差学习还可以帮助批处理标准化，以减少内部协变位移。

综上所述，将残差学习和批处理归一化相结合，不仅可以加快和稳定训练过程，而且可以提高去噪性能。

D. Connection with TNRD

我们的DnCNN也可以解释为一阶段TNRD的推广[15]，[16]。通常，TNRD旨在通过大量降级 - 清洁训练图像对训练针对以下问题的判别解决方案。

$\underset{x}{min}\Psi (y-x)+\lambda \sum_{k=1}^{K}\sum_{p=1}^{N}\rho _{k}((f_{k}*x)_{p})$ (2)

这里N表示图像大小，λ表示正则化参数，fk*x表示图像x与第k个滤波器核fk的卷积，ρk（·）表示在TNRD模型中可调整的第k个惩罚函数。对于高斯去噪，我们设置 $\Psi (z)=\frac{1}{2}||z||^2$ 。

第一阶段的扩散迭代可以被解释为在起始点y处执行一个梯度下降推断步骤，其由下式给出

$x_{1}=y-\alpha \lambda\sum_{k=1}^{K}(\bar{f}_{k}*\phi _{k}(f_{k}*y))-\alpha \frac{\partial \Psi (z))}{\partial z}|_{z=0}$ (3)

其中 $\bar{f}_{k}$ 是 $f_{k}$ 的伴随滤波器（即， $\bar{f}_{k}$ 是通过将滤波器 $f_{k}$ 旋转180度获得的），α对应于步长，并且 $\rho ^{'}_{k}(.)=\phi _{k}(.)$ 。对于高斯去噪，我们得到 $\frac{\partial \Psi (z)}{\partial (z)}|_{z=0}$ 和等式（3）等同于以下表达式

$v_{1}=y-x_{1}=\alpha\lambda\sum_{k=1}^{K}(\bar{f}_{k}*\phi _{k}(f_{k}*y))$ (4)

其中v1是x关于y的估计残差。

由于影响函数φk（·）可以被认为是应用于卷积特征映射的逐点非线性，因此，方程（4）实际上是一个双层前馈CNN。从图1中可以看出，所提出的CNN架构从三个方面进一步概括了一阶段TNRD：（i）用ReLU取代影响函数以简化CNN训练；（ii）增加CNN深度，提高图像特征建模能力;（iii）与批处理规范化相结合，提高性能。与单阶段TNRD的联系为解释残差学习在基于cnn的图像恢复中的应用提供了见解。方程（4）中的大多数参数来自方程（2）的先前项的分析。在这个意义上，DnCNN中的大多数参数代表图像先验。

有趣的是，即使噪声不是高斯分布的(或者高斯的噪声级别未知)，我们仍然可以利用方程(3)得到v1

$\frac{\partial \Psi (z)}{\partial z}|_{z=0}=0$ (5)

注意，方程(5)适用于多种噪声分布，如广义高斯分布。很自然地，对于SISR和JPEG压缩造成的噪声，也可以这样假设。训练单个CNN模型可以完成多个常规图像去噪任务，如噪声水平未知的高斯去噪、多个上标度因子的SISR去噪、不同质量因子的JPEG去噪。

方程（4）也可以解释为从劣化的观察y中去除潜在清洁图像x以估计残留图像v的操作。对于这些任务，即使噪声分布也很复杂，可以预期我们的DnCNN还可以通过逐渐去除隐藏层中的潜在干净图像来稳健地预测残留图像。

E.Extension to General Image Denoising

现有的判别高斯去噪方法，如MLP、CSF和TNRD，都训练了固定噪声级[16]、[24]的特定模型。在未知噪声的高斯去噪中，一种常用的方法是先估计噪声水平，然后使用相应噪声水平训练的模型。这使得去噪结果受到噪声估计精度的影响。此外，这些方法不能应用于非高斯噪声分布的情况，如SISR和JPEG去块。

我们在第III-D节中的分析显示了DnCNN在一般图像去噪中的潜力。为了证明这一点，我们首先将我们的DnCNN扩展为具有未知噪声水平的高斯去噪。在训练阶段，我们使用来自各种噪声水平（例如， $\sigma \in [0,55]$ ）的噪声图像来训练单个DnCNN模型。对于噪声级属于噪声级范围的测试图像，利用学习的单DnCNN模型可以在不估计噪声级的情况下进行降噪。

我们通过学习单个模型来进一步扩展我们的DnCNN，用于几个一般的图像去噪任务。我们考虑三个特定任务，即盲高斯去噪，SISR和JPEG去块。在训练阶段，我们利用大范围噪声级的AWGN图像，多个上标度因子的下采样图像，以及不同质量因子的JPEG图像来训练单个DnCNN模型。实验结果表明，学习的单DnCNN模型在三种常规图像去噪任务中均能取得较好的去噪效果。

IV. EXPERIMENTAL RESULTS

A. Experimental setting

1) Training and Testing Data:对于已知或未知噪声水平的高斯去噪，我们跟随[16]使用400幅大小为180x180的图像进行训练。我们发现使用更大的训练数据集只能带来微不足道的改进。为了训练DnCNN进行具有已知噪声水平的高斯去噪，我们考虑三个噪声水平，即σ= 15,25和50。我们将patch大小设置为40x40，裁剪128x1; 600个patch来训练模型。我们将具有已知特定噪声水平的高斯去噪的DnCNN模型称为DnCNN-S。

为了训练单个DnCNN模型进行盲高斯去噪，我们将噪声水平的范围设置为 $\sigma \in [0,55]$ ，patch尺寸为50x50。128x3000个patch裁剪以训练模型。我们将用于盲高斯去噪任务的单个DnCNN模型称为DnCNN-B。

对于测试图像，我们使用两种不同的测试数据集进行全面的评估，一种是包含来自Berkeley dataset (BSD68)[12]的68幅自然图像的测试数据集，另一种是包含12幅图像的测试数据集，如图3所示。需要注意的是，这些图像都被广泛应用于高斯去噪方法的评估中，而在训练数据集中并不包含这些图像。

除了灰度图像去噪之外，我们还训练盲目彩色图像去噪模型，称为CDnCNNB。我们使用BSD68数据集的彩色版本进行测试，并采用Berkeley分割数据集中剩余的432个彩色图像作为训练图像。噪声水平也设置在[0,55]和裁剪了128x3000个大小为50x50的patch来训练模型。

为了学习三种常用图像去噪任务的单个模型，如[35]，我们使用了一个数据集，该数据集由来自[36]的91幅图像和来自Berkeley分割数据集的200幅训练图像组成。在[0,55]范围内加入一定噪声水平的高斯噪声，生成噪声图像。SISR输入是通过第一个双三次下采样生成的，然后使用缩减因子2,3和4对高分辨率图像进行双三次上采样。JPEG解块输入是通过使用MATLAB JPEG编码器压缩质量因子从5到99的图像生成的。所有这些图像都被视为单个DnCNN模型的输入。总的来说，我们生成128x8,000个图像patch（大小为50x50）对进行训练。在小批量学习期间使用patch对上的基于旋转/翻转的操作。参数用DnCNN-B初始化。我们将这三个一般图像去噪任务的单个DnCNN模型称为DnCNN-3。为了测试DnCNN-3，我们对每个任务采用不同的测试集，详细描述将在第IV-E节中给出。

2) Parameter Setting and Network Training:为了捕获足够的空间信息进行去噪，我们将DnCNN-S的网络深度设置为17，将DnCNN-B和DnCNN-3的网络深度设置为20。采用公式（1）中的损失函数来学习用于预测残差v的残差映射R（y）。我们通过[27]中的方法初始化权重，并使用SGD，权重衰减为0.0001，动量为0.9，小批量大小为128。我们为DnCNN模型训练了50个时期。在50个时期，学习率从1e-1到1e-4呈指数衰减。

我们使用MatConvNet软件包[37]来训练提出的DnCNN模型。除非另有说明，否则所有实验均在Matlab（R2015b）环境中进行，该环境在具有Intel（R）Core（TM）i7-5820K CPU 3.30GHz和Nvidia Titan X GPU的PC上运行。在GPU上分别训练DnCNN-S，DnCNNB / CDnCNN-B和DnCNN-3需要大约6小时，一天和三天。

B. Compared Methods

我们将提出的DnCNN方法与几种最先进的去噪方法进行比较，包括两种非局部相似性方法（即BM3D [2]和WNNM [13]），一种生成方法（即EPLL [33]）），三种基于判别训练的方法（即MLP [24]，CSF [14]和TNRD [16]）。注意，CSF和TNRD通过GPU实现是高效的，同时提供良好的图像质量。实现代码从作者的网站下载，我们的实验使用默认参数设置。我们DnCNN模型的测试代码可以在https://github.com/cszn/DnCNN下载。

C. Quantitative and Qualitative Evaluation

BSD68数据集上不同方法的平均PSNR结果如表II所示。可以看出，DnCNN-S和DnCNN-B都可以获得比竞争方法更好的PSNR结果。与基准的BM3D相比，MLP和TNRD方法的PSNR增益显著，约为0.35dB。根据[34]，[38]，很少有方法能超过BM3D平均0.3dB以上。相比之下，我们的DnCNN-S模型在三个噪声级别上都比BM3D要好0.6dB。特别是，即使是没有已知噪声水平的单一模型，我们的DnCNN-B仍然可以胜过针对已知特定噪声水平进行训练的竞争方法。值得注意的是，当σ= 50时，DnCNN-S和DnCNN-B的性能均优于BM3D约0.6dB，这与[38]中BM3D（0.7dB）的估计PSNR非常接近。

表III列出了图3中12幅测试图像不同方法的PSNR结果。对于每个噪声级别的图像，最佳PSNR结果用粗体突出显示。可以看出，在大多数图像中，DnCNN-S的PSNR最高。具体而言，DnCNN-S在大多数图像上的表现优于竞争方法0.2dB至0.6dB，并且仅在两个图像House和Barbara上实现最佳结果，这两个图像由重复结构支配。这一结果与[39]的研究结果一致:非局部均值法通常对结构规律性和重复性的图像效果较好，而基于判别训练的方法通常对纹理不规则的图像效果较好。实际上，这在直观上是合理的，因为具有规则和重复结构的图像与非局部相似先验很好地满足;反之，纹理不规则的图像会削弱这种特定先验的优势，导致较差的结果。

图4-5展示了不同方法的可视化结果。可以看出，BM3D、WNNM、EPLL和MLP容易产生过于光滑的边缘和纹理。在保留锐利边缘和细节的同时，TNRD可能会在平滑区域生成伪影。相比之下，DnCNN-S和DnCNN-B不仅可以恢复锐利的边缘和精细的细节，而且在平滑区域也能产生视觉上令人愉悦的效果。

对于彩色图像去噪，CDnCNN-B和基准CBM3D之间的视觉比较如图6-7所示。

可以看出，CBM3D在某些区域产生假色伪影，而CDnCNN-B可以恢复具有更自然色彩的图像。此外，CDnCNN-B可以生成比CBM3D具有更多细节和更锐利边缘的图像。

图8显示了相对于DnCNN-B / CDnCNN-B模型的不同噪声水平，BM3D / CBM3D的平均PSNR改善。可以看出，我们的DnCNN-B / CDnCNN-B型号在很宽的噪声水平范围内始终优于BM3D / CBM3D。该实验结果证明了训练单个DnCNN-B模型在广泛的噪声水平范围内处理盲高斯去噪的可行性。

D.Run Time

除了视觉质量，图像恢复方法的另一个重要方面是测试速度。表四给出了256x256、512x512、1024x1024三种图像去噪方法的运行时间，噪声等级为25。由于CSF、TNRD和我们的DnCNN方法非常适合在GPU上进行并行计算，我们也给出了相应的GPU上的运行时间。我们使用Nvidia cuDNNv5深度学习库来加速所提出的DnCNN的GPU计算。在[16]中，我们不计算CPU和GPU之间的内存传输时间。可以看出，所提出的DnCNN在CPU上具有较高的速度，比MLP和CSF两种判别模型都要快。虽然速度慢于BM3D和TNRD，但是考虑到图像质量的提高，我们的DnCNN在CPU实现上还是很有竞争力的。对于GPU时间，所提出的DnCNN实现了非常吸引人的计算效率，例如，它可以在60ms内对具有未知噪声水平的512×512大小的图像进行去噪，这是相对于TNRD的明显优势。

E. Experiments on Learning a Single Model for Three General Image Denoising Tasks

为了进一步展示所提出的DnCNN模型的能力，我们对单个DnCNN-3模型进行了训练，用于三种常用的图像去噪任务，包括盲高斯去噪、SISR和JPEG图像去块。据我们所知，现有的方法中没有一种仅用一个模型来处理这三个任务。因此，对于每个任务，我们将DnCNN-3与特定的最先进的方法进行比较。下面我们将描述每个任务的比较方法和测试数据集：

对于高斯去噪，我们使用最先进的BM3D和TNRD进行比较。BSD68数据集用于测试性能。对于BM3D和TNRD，我们假设噪声水平已知。
对于SISR，我们考虑两种最先进的方法，即TNRD和VDSR [35]。 TNRD训练了每个上升因子的特定模型，而VDSR [35]训练了所有三个升级因子（即2,3和4）的单个模型。我们采用[35]中使用的四个测试数据集（即Set5和Set14，BSD100和Urban100 [40]）。
对于JPEG图像去块，我们将DnCNN-3与两种最先进的方法进行比较，即AR-CNN [41]和TNRD [16]。 AR-CNN方法分别训练了JPEG质量因子10,20,30和40的四种特定模型。对于TNRD，训练了三个用于JPEG质量因子10,20和30的模型。与[41]中一样，我们采用Classic5和LIVE1作为测试数据集。

表V列出了不同方法对不同常规图像去噪任务的平均PSNR和SSIM结果。可以看出，即使我们训练一个DnCNN-3模型来完成这三种不同的任务，它在高斯去噪方面仍然优于非盲的TNRD和BM3D。对于SISR来说，它大大超过了TNRD，与VDSR不相上下。对于JPEG图像去锁，DnCNN-3在PSNR方面比AR-CNN高出约0.3dB，在所有质量因子上都比TNRD高出约0.1dB PSNR增益。

图9和图10为不同SISR方法的可视化比较。可以看出，DnCNN-3和VDSR都能产生锐利的边缘和精细的细节，而TNRD则容易产生模糊的边缘和扭曲的线条。图11为不同方法的JPEG去块结果。可以看出，我们的DnCNN-3可以恢复直线，而AR-CNN和TNRD容易产生扭曲的直线。图12给出了一个额外的例子来显示该模型的容量。我们可以看到，DnCNN- 3可以产生视觉上令人愉悦的输出结果，即使输入的图像被不同区域的不同级别的几种失真所破坏。

V.CONCLUSION

本文提出了一种用于图像去噪的深度卷积神经网络，利用残差学习将噪声从噪声观测中分离出来。将批量归一化和残差学习相结合，加快训练过程，提高去噪性能。与传统的针对特定噪声水平训练特定模型的判别模型不同，我们的单一DnCNN模型能够处理未知噪声水平的盲高斯去噪。此外，我们展示了训练单个DnCNN模型处理三种一般图像去噪任务的可行性，包括具有未知噪声水平的高斯去噪，具有多个放大因子的单图像超分辨率，以及具有不同质量因子的JPEG图像去块。大量实验结果表明，该方法不仅能定量、定性地获得良好的图像去噪性能，而且通过GPU实现具有良好的运行时间。

你可能感兴趣的:(图像处理)

JAI Core 1.1.3：Java 高级图像处理的利器顾润治
JAICore1.1.3：Java高级图像处理的利器javax.mediajai_core1.1.3如何下载项目地址:https://gitcode.com/Resource-Bundle-Collection/bda8b项目介绍JAICore1.1.3是JavaAdvancedImaging(JAI)库的核心组件，专为处理多媒体数据，特别是图像处理操作而设计。由SunMicrosystems（现
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
前端计算机视觉：使用 OpenCV.js 在浏览器中实现图像处理亿只小灿灿前端 OpenCV 前端计算机视觉 opencv
一、OpenCV.js简介与环境搭建OpenCV（OpenSourceComputerVisionLibrary）是一个强大的计算机视觉库，广泛应用于图像和视频处理领域。传统上，OpenCV主要在后端使用Python或C++等语言。但随着WebAssembly(Wasm)技术的发展，OpenCV也有了JavaScript版本——OpenCV.js，它可以直接在浏览器中高效运行，为前端开发者提供了前
Halcon 初步了解科学的发展-只不过是读大自然写的代码图形编程 c#视觉处理 Halcon
1.Halcon概述Halcon是德国MVTec公司开发的一套完善的机器视觉算法包，也是一款功能强大的视觉处理软件，为工业自动化领域提供了全面的解决方案。它拥有应用广泛的机器视觉集成开发环境，提供了一套丰富的图像处理和机器视觉算法，可以在各种工业应用中进行图像分析、目标检测、测量、定位、识别等任务。Halcon的核心功能包括图像处理、特征提取与匹配、3D视觉、深度学习、条码识别、OCR识别以及视觉
数字信号处理（DSP）全方位学习指南
本文还有配套的精品资源，点击获取简介：数字信号处理（DSP）是信息技术的关键部分，涉及多种数字信号的分析与处理技术，广泛应用于多个技术领域。本指南深入探索DSP的集成开发环境（IDE），基础概念，以及专业词汇，旨在帮助读者系统掌握DSP原理和实践技能。内容涵盖DSP集成开发环境CCS的使用、基础知识如傅里叶变换与滤波器设计，以及专业术语的学习。此外，还介绍了DSP在音频、图像处理和通信系统中的实际
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包常琚蕙
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包colour-demosaicingCFA(ColourFilterArray)DemosaicingAlgorithmsforPython项目地址:https://gitcode.com/gh_mirrors/co/colour-demosaicing项目介绍在数字图像处理领域，马赛克效应（Mosaicing）是
从摄像头接入到图像处理，TDA4VM带你一次搞定ADAS中控设计空间机器人 ADAS方案精讲图像处理人工智能
一张图全懂TDA4VM汽车感知中枢！从架构到踩坑，干货分析+选型建议写在前面：一块“脑子清醒”的车规芯片，是怎么思考的？别看这张图密密麻麻，其实它就是TI为车载/工业应用打磨多年的“感知-处理-输出”三段式架构，在这块Jacinto7J721ESOM评估板上体现得淋漓尽致：一句话总结：这不是开发板，这是把整个智能汽车的“中控大脑”装进了一个PCB。模块一：中央处理器区域（SOM板核心）=车脑J72
C#图像处理-OpenCVSharp教程(三十五) OpenCVSharp运动物体检测(一) Color Space OpenCVSharp C#OpenCV C#图像处理
本文作者ColorSpace，文章未经作者允许禁止转载！本文将介绍OpenCVSharp运动物体检测(一)代码演示：///图片背景差法检测运动物体MatbgImg=Cv2.ImRead("1.bmp");MatfgImg=Cv2.ImRead("55.bmp");Cv2.ImShow("bg",bgImg);Cv2.ImShow("fg",fgImg);Matgray=newMat();Matgr
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
大学专业科普 | 图像处理、智能控制与计算机工程鸭鸭鸭进京赶烤计算机工程
计算机工程专业介绍计算机工程专业是一个非常热门且具有广泛发展前景的领域，它涵盖了计算机硬件、软件以及它们之间的交互等多个方面。以下是对计算机工程专业的详细介绍：专业定义计算机工程专业主要是研究计算机系统的设计、开发、测试和维护。它融合了计算机科学和电子工程的知识，侧重于计算机硬件和软件的协同工作，以及计算机系统在各个领域的应用。课程设置基础课程数学课程物理课程计算机基础课程专业核心课程硬件方向课程
构建私有视觉搜索应用：多模态大模型的应用实例 2301_80727036 自然语言处理
在当今的科技时代，视觉搜索功能已经不再是新鲜事物，许多智能手机用户都可以通过自然语言搜索照片。随着开源多模态大型语言模型（Multi-modalLLMs）的兴起，我们现在可以为自己构建这种视觉搜索应用，用于管理自己的私人照片收藏。本教程将向您展示如何通过代码示例，使用开源多模态LLM构建私有视觉搜索和问答系统。技术背景介绍多模态大模型结合了文本和图像处理能力，使得我们可以开发更智能的应用程序。通过
图像处理100问-中文版(记录) STO检测王学习
https://gitee.com/mengfansheng163/ImageProcessing100Wen
海思Hi3519DV500方案1200万无人机吊舱套板 weixin_Todd_Wong2010 嵌入式硬件 AI 前端边缘计算图像处理
海思Hi3519DV500方案1200万无人机吊舱套板Hi3519DV500是一颗面向行业市场推出的超高清智能网络摄像头SoC。该芯片最高支持四路sensor输入，支持最高4K@30fps的ISP图像处理能力，支持2FWDR、多级降噪、六轴防抖、全景拼接、多光谱融合等多种传统图像增强和处理算法，支持通过AI算法对输入图像进行实时降躁等处理，为用户提供了卓越的图像处理能力，集成了高效的神经网络推理引
OpenCV实战：图像颜色识别与提取、掩膜制作
前言在计算机视觉和图像处理领域，颜色识别是一项基础而重要的技术。无论是交通标志识别、工业分拣还是美颜滤镜开发，都离不开对特定颜色的处理。本文将带你全面掌握使用OpenCV进行颜色识别的关键技术，包含完整的代码实现和原理讲解。一、颜色空间基础1.1RGB颜色空间在图像处理中，最常见的就是RGB颜色空间。RGB颜色空间是我们接触最多的颜色空间，是一种用于表示和显示彩色图像的一种颜色模型。RGB代表红色
OpenCV图像添加水印
一、前言在数字图像处理中，为图片添加水印是一项常见且重要的技术。无论是版权保护、品牌宣传还是防止未经授权的使用，水印都能发挥重要作用。OpenCV作为一款强大的计算机视觉库，提供了丰富的功能来实现各种水印效果。本教程将详细介绍如何使用OpenCV为图像添加文字水印和图片水印。二、环境准备在开始之前，请确保已安装以下环境：Python3.xOpenCV库（可通过pipinstallopencv-py
OpenCV图像噪点消除五大滤波方法慕婉0307 opencv基础 opencv 人工智能计算机视觉
在数字图像处理中，噪点消除是提高图像质量的关键步骤。本文将基于OpenCV库，详细讲解五种经典的图像去噪滤波方法：均值滤波、方框滤波、高斯滤波、中值滤波和双边滤波，并通过丰富的代码示例展示它们的实际应用效果。一、图像噪点与滤波基础1.1常见图像噪声类型高斯噪声：符合正态分布的随机噪声椒盐噪声：随机出现的黑白像素点泊松噪声：光子计数噪声量化噪声：模拟信号数字化过程中产生1.2滤波方法分类滤波类型特点
LSNet: 基于侧向抑制的神经网络碳酸的唐模型养成与叙述有意思的py库神经网络人工智能深度学习
引言在计算机视觉领域，我们一直在寻找灵感来源以提高图像处理和识别的效果。而人类视觉系统作为经过数百万年进化的精密系统，无疑是最好的参考对象之一。今天，我要向大家介绍一个名为LSNet（LateralSuppressionNetwork，侧向抑制网络）的技术，它模拟了人类视觉系统中的侧向抑制机制，为计算机视觉任务带来了新的可能性。什么是侧向抑制？侧向抑制（LateralSuppression），也被
AEPR人像磨皮润肤美容插件的使用指南觉昧
本文还有配套的精品资源，点击获取简介：AEPR人像磨皮润肤美容插件是一款结合AdobeAfterEffects和Photoshop的专业图像处理工具，用于视频和图像后期制作。该插件简化了人像美容过程，提供美白、磨皮和润色功能，帮助用户获得理想的视觉美感。通过使用该插件，用户能够轻松改善肤色和皮肤质地，而高斯模糊、斑点修复和色彩平衡调整等技术则保证了皮肤质感的自然与细腻。为了实现最佳效果，用户需要遵
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
车牌号识别Delphi演示程序：轻松实现车牌识别技术瞿巧群Justin
车牌号识别Delphi演示程序：轻松实现车牌识别技术去发现同类优质开源项目:https://gitcode.com/项目介绍在智能交通系统领域，车牌号识别是一项至关重要的技术。今天，我们要介绍的是一个基于Delphi语言开发的车牌号识别演示程序。该程序能够高效识别并处理车牌号码，为交通监控、停车场管理等领域提供了极大的便利。项目技术分析本项目基于Delphi环境开发，利用先进的图像处理技术，实现了
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
PyWavelets shangjg3 PyTorch pytorch 人工智能 python
PyWavelets（pywt）是Python中用于小波变换的核心库，提供了丰富的信号处理和图像处理功能。以下是其核心功能的详细介绍：1.小波变换基础（1）离散小波变换（DWT）将信号分解为近似系数（Approximation）和细节系数（Detail）。importpywtimportnumpyasnp#示例信号signal=np.array([1
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
如何使用 ligpng 库进行图片解码应用开发openwrt linux sdd20x平台 ruihuan_2000 SSD20X openwrt linux 嵌入式 c++
文章目录前言一、libpng是什么？二、使用步骤1.引入库及头文件2.解码过程总结前言如何使用libpng库进行图片解码应用开发。一、libpng是什么？libpng是一个开源的、跨平台的图像处理库，用于处理和支持PNG（PortableNetworkGraphics）图像格式。PNG是一种无损压缩的图像格式，广泛用于互联网上的图像传输和存储。libpng提供了一系列的API和函数，使开发者可以在
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
Qt, OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合奇树谦 QT qt opencv 图像处理
原文链接：https://developer.aliyun.com/article/1463740文章目录Qt,OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合1.引言图像处理与三维图形界面的重要性Qt,OpenCV与OpenGL简介与应用场景QtOpenCVOpenGL结合Qt,OpenCV与OpenGL的优势与价值2.Qt基础知识与特性Qt库的组成与功能Qt库的安装与使用Q
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
【运维】Python与Ansible协同作战：打造自动化服务器配置管理的终极解决方案蒙娜丽宁 Python杂谈人工智能运维 python ansible
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在现代IT运维中，服务器配置管理是一项繁琐但至关重要的任务。手动配置多台服务器不仅耗时，还容易出错。本文深入探讨如何利用Python结合Ansible工具实现自动化服务器配置管理与环境部署。通过Python脚本调用AnsibleAPI，我们可以动态生成配
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod