TiAN-GL

Toward Fast, Flexible, and Robust Low-Light Image Enhancement(论文阅读)

（2022_CVPR Oral）Toward Fast, Flexible, and Robust Low-Light Image Enhancement(迈向快速、灵活、稳健的微光图像增强)

作者团队：
Long Ma†, Tengyu Ma†, Risheng Liu‡*, Xin Fan‡, Zhongxuan Luo†
†School of Software Technology, Dalian University of Technology
‡International School of Information Science & Engineering, Dalian University of Technology

这里给出论文和代码的链接【paper】【code】

作者一上来就分别从视觉效果、计算效率以及评价指标三个方面对比了一下其他的弱光图像增强方法。一句话概括就是"在座的各位都是**。"(该说不说，作者的这种对比实验的呈现方式是值得借鉴的。)

图1. 将我们的方法与最新的方法进行比较。KinD[34]是一种具有代表性的成对监督方法。EnGAN[11]考虑非成对监督学习。ZeroDCE[7]和RUAS[14]引入了无监督学习。本文的方法(仅包含3个大小为3 × 3的卷积)也属于无监督学习。如图放大区域所示，这些对比方法均出现了曝光不正确、颜色失真、结构缺失等问题，降低了视觉质量。相比之下，我们的结果呈现了生动的色彩和清晰的轮廓。此外，我们在图(b)中的计算效率(SIZE、FLOPs和TIME)和图©中的增强(PSNR、SSIM和EME)、检测(mAP)和分割(mIoU)三个任务中的五种度量指标的数值得分，可以观察到我们的方法明显优于其他方法。

0 Abstract

现有的微光图像增强技术不仅难以兼顾视觉质量和计算效率，而且在未知的复杂场景中通常无效。在本文中，我们提出了一种新的自校准照明(Slef-Calibrated Illumination SCI)学习框架，用于在现实世界的低光场景中快速、灵活和鲁棒的增强图像。具体来说，我们建立了一个权重共享的级联照明学习过程来处理这个任务。考虑到级联模式的计算负担，我们构造了自校正模块，实现了在各阶段结果之间的收敛，使得在测试的时候，仅使用单个基本块就可以进行推理增强(这在以往的工作中尚未得到利用)，从而大大降低了计算成本。然后定义无监督训练损失，提高模型适应一般场景的能力。此外，我们还进行了全面的探索，去考证SCI的内在属性，包括操作不敏感的适应性(在不同简单操作设置下获得稳定的性能)和模型无关的通用性(可应用于现有的其他基于照明的方法，并提高性能)。大量的实验和消融实验证明了我们在质量和效率上的优势。弱光人脸检测和夜间语义分割等方面的应用也充分揭示了本文方法潜在的实用价值。源代码可在以下网站获得：https://github.com/vis-opt-group/SCI.

1 Introduction

弱光图像增强旨在使隐藏在黑暗中的信息可见，从而提高图像质量，近年来在多个新兴的计算机视觉领域受到了广泛关注[18,24,25]。下面我们将梳理两个相关课题的发展过程。然后进一步描述本文的主要贡献。
基于模型的方法
一般来说，Retinex理论[16]描述了弱光图像增强的基本物理规律，即弱光图像可分解为照明分量和反射分量(即我们想要得到的清晰图像)。Fu等人[5,6]利用L2范数的便捷求解，首先利用L2-范数来约束光照。Guo等人[8]采用相对总变分[28]作为光照的约束。然而，它的致命缺陷在于过度曝光的情况。Li等人[13]在统一的优化目标中对噪声去除和弱光增强进行建模。[10]中的工作提出了一种半解耦分解模型，以同时提高亮度和抑制噪声。一些作品(如LEACRM[17])利用相机的响应特性来进行增强。由于受到定义的正则化的限制，上述方法通常会产生不令人满意的结果，并且需要根据实际场景手动调整大量参数。
基于网络的方法
通过调整曝光时间，[3]中的工作构建了一个新的数据集，称为LOL数据集，还设计了RetinexNet，但是它往往产生不自然的增强结果。KinD[34]通过引入训练损失并调整网络架构，来改善RetinexNet中出现的问题。DeepUPE[22]定义了一个用于增强弱光输入图像的照明估计网络。[30]中的工作提出了一种递归的频带网络，并采用半监督策略进行训练。EnGAN[11]在非配对监督下设计了一种注意增强的生成器。SSIENet[33]建立了一个分解型的架构来同时估计照度和反射分量。ZeroDCE[7]启发式地构建了一条具有学习参数的二次曲线。最近，Liu等人用架构搜索构建了一个受Retinex启发的展开框架。不可否认，这些深度网络设计得很好。然而，它们并不稳定，很难实现持续的优越性能，特别是在未知的现实场景中，不清楚的细节和不适当的暴露无处不在。即较差的泛化性。
本文的贡献
为了解决上述问题，我们开发了一种新的自校准照明(SCI)学习框架，用于快速、灵活和鲁棒的微光图像增强。通过对光照学习过程的中间输出结果进行再处理，构造自校正模块，赋予单个基本块更强的表示性和各阶段结果之间的收敛性，实现加速。更具体地说，我们的主要贡献可以总结如下:

我们提出了一个自校正的共享权重照明学习模块，使各阶段的结果收敛，提高了曝光稳定性，大大减少了计算量。据我们所知，这是第一个利用在学习过程中加速弱光图像增强算法的工作。
我们定义了无监督训练损失，在自校正模块的作用下约束各阶段的输出，赋予了对不同场景的适应能力。属性分析表明，SCI具有操作不敏感的适应性和模型无关的通用性，这是现有文献所没有的。
我们进行了大量的实验，以证明我们的方法优于其他最先进的方法。进一步在黑暗人脸检测和夜间语义分割方面的应用，揭示了本文方法的实用价值。简言之，SCI重新定义了基于网络的微光图像增强领域的视觉质量、计算效率和下游任务的性能的峰值点。

2 The Proposed Method

在本节中，我们首先介绍了具有权重共享的照明学习，然后构建了自校正模块。其次介绍了无监督训练损失。最后，对我们构建的SCI进行了全面的讨论。

下图就是本文方法的主流程图

图2. 本文SCI的整个框架。在训练阶段，我们的SCI由自校正模块和照明估计模块组成。将自校正模块映射添加到原始弱光输入中，作为下一阶段照明估计的输入。注意，这两个模块在整个训练过程中分别是共享参数。在测试阶段，我们只使用一个照明估计模块。

2.1. Illumination Learning with Weight Sharing

根据Retinex理论，弱光图像y和期望的清晰图像z之间存在联系:即y = z⊗x，其中x表示光照分量。通常，照明被视为关键组成部分，需要优化的主要是弱光图像增强。根据Retinex理论，去除估计的照度可以进一步获得增强的输出。在这里，受文献[8,14]中提出的照明的阶段优化过程的启发，通过引入带有参数θ的映射Hθ来学习照明，我们从递进的角度来建模该任务，基本单元被写为：

其中ut和xt分别表示t阶段的残差项和光照(t = 0，…， T−1)。需要注意的是，我们没有在Hθ标记级号，因为我们采用了权重共享机制，即在每个级中使用相同的架构H和权重θ。
事实上，参数化算子Hθ学习了光照和弱光图像之间的简单残差表示。这一过程受到一个共识的启发，即光照和弱光图像在大多数地区是相似的或存在线性联系的。与采用弱光图像与光照之间的直接映射(现有工作中常用的模式相比下，如[14,22]，在同时保证性能和稳定性的同时，特别是曝光控制的情况下，学习残差表示大大降低了计算难度。
事实上，我们可以直接利用上述映射构建的过程与给定的训练损失和数据来获得增强的模型。但值得注意的是，具有多个权值共享块的级联机构不可避免地增加了可预见的推理成本。回顾这个共享过程，每个共享块都希望输出尽可能接近预期目标的结果。再进一步说，理想的情况是第一个块可以输出期望的结果，以满足任务需求。与此同时，后一个块输出与第一个块相似甚至完全相同的结果。这样，在测试阶段，我们只需要一个块来加快推理速度。接下来，我们将探讨如何实现它。

2.2. Self-Calibrated Module

在此之前，我们的目标是定义一个模块，使每个阶段的结果收敛到同一状态。我们知道每一级的输入都来源于前一级，第一级的输入被明确定义为原始弱光图像。一个直观的想法是，我们是否可以将各个阶段的输入(第一级除外)与原始弱光输入(即第一级的输入)连接起来，间接探索各个阶段之间的收敛行为。为此，我们引入了一个自校正映射S，并将其添加到原始弱光图像中，以表示每一级输入与第一级输入之间的差异。具体来说，自校正模块可以表示为

其中t≥1,vt为每一级的转换输入，Kϑ为引入包括可学习参数ϑ的参数化运算符。那么t阶段(t≥1)基本单位的转换可写成

实际上，我们构建的自校正模块是通过整合物理原理，逐步校正每一级的输入，间接影响每一级的输出。为了评估自校正模块对收敛性的影响，我们在如下图3中绘制了各阶段结果的t—SNE(可视化降维算法)分布，我们可以很容易地观察到，每个阶段的结果确实收敛到相同的值。但在没有自校正模块的情况下，就不会出现这种现象。此外，上述结论也反映出我们确实实现了第2.1节最后一段所描述的意图，即使用权重共享模式训练多个级联块，但只使用单个块进行测试。

图3 比较是否使用自校正模块的各阶段t-SNE[21]分布结果。这说明了为什么我们可以用一个阶段进行测试，即SCI中每个阶段的结果可以快速收敛到相同的值，而w/o自校正模块不能始终实现这一点。

2.3. Unsupervised Training Loss

考虑到现有配对数据的不准确性，我们采用无监督学习来扩大网络的能力。我们定义总损耗为Ltotal = αLf + βLs，其中Lf和Ls分别代表保真度和平滑损失。α和β是两个平衡参数。保真度损失是为了保证估计的照度与各阶输入之间像素级的一致性，公式为

其中T为总级数。实际上，这个函数利用重新定义的输入y + st−1来约束输出照度xt，而不是手工制作的GroundTruth或普通的弱光输入。
光照的平滑性是本课题的广泛共识[7,34]。在这里，我们采用具有空间变分L1范数[4]的平滑项，表示为

其中N是总像素数。i表示第i个像素。N (i)表示i在其5 × 5窗口中的相邻像素。Wi,j表示权重，其公式形式为
其中c为YUV颜色空间中的图像通道。σ = 0.1为高斯核的标准差。

2.4. Discussion

本质上，自校正模块在学习较好的基本块(本文中的照明估计块)时起辅助作用，该基本块级联形成具有权重共享机制的整体照明学习过程。更重要的是，自校正模块赋予了各阶段结果之间的收敛性，这在现有的工作中还没有得到探索。SCI的核心思想实际上是引入额外的网络模块来辅助训练，而不是在测试中。它改进了模型的表征，实现了只使用单个块进行测试。也就是说，可以将“权重共享+任务相关自校准模块”的机制转移到处理其他任务上来加速。

3 Exploring Algorithmic Properties

这篇文章在实验部分之前，特意的用一整节来探讨本文提出的SCI方法，来让审稿人们深信不疑。

3.1. Operation-Insensitive Adaptability（操作不敏感适应性，即在不同的简单操作设置下获得稳定的性能）

一般来说，基于网络的方法所使用的操作应该是固定的，不能随意更改，因为这些操作是在大量实验的支持下获得的。幸运的是，我们提出的算法在Hθ上的非常简单，甚至是粗糙的设置上表现出惊人的适应性。如下表1所示，我们可以很容易地观察到，我们的方法在不同的设置(块3 × 3卷积数+ReLU)下获得了稳定的性能。进一步，我们提供了如图4所示的视觉对比，可以很容易地观察到，我们不同设置的SCI都使弱光图像变亮，显示出非常相似的增强结果。回顾我们设计的框架，我们之所以可以获得这种特性，因为SCI不仅将共识转换为照明(即残余学习)，而且集成了物理原理(即元素智能的除法操作)。该实验也验证了我们所设计的SCI的有效性和正确性。

3.2. Model-Irrelevant Generality（模型不相关通用性，即可以应用于基于光照的现有著作以提高性能）

如果不限制与任务相关的自校正模块，我们的SCI实际上是一个广义的学习范式，所以理想情况下，它可以直接应用到实现的工作中。这里，我们以最近提出的代表性工作RUAS[14]为例进行探索。如下的表2和图5展示了使用我们的SCI训练RUAS前后的定量和定性对比。显然，虽然我们只是使用了RUAS展开过程中使用的单个块(即RUAS(1))来评估我们的训练过程，但性能仍然获得了显著的提高。更重要的是，我们的方法可以显著抑制原有RUAS中出现的过曝光现象。这个实验反映了我们的学习框架确实足够灵活，并且具有很强的模型无关的通用性。这表明我们的方法或许可以应用到任意照度的微光图像增强工作中，我们将在未来进行尝试。

4 Experimental Results

实验部分，作者先是说明了实验实施的具体细节，之后进行也一系列对比实验，最后还应用到黑暗人脸检测和夜间语义分割，以证明本文方法的有效性。(弱光图像增强实验可以做参考)

4.1. Implementation Details

参数设置。在训练过程中，我们使用了ADAM优化器[12]，参数β1 = 0.9， β2 =0.999, = 10−8。小批大小设置为8。初始化学习率为10−4。训练纪元数设置为1000。根据3.1节的结论，我们在所有实验中都采用3卷积+ 3通道ReLU作为Hθ的默认设置。自校正模块包含四个卷积层，保证了训练过程的轻量化。
对比方法。在弱光图像增强方面，我们将SCI与最近提出的四种基于模型的方法(包括LECARM[17]、SDD[10]、STAR[26])、四种先进的监督学习方法(包括RetinexNet[3]、KinD[34]、FIDE[27]、DRBN[30])和四种无监督学习方法(包括EnGAN[11]、SSIENet[33]、ZeroDCE[7]和RUAS[14])进行了比较。对于黑暗人脸检测，除了在检测器前进行上述基于网络的增强工作外，我们还比较了最近提出的暗脸检测方法HLA[24]。
基准描述和评价指标。对于弱光图像增强，我们从MIT数据集[2]中随机抽取100张图像，从LSRW数据集[9]中随机抽取50张测试图像进行测试。我们使用了两个全参考指标，包括PSNR和SSIM，五个无参考指标，包括DE [20]， EME [1]， LOE[23]和NIQE[23]。关于黑暗人脸检测，我们使用了dark face数据集[31]，该数据集由1000张挑战性测试图像组成，这些图像是从2021年CVPR举行的UG2+ PRIZE CHALLENGE的子挑战中随机采样的。我们将检测精度、精密度和召回率作为评价指标。对于夜间语义分割，我们使用ACDC[19]中的400张图像进行训练，剩下的106张图像作为评估数据集。评估指标定义为IoU和mIoU。

4.2. Experimental Evaluation on Benchmarks

性能评估。如下表3所示，我们的SCI取得了具有竞争力的性能，特别是在无参考指标方面。如下图6-7所示，先进的深度网络生成了未知的面纱，导致细节不明显，颜色不自然。通过对比，我们的SCI达到了最好的视觉质量，鲜艳的颜色和突出的纹理。更多的视觉对比可以在补充材料中找到。

计算效率。此外，我们在如下表4中报告了一些最近提出的基于cnn的方法的模型大小、FLOPs和运行时间(gpu -秒)。显然，我们提出的SCI与其他网络相比是最轻量级的，并且明显优于其他网络。

4.3. In-the-Wild Experimental Evaluation

在野外环境下，弱光图像增强是极具挑战性的。图像局部过曝光信息的控制、整体色彩的校正、图像细节的保存等都是亟待解决的问题。在这里，我们测试了来自DARK FACE[31]和ExDark[15]数据集的许多具有挑战性的野外示例。如图8所示，通过大量的实验可以看出，我们的方法取得了比其他方法更令人满意的可视化结果，特别是在曝光水平、结构描绘、颜色呈现等方面。

4.4. Dark Face Detection

我们利用著名的人脸检测算法S3FD[32]来评估黑暗人脸的检测性能。注意，S3FD是使用原S3FD中提供的WIDER FACE数据集[29]进行训练的，我们使用预先训练的S3FD模型对通过各种方法增强的图像进行微调。
同时，我们采用了一种名为SCI+的新方法，将我们的SCI作为基础模块嵌入到S3FD的前端，对任务和增强的损失组合进行联合训练。如图9所示，我们的方法(SCI和SCI+)在所有比较方法中获得了最好的分数，增强版本比微调版本获得了更好的性能。图10进一步展示了视觉对比。可以很容易地观察到，应用我们的SCI，也可以检测到较小的对象，而其他方法无法做到这一点，如放大区域所示。

4.5. Nighttime Semantic Segmentation

这里我们采用PSPNet[35]作为基线，评估所有方法在“预训练+微调”模式(类似于暗脸检测中的SCI版本)下的分割性能。表5和图11给出了不同方法的定量和定性对比结果。我们的性能明显优于其他最先进的方法。如图11的放大区域所示，所有的比较方法都会产生一些未知的伪影，从而破坏生成的分割图的质量。

4.6. Algorithmic Analyses

比较分解组件。实际上，我们的SCI属于基于光照的学习方法，增强的视觉质量在很大程度上依赖于估计的光照。在这里，我们将我们的SCI与三种代表性的基于光照的学习方法进行比较，包括视网膜网、KinD和SSIENet。如图12所示，我们可以很容易地看到我们估计的光照保持了良好的平滑特性。它确保了我们生成的反射率在视觉上更加友好。

消融实验。我们在图13中比较了不同模式的性能。直接学习照明将导致图像过度曝光。光照和输入之间的残差的学习过程确实抑制了过曝光，但整体图像质量仍然不高，特别是对细节的把握。通过对比，我们的增强结果不仅抑制了过度曝光，而且丰富了图像结构。

5 Concluding Remarks

在本文中，我们成功地建立了一个轻量级但有效的框架—自校正照明(self - calibration Illumination, SCI)，用于针对不同现实场景的微光图像增强。我们不仅对SCI的优良性能进行了深入的探索，还进行了大量的实验，证明了我们在微光图像增强、黑暗人脸检测、夜间语义分割等方面的有效性和优越性。
更广泛的影响。从任务的角度来看，SCI提供了一个高效有效的学习框架，在图像质量和推理速度上都获得了极高的性能。也许这将是进入一个新的高速和高质量的微光图像增强时代的一个支撑。在方法设计上，SCI为其他底层视觉问题打开了一个新的视角(即在训练阶段引入增强基本单元模型能力的辅助过程)，提高了对现实场景的实用性。

如有纰漏，欢迎指正！整理不易，点个赞鼓励一下哇。

论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware 寻丶幽风论文阅读笔记论文阅读笔记人工智能深度学习机器人
ALOHA论文ALOHA解决了策略中的错误可能随时间累积，且人类演示可能是非平稳的，提出了ACT（ActionChunkingwithTransformers）方法。ActionChunking模仿学习中，compoundingerror是致使任务失败的主要原因。具体来说，当智能体（agent）在测试时遇到训练集中未见过的情况时，可能会产生预测误差。这些误差会逐步累积，导致智能体进入未知状态，最终
【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models 进击的乔洋论文阅读语言模型人工智能
LayoutPrompter:AwakentheDesignAbilityofLargeLanguageModelsabstract条件图形布局生成是一种自动将用户约束映射为高质量布局的技术，目前受到了广泛关注。尽管最近的工作取得了很好的性能，但缺乏通用性和数据效率阻碍了它们的实际应用。本文提出Layout-Prompter，利用大型语言模型(llm)通过上下文学习来解决上述问题。LayoutPr
论文阅读方法某风吾起 work 哲学与人生论文阅读
文章目录步骤一：对论文进行自我判断阅读题目和关键词。阅读摘要阅读总结要点步骤二：阅读文章阅读图表和图表的注释阅读引言阅读实验部分阅读结果和作者对结果的讨论（创新点）要点步骤三：精度论文回答问题1回答问题2回答问题3要点步骤一：对论文进行自我判断阅读题目和关键词。观察这些关键词是否与你的研究的内容有关。如果不相干，可以随时停止，换篇文章看。阅读摘要摘要一般包含了整篇文章的主要内容，是非常非常重要的部
论文阅读：Recipe for a General, Powerful, Scalable Graph Transformer 不会&编程图神经网络论文阅读论文阅读 transformer 深度学习图神经网络人工智能
RecipeforaGeneral,Powerful,ScalableGraphTransformer论文和代码地址1介绍与贡献2GPS模型2.1模型框架图2.2PE和SE2.3GPSlayer:一种MPNN+Transformer的混合模型GraphTransformer)论文和代码地址论文地址：https://arxiv.org/pdf/2205.12454v4代码地址：https://git
线段树学习札记 Cool_(wly)_Dino 学习数据结构算法 c++
线段树维护序列的树形数据结构——线段树面对以下问题luoguP3372，给出一个数列：（1）将区间【x,y】内每一个数加上k（2）求出某个区间【x,y】中每一个数的和。虽然普通方法修改复杂度O(1)但是求和的效率却是O(n)线段树的思想个人来讲就是归并，线段树所维护的信息必须具有可合并性，个人认为其实现原理过于基础，不做分析。一些有意思的证明：对于节点数为n深度为h的一棵树，其深度可以表示为(n+
Self-Attentive Sequential Recommendation论文阅读笔记调包调参侠推荐系统学习深度学习机器学习神经网络算法
SASRec论文阅读笔记论文标题：Self-AttentiveSequentialRecommendation发表于：2018ICDM作者：Wang-ChengKang,JulianMcAuley论文代码：https://github.com/pmixer/SASRec.pytorch论文地址：https://arxiv.org/pdf/1808.09781v1.pdf摘要顺序动态是许多现代推荐系
Angular Superresolution of Real Aperture Radar for Target Scale Measurement 论文阅读青铜锁00 论文阅读 Radar 论文阅读
AngularSuperresolutionofRealApertureRadarforTargetScaleMeasurement1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1广义混合正则化（GHR）框架核心公式与传统方法对比2.2自适应迭代重加权（AIR）求解器算法设计复杂度分析3.实验设计与结果验证3.1仿真实验实验设置关键结果3.2实际数据验证4.未来研究方
Angular Superresolution of Real Aperture Radar Using Online Detect-Before-Reconstruct Framework 论文阅读青铜锁00 论文阅读 Radar 论文阅读
AngularSuperresolutionofRealApertureRadarUsingOnlineDetect-Before-ReconstructFramework1.论文的研究目标与实际问题意义1.1研究目标1.2实际问题与产业意义2.论文的创新方法、模型与公式分析（重点）2.1核心创新点2.2关键公式与模型2.2.1信号模型2.2.2稀疏正则化优化问题2.2.3坐标循环最小化2.2.4
论文阅读笔记2 sixfrogs 论文阅读笔记论文阅读 cnn
OptimizingMemoryEfficiencyforDeepConvolutionalNeuralNetworksonGPUs1论文简介作者研究了CNN各层的访存效率，并揭示了数据结构和访存模式对CNN的性能影响。并提出了优化方法。2方法介绍2.1Benchmarks数据集：MNIST，CIFAR，ImageNetCNN：AlexNet，ZFNet，VGG2.2实验设置CPU：IntelXe
[论文阅读]DAMO-YOLO——实时目标检测设计报告一朵小红花HH 知识蒸馏目标检测 YOLO 目标检测目标跟踪论文阅读人工智能
DAMO-YOLODAMO-YOLO:AReportonReal-TimeObjectDetectionDesign实时目标检测设计报告论文网址：DAMO-YOLO简读论文这篇论文介绍了一个名为DAMO-YOLO的新型目标检测方法,相比YOLO系列的其他方法有着更好的性能。该方法的优势来自于几项新技术:使用了MAE-NAS作为骨干网络,可以自动搜索出不同延迟预算下的优化网络结构。MAE-NAS被称
大模型隐空间推理论文阅读笔记猴猴猪猪 AIGC python 实验记录人工智能深度学习
文章目录TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介1.1摘要1.2引言TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介机构：Meta代码：任务:特点:方法:1.1摘要现状：大语言模型往往局限在“languagespace"进行推理，在解决
【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总_大模型在代码缺陷检测领域的应用实践(1) 2401_84972910 程序员 AIGC 论文阅读笔记
欢迎一起踏上探险之旅，挖掘无限可能，共同成长！写在最前面本文为邹德清教授的《网络安全专题》课堂笔记系列的文章，本次专题主题为大模型。本系列文章不仅涵盖了46篇关于前沿代码大模型的论文，还包含了24篇深度论文阅读笔记，全面覆盖了代码生成、漏洞检测、程序修复、生成测试等多个应用方向，深刻展示了这些技术如何在网络安全领域中起到革命性作用。同时，本系列还细致地介绍了大模型技术的基础架构、增强策略、关键数据
An Iterative Technique for the Rectification of Observed Distributions 论文阅读青铜锁00 论文阅读论文阅读
AnIterativeTechniquefortheRectificationofObservedDistributions-L.B.Lucy1.研究目标与实际意义1.1研究目标1.2实际意义2.新方法与公式分析2.1核心思路：基于贝叶斯定理的迭代框架2.1.1贝叶斯逆概率公式2.1.2迭代更新规则2.1.3多维推广2.2方法优势2.3对比传统方法3.实验验证3.1数值实验设计3.2关键结果4.雷
Azimuth Superresolution of Forward-Looking Radar Imaging Which Relies on Linearized Bregman论文阅读青铜锁00 论文阅读 Radar 论文阅读
AzimuthSuperresolutionofForward-LookingRadarImagingWhichReliesonLinearizedBregman1.论文的研究目标与意义1.1研究目标1.2实际应用意义2.论文提出的新方法、公式与优势（重点）2.1方法框架2.1.1贝叶斯建模2.1.2线性化Bregman算法2.2与传统方法的对比2.3公式总结3.实验设计与结果3.1点目标仿真3.
A Bayesian Angular Superresolution Method With Lognormal Constraint for Sea-Surface Target 论文阅读青铜锁00 论文阅读 Radar 论文阅读
目录1.研究背景与问题2.方法创新3.关键优势4.实验验证5.与传统方法对比6.结论与意义1.研究背景与问题核心挑战：实孔径雷达受限于天线孔径尺寸，导致角分辨率不足，影响海面目标（如船舶）的精细化探测。传统方法局限性：谱估计方法（如MUSIC、IAA）：依赖多快拍数据，机械扫描雷达难以满足。正则化方法（如TSVD、l1/l2约束）：假设噪声服从高斯分布，未考虑海杂波的非高斯特性（如Rayleigh
论文阅读笔记——Prediction with Action: Visual Policy Learning via Joint Denoising Process 寻丶幽风论文阅读笔记论文阅读笔记人工智能
以前的method是输入视频输出视频或者输入视频和action学习action，该方法认为action，video和othercondition具有一定联系，所以一次性对所有的进行jointdenoise。网络结构采用MaskedMulti-headAttention关联不同模态，使用DiT的backbone。
深度学习重要论文阅读笔记 ResNet （2025.2.26）北岛寒沫逐界星辰2025 计算机科研深度学习论文阅读笔记
文章目录问题背景数据预处理神经网络模型模型性能知识点积累英语单词积累问题背景随着神经网络变得更深（层数变多），模型的训练过程也会变得更加困难。当神经网络的深度增加，就会出现梯度消失和梯度下降现象，妨碍模型的收敛。不过，这种情况可以通过归一化的模型初始化和中间的归一化层基本解决。但是，尽管在增加了归一化技术的情况下很深的神经网络可以收敛，又出现了另外一个问题，即随着模型深度的增加，模型的准确率反而下
9、论文阅读：无监督的感知驱动深水下图像增强 Maker~ 图像增强论文阅读深度学习计算机视觉
Perception-DrivenDeepUnderwaterImageEnhancementWithoutPairedSupervision前言引言相关工作UIE模型基于非物理模型基于物理模型基于深度学习质量度量在图像增强中的应用方法论问题表述PQR模型PDD网络生成器损失函数实验A.数据集B.训练细节C.实验结果**PQR模型结果****定量UIE结果****定量UIE结果****可视化增强结
论文阅读笔记1——DARTS：Differentiable Architecture Search可微分架构搜索（一）（论文翻译学习） fuhao7i 论文阅读笔记深度学习人工智能机器学习算法计算机视觉
DARTS：DifferentiableArchitectureSearch可微分架构搜索（一）DARTS：DifferentiableArchitectureSearch（一）ABSTRACT摘要1.INTRODUCTION介绍2.可微的结构搜索加油加油！如果你感觉你现在很累，那么恭喜你，你现在正在走上坡路！让我们一起加油！欢迎关注我的讲解视频，让我们一起学习：Bilibili主页：https:
从零开始Real-ESRGAN的复现晒阳光的咸鱼超分辨率重建 python
前言要初步了解Real-ESRGAN，可以看我之前发布的博客。初学Real-Esrgan-CSDN博客本文主要是对Real-ESRGAN的一个复现，主要就是对环境的配置进行记录，因为是实现之后才做的记录，所以只能尽可能的对其进行复现。大家可以看一下这个博主的文章进行一个参考。【论文阅读+测试】Real-Esrgan超分辨率算法_realesrgan-CSDN博客项目开始首先，我们要知道Real-E
【CCM-SLAM论文阅读笔记】随机取名字协同SLAM论文阅读 slam
CCM-SLAM论文阅读笔记整体框架结构如图所示：单智能体只负责采集图像数据，运行实时视觉里程计VO以估计当前位姿和环境地图，由于单智能体计算资源有限，负责生成的局部地图只包含当前N个最近的关键帧。服务器负责地图管理、地点识别、地图融合和全局BA优化。所有局部地图使用本地里程计框架，地图信息在从一个本地里程计到另一个本地里程计框架的相对坐标中进行交换。CCM-SLAM不假设任何关于智能体初始位置的
A new method for forward-looking scanning radar imaging based on L1/2 regularization 论文阅读 yangqoor 论文阅读
Anewmethodforforward-lookingscanningradarimagingbasedonL1/2regularization论文阅读内容概述关键创新点1.论文的研究目标研究目标2.新方法的特点与优势传统方法局限L1/2L_{1/2}L1/2正则化的创新优势对比3.实验设计与结果分析实验设置关键结果数据支持可借鉴的创新点与学习建议核心创新点推荐学习路径内容概述该论文提出了一种基
[论文阅读] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution qianx77 论文阅读 pytorch 论文阅读人工智能计算机视觉
文章目录一、前言二、主要贡献三、Introduction四、Methodology4.1Motivation：4.2FrameworkOverview.**一、前言通信作者是香港理工大学&OPPO研究所的张磊教授，也是图像超分ISR的一个大牛了。论文如下SeeSR:TowardsSemantics-AwareReal-WorldImageSuper-Resolution[paper][code]二
【论文阅读】Revisiting the Assumption of Latent Separability for Backdoor Defenses 开心星人论文阅读论文阅读
https://github.com/Unispac/Circumventing-Backdoor-Defenses摘要和介绍在各种后门毒化攻击中，来自目标类别的毒化样本和干净样本通常在潜在空间中形成两个分离的簇。这种潜在的分离性非常普遍，甚至在防御研究中成为了一种默认假设，我们称之为潜在分离性假设。基于这一假设设计的防御方法通过在潜在空间中进行聚类分析来识别毒化样本。具体来说，这些防御方法首先在
[论文阅读] CLIP-based fusion-modal reconstructing hashing for large-scaleunsupervised cross-modal retri 2301_80732299 论文阅读
摘要随着多模态数据的激增，人们不再满足于单一的数据检索模式来获取信息。深度哈希检索算法以其存储效率高、查询速度快等优点受到广泛关注。目前，现有的无监督哈希方法普遍存在两方面的局限性:(1)现有方法不能充分捕获不同模态数据中潜在的语义相关性和共存信息，导致缺乏有效的特征和哈希编码表示来弥合多模态数据中的异构和语义差距。(2)现有的无监督方法通常构造相似矩阵来指导哈希码学习，存在不准确的相似度问题，导
F-PointNet 论文阅读理解咸鱼和白菜目标检测 f-pointnet 点云目标检测
总述本文提出一种方法：使用成熟的2D的目标检测方法中cnn提供的regionproposal和3D的目标检测定位（也就是pointnet处理点云），将二者结合利用RGB-D映射和一个叫做锥体（Frustum）?形成一个3D的box参数进行输出。本文主要贡献就是在“一个叫做锥（Frustum）”的使用上结合2D的regionpropos和点云进行3D的分割和box的输出。为方便理解与书写，按照文中顺
【论文阅读笔记|EMNLP2023】DemoSG: Demonstration-enhanced Schema-guided Generation for Low-resource Event Ext Rose sait 论文阅读笔记
论文题目：DemoSG:Demonstration-enhancedSchema-guidedGenerationforLow-resourceEventExtraction论文来源：EMNLP2023论文链接：2023.findings-emnlp.121.pdf(aclanthology.org)代码链接：https://github.com/GangZhao98/DemoSG0摘要当前大多数
深度学习论文阅读路线图喜欢打酱油的老鸟深度学习论文阅读路线图深度学习论文阅读路线图论文阅读路线图
https://www.toutiao.com/a6703859415763649031/作者：floodsun编译：ronghuaiyang这是作者一年前整理的东西，有些最新的论文没有包含进去，但是对于新手来说，入门足够了！如果你是深度学习领域的新人，你的第一个问题可能是“我该从哪些论文开始读起呢？”这就是深度学习论文的阅读路线图！这个路线图是根据下面几个规则构建的：从概要到细节从老的到最新的业
神经网络压缩实验-Deep-compression 无用技术研究所
首发于个人博客，结合论文阅读笔记更佳实验准备基础网络搭建为了实现神经网络的deepcompression，首先要训练一个深度神经网络，为了方便实现，这里实现一个两层卷积+两层MLP的神经网络classnet(pt.nn.Module):def__init__(self):super(net,self).__init__()self.conv1=pt.nn.Conv2d(in_channels=1,
【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 DeepSeek 计算论文阅读 deepseek agi ai llm agent cot
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1：通过强化学习激励LLMs的推理能力DeepSeek-AIresearch@deepseek.com目录DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcem
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>