花里梦雨

从多张曝光图像中学习一个深度单图像对比度增强器

文章目录

- 一、引出问题
- 二、多曝光数据集
- 三、网络结构
- - 1. 分量增强网络
  - 2. 整体增强网络
- 四、实验结果
- - 1. 实验设置
  - 2. 与SICE方法比较
  - 3. 与MEF相比
  - 4. 失败案例
- 五、总结

一、引出问题

传统的单一图像对比度增强（SICE）方法包括基于直方图和Retinex理论，它的缺点总结如下：

复杂的自然场景和有限的图像信息很难恢复
重新分配发光强度，容易忽略图像的结构信息，从而产生严重的不切实际的效果，即失真。
多数SICE算法是基于图片是高质量图片的假设，而没有充分利用输入图像的信息
SICE增强能力有限，因为受限于低对比度图像的有限的信息

因此有了基于多曝光图像序列的图像增强，主要有多曝光图像融合(MEF)和高动态范围图像堆叠（stack-based HDR image），再加上色调映射，但这些序列图像中会存在模糊或者物体移动，导致得到的结果产生伪影。

在图一中：
（a）曝光不足/过渡曝光的一个图像序列
（b）最先进的MEF算法：它可以将多张曝光图像合成为高可见性图像，所以可以恢复更多的细节，但对于移动的对象，则会产生重影伪影（比如蓝色刚框里移动的人影）
（c）最先进的SICE方法：只用单一的曝光不足图像作为输入，虽然不会产生重影，但由于单张图像信息有限，很容易丢失一些细节。

因此作者提出疑问，能否提出一种SICE方法既可以近似MEF对比度增强的效果，又可以不产生重影呢？

二、多曝光数据集

重点和主要贡献：

提出了一个大规模多曝光度的图像数据集，其中包括曝光度不同的低对比度图片和它们对应的高质量参考图像。
分步构建了三个基于CNN的SICE增强器，前两个是照明、细节增强网络分别提升图像对比度和细节恢复，最后一个全图增强器作为调节网络，平衡细节和纹理避免颜色失真

目标及实现：

数据集应包含高分辨率的多曝光图像序列，并覆盖不同的场景——收集室内外场景覆盖了广泛的场景、主题、照明条件
对于每个序列，应生成高质量的参考图像，以便能够构建图像对用于端到端学习——用13种最先进的MEF（8种）和HDR（5种）重构参考图像

① 数据收集
不同相机：七种
不同场景：包括室内（静态环境+三脚架，每个环境7-18幅不同曝光度的图像）和室外（由于人、车、树影位移产生偏移曝光，故采用连续拍摄，每个序列3-5张图像）

② 产生参考图像（~~这过程可真艰辛，作者是真的好有耐心啊，读这部分的时候就想献上我的膝盖！！~~ ）
大概分为三个步骤：
a. 10000张不同曝光水平图像，筛选出其中85%有图像扭曲（包括模糊、离焦、噪声影响）和物体移动的图片；
b. 剩余1200个序列，分别用13种MEF/HDR算法进行融合，产生1200x13=15600个融合结果；
c. 最后再通过主观实验去除仍不令人满意的图像，剩下589个高质量的参考图像和它们的相应序列

如下图所示，在图五中，左边是13种算法每种算法所占的百分比；右边即挑选过程示例。

三、网络结构

网络的设计作者刚开始直接使用一个15层的网络端到端的学习，如图6，发现效果不是很好。

然后参考了Retinex理论，图像低频信息代表全局自然度，高频信息代表局部细节，先对低对比度和参考图像每分通道采用加权最小二乘法(WLS)分解，把图像分为高频和低频部分，对两部分分别进行增强。训练的时候，先分别训练这两个stage，用第一阶段训练好的参数再来训练第二阶段的网络。两个阶段训练完后，移除第一阶段的两个loss，采用DSSIM作为loss来fine-tune整个网络。

用公式表示：

但因为直接合并两部分的结果效果不是很好，所以作者把增强后的两部分进行合并后再通过一个网络进一步增强，最终得到对比度增强的结果。整个网络结构如下所示：

Conv+PReLU: 64个3×3、5×5和9×9的滤波器，步幅为1和2，用于生成64个特征图，激活函数为PReLU(parametric rectifified linear unit)。

Deconv+PReLU: 64个9×9、5×5和3×3的滤波器,步幅为2和1，生成64个特征图，激活函数为PReLU。

Conv+BN+PReLU：64个3×3滤波器，采用批处理化(BN)，激活函数是PReLU。

Conv: 3个1×1大小滤波器，用于重构输出。

Skip connection:直接连接，连接两个层的特征映射。

文中有说卷积层设置和激活函数选择的标准：
1、网络的卷积和反卷积策略可以保证输入输出大小相同。不仅避免了边界区域的伪影，而且减少了跨步滤波器的计算负担。
2、采用PRelu激活函数是由于训练参数有正有负且都包含输入图像的重要局部结构信息。

1. 分量增强网络

① Luminance Enhancement Network
由于照明分量代表图像全局对比，所以照明网络主要重构图像对比度。文中使用：U-net 结构作为照明网络，为了增大局部感受野同时避免跨步长卷积造成细节信息的损失。采用MSE作为损失函数，训练参数Θ，公式：

具体网络结构：

② Detail Enhancement Network
由于细节图表示图像的高频细节和边缘信息，所以细节(反射)图主要重构图像的细节特征。考虑到高频细节分量通常遵循Laplace分布并包含一些噪声和异常值，采用L1范数作为损失函数，公式：

具体网络结构：

2. 整体增强网络

由于两个CNN网络是分别对对比度和细节进行增强的，所以不能保证合成之后整体图像质量和视觉效果。此外，由于原图的光照不均匀性，会导致合成之后的图像出现颜色失真。为了平衡图像的细节和纹理，文章又使用一个调整CNN网络将前两个网络结果合成后向参考图像学习。采用DSSIM作为损失函数，训练网络参数Ψ，公式：

具体网络结构和细节增强网络类似，只是卷积层之后多加了一个批处理化过程：

四、实验结果

1. 实验设置

对于整个数据集按照训练集：验证集：测试集 = 7：1：2的比例来划分，且每个数据集都需要包括室内和室外不同曝光的图像。

2. 与SICE方法比较

主要拿基于直方图（CVC、AGCMD）和基于Retinex方法（NPE、SRIE、LIME）与基于CNN的SICE以及3个基线直线网络放在一起对比。

首先是曝光不足图像：可以看出基于直方图的方法由于同时包含明暗条件，提取图像细节的能力有限；Retinex提高了整体的可视性那三个基线直线网络出现了不自然的增强、丢失细节和颜色扭曲；而我们的方法就很好的均衡了对比度并揭示了细节。
然后是过渡曝光图像：
然后看上边两个实验的数据，也就是这个表格里边的两个参数：峰值信噪比（PSNR）和特征相似度（FSIM）峰值信噪比（PSNR）：数值越大，失真越小；特征相似度（FSIM）：数值越大，越接近参考图像，可以看到我们的方法参数都是最大的，且使用时间也是很短的。

为了验证区域是否饱和，将RGB降为灰度，然后进行阈值化，如下边两个图，可以看出CNN可以恢复几乎所有的细节。

欠饱和

过饱和：

3. 与MEF相比

图16是静态场景，本文的方法使用单张图像得到了和MEF使用多个曝光水平图像几乎相同质量的增强效果，但是视觉效果上，我们的方法丢失了一些颜色信息

图17是动态场景，在这里基于CNN的SICE的优点就非常明显了，没有重影伪影。

4. 失败案例

这是一个失败的例子，文中的方法效果明显比不上MEF，分析原因是：曝光太严重这里的严重指的是范围和程度都很严重，所以对图像恢复造成的很大的影响。

五、总结

我们建立了一个多曝光图像数据集，包含589个图像序列和4413个不同曝光的高分辨率图像。

对于每个序列，使用13种MEF和基于堆栈的HDR算法生成相应的高质量参考图像。通过主观测试，筛选出质量最好的一幅作为每个场景的参考图像。

低对比度图像及其高质量参考图像在我们的数据集中的可用性允许高性能SICE方法的端到端学习。

作为一个演示，我们开发了一个简单而强大的基于CNN的SICE增强器，它能够自适应地为单个曝光过度或曝光不足的输入图像生成高质量的增强结果。

实验结果表明，所开发的SICE增强器在动态场景下的性能明显优于现有的SICE方法，甚至优于MEF和基于堆栈的HDR方法。

你可能感兴趣的:(论文精读)

【图像超分】论文精读：MTKD: Multi-Teacher Knowledge Distillation for Image Super-Resolution 十小大超分辨率重建（理论+实战科研+应用）深度学习人工智能图像处理计算机视觉超分辨率重建论文阅读论文笔记
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）前言论文题目：MTKD:Multi-TeacherKnowledgeDistillationforImageSuper-Resolution——MTKD：图像超分辨率的多教师知识蒸馏论文
【图像去噪】论文精读：Linear Combinations of Patches Are Unreasonably Effective for Single-Image Denoising 十小大深度学习图像处理计算机视觉图像去噪人工智能
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.APARAMETRICVIEWOFTWO-STEPNON-LOCALMETHODSFORSINGLE-IMAGEDE
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读（逐段解析）昵称是6硬币 (持续更新)YOLO 深度学习计算机视觉人工智能目标检测图像处理
YOLOv11:ANOVERVIEWOFTHEKEYARCHITECTURALENHANCEMENTS目标检测论文精读（逐段解析）论文地址：https://www.arxiv.org/abs/2410.17725RahimaKhanamandMuhammadHussainUltralytics公司发布CVPR2024论文写的比较简单，比较核心的改进包括：C3K2高效特征提取机制。对C2f模块的改进
2025年大模型学习新攻略！掌握未来AI的关键技能 AI大模型-大飞人工智能产品经理程序员 Agent AI 大模型大模型教程
1.公开课（视频）：李宏毅机器学习斯坦福CS336：从零开始构建语言模型卡内基梅隆大学【多模态机器学习】RAGFromScratchHuggingFaceNLP课程2.机器学习和编程基础：pytorch官方中文教程[中英字幕]吴恩达机器学习李宏毅机器学习3.Attention机制：论文:《AttentionIsAllYouNeed》Transformer论文逐段精读【论文精读】-跟李沐学AIzhi
【AI论文精读3】RAG论文综述1-P3-检索器 AI完全体 AI论文解读人工智能机器学习深度学习自然语言处理 RAG 论文阅读论文笔记
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】P1，P2，P4，P5，P6三、检索器在RAG中，有效地从数据源中检索相关文档至关重要。涉及的关键问题包括检索源、检索粒度、检索的预处理以及选择相应的嵌入模型。3.1.检索源RAG依赖外部知识来增强LLM，而检索源（RetrievalSource）的类型（数据结构）和检索单元的粒度都会影响最终的生成结果。3.1.1.数据结构1.非结构化数
【图像去噪】论文精读：Zero-Shot Blind-spot Image Denoising via Implicit Neural Sampling 十小大深度学习人工智能图像处理计算机视觉图像去噪论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction1.1.LearningdenoisingNNwithouttruthimages1.2.Discussionsonbli
论文精读：Hypercube-RAG: Hypercube-Based Retrieval-Augmented Generation for In-domain Scientific Question 大数据AI-ZRL 论文精读自然语言处理人工智能
研究背景研究问题：这篇文章要解决的问题是如何在领域特定的科学问答任务中，利用外部知识提高大型语言模型（LLMs）的准确性和效率。具体来说，传统的基于语义相似性的检索增强生成（RAG）方法在处理领域知识密集型任务时，难以返回简洁且高度相关的信息。研究难点：该问题的研究难点包括：如何在领域特定的任务中实现高效且准确的检索；如何在检索过程中提供可解释性；如何在保持高效的同时提高模型的准确性。相关工作：该
2024 CVPR Video ReCap Recursive Captioning of Hour-Long Videos Methods Notes 努力还债的学术吗喽 video caption 人工智能深度学习神经网络 python 自然语言处理计算机视觉
本文为个人论文核心内容Method精读笔记摘录，原文为2024CVPRVideoReCapRecursiveCaptioningofHour-LongVideos，需要更详细的论文精读Markdown解析，关注私戳包主领取在这里提供原文链接https://arxiv.org/pdf/2402.13250文章目录0.Abstract在这里插入图片描述1.Introduction【SimpleConc
【图像去噪】论文精读：Tell Me What You See: Text-Guided Real-World Image Denoising 十小大深度学习人工智能图像处理计算机视觉图像去噪论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.BackgroundandRelatedWork3.Method4.Results5.Conclusion前言论文题目
【图像去噪】论文精读：Rotation-Equivariant Self-Supervised Method in Image Denoising（AdaReNet）十小大深度学习人工智能图像处理计算机视觉图像去噪论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.RelatedWorkandPriorKnowledge2.1.ImageDenoising2.2.RotationE
【图像去噪】论文精读：Noise2Fast: Fast Self-Supervised Single Image Blind Denoising（N2F）十小大计算机视觉人工智能深度学习图像去噪图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractMainTheoreticalBackgroundContributionandSignificanceRelatedWorkResultsConcl
【图像去噪】论文精读：SUNet: Swin Transformer UNet for Image Denoising 十小大 transformer 深度学习图像去噪图像处理计算机视觉论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.RELATEDWORKA.ImageRestorationB.UNetC.SwinTransformerIII.PR
【大语言模型-论文速读】GPT的不确定性判断 sp_fyf_2024 人工智能前沿技术大语言模型语言模型 gpt 人工智能数据挖掘自然语言处理算法
【大语言模型-论文精读】GPT’sJudgementsUnderUncertaintyAuthors:PayamSaeediandMahsaGoodarzi论文：https://arxiv.org/pdf/2410.02820文章标题翻译GPT的不确定性判断PayamSaeediRochesterInstituteofTechnologyMahsaGoodarziTheStateUniversit
[论文精读]Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 0x211 论文精读自然语言处理人工智能
来源：AdvancesinNeuralInformationProcessingSystems33(NeurIPS2020)链接：http://arxiv.org/abs/2005.11401题目翻译：用于知识密集型NLP任务的检索增强生成阅读原因RAG领域系列必读文章，读了这篇才知道RAG是干什么的，才有后续的研究。内容1.简介这篇论文介绍了RAG的核心概念，提出了一种结合检索与生成的框架，用于
【论文精读】Copy or Not? Reference-Based Face Image Restoration with Fine Details qianx77 论文阅读论文阅读人工智能算法
文章目录0.前言1.摘要2.问题描述3.方法method3.1网络结构3.2损失函数(文本重点)4.实验结果0.前言文章属于lowlevel中的Reference-guidedfacerestoration类别，被2025WACV所接收，文章主要目的就是充分利用参考人脸的高清细节，将其复制到低质图像LQ中，实现真实且ID一致的人脸修复。以下是论文链接和代码链接[paper][code]更多关于fa
巧用DeepSeek提升自我学习能力（上）：学习加速器的多样玩法 t0_54coder 大数据与人工智能学习
在掌握了DeepSeek在工作领域的高阶应用后，其在学习场景中的强大助力同样不可忽视。接下来，深入探索如何巧用DeepSeek打造专属学习加速器，涵盖论文精读、错题攻克、会议纪要整理以及个人知识库构建等多个方面，全面提升学习效率和知识管理能力。论文精读秘籍——三阶速读法预判提问（5分钟）：面对一篇学术论文，在深入阅读前，借助DeepSeek快速把握核心要点并提出疑问。输入指令“请用200字概括《[
【论文精读】NoPe-NeRF: : Optimising Neural Radiance Field with No Pose Prior YuhsiHu NeRF/GS 计算机视觉人工智能深度学习 3d 机器人
今天读一篇CVPR2023Highlight的文章，文章提出了一种在没有相机位姿先验的情况下训练NeRF的方法。项目地址：点击前往文章目录Abstract1.Introduction2.RelatedWorkNovelViewSynthesis（NVS）Pose-FreeNeRF3.Method3.1NeRF表达3.2Pose与NeRF联合优化3.3单目深度图去畸变3.4相对位姿约束a)Point
【论文精读(GELUS)】GAUSSIAN ERROR LINEAR UNITS (GELUS) Open NLP NLP（自然语言处理）神经网络 nlp 计算机视觉深度学习自然语言处理
GELU：让计算机视觉、NLP、语音任务性能飙升的激活函数本文探讨的高斯误差线性单元（GaussianErrorLinearUnit，GELU）是由DanHendrycks和KevinGimpel提出的一种高性能神经网络激活函数。该研究发表后，在神经网络领域引起广泛关注，其创新性地结合了随机正则化思想，为神经元输出带来更具概率性的视角，在多个领域展现出优于传统激活函数的性能。相关链接：https:
MapReduce论文精读寒冰陨云 MIT6.824分布式系统 mapreduce hadoop 大数据
文章目录概述研究意义编程模型与系统实现编程模型MapReduce示例：统计文档中所有单词的出现次数系统实现基本流程容错处理worker异常master异常localityTaskGranularityBackupTasksCombinationFunction总结概述本文主要目的是记录MapReduce论文中的核心思想，方便个人和大家进行记录和查看。MapReduce同时也是MIT6.824的必读
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
rStar论文精读 MoyiTech 推理模型 OpenAI-O1原理
论文简介论文标题：《MutualreasoningmakessmallerLLMsstrongerproblem-solvers》论文地址：https://arxiv.org/abs/2408.06195录用会议：ICLR2025背景与挑战挑战1：在SLM中平衡exploration与exploitation。一些方法有很大的exploitation但限制任务多样性泛化性不好；一些方法有很大的ex
[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors 0x211 论文精读人工智能
会议名称：2023IEEESymposiumonSecurityandPrivacy(SP)发布链接：AI-Guardian:DefeatingAdversarialAttacksusingBackdoors|IEEEConferencePublication|IEEEXplore中文译名：AI-Guardian:利用后门防御对抗攻击阅读原因：网安相关，方班需要本文主要介绍了一种名为AI-Guar
飞书多维表格+DeepSeek R1：打工人必备的AI神器，效率暴涨1000%！[特殊字符] sherlock__cc 人工智能飞书
导语当飞书多维表格遇上国产最强推理大模型DeepSeekR1，会擦出怎样的火花？本文手把手教你用「零代码」实现批量文案改写、论文精读、视频脚本生成。一、颠覆认知的三大核心优势1.批量处理的工业级效率单次处理1000+条数据，告别传统API逐条调用支持跨表格数据联动（如从CRM系统自动抓取客户需求）实时监控处理进度，失败任务自动重试2.零代码的极简交互无需Python环境配置直接输入自然语言指令（如
【论文精读】MapTR：用于在线矢量化高精地图构建的结构化建模与学习青衫弦语自动驾驶人工智能深度学习 transformer
论文地址：MAPTR:STRUCTUREDMODELINGANDLEARNINGFORONLINEVECTORIZEDHDMAPCONSTRUCTION源代码：MapTR摘要High-definition（HDMap）map为自动驾驶场景提供了丰富且精确的环境信息，是自动驾驶系统规划中不可或缺的基础组件。本文提出了MapTR，一种用于高效在线矢量化高精地图构建的结构化端到端Transformer模
【论文精读】MotionLM EEPI 自动驾驶深度学习论文阅读
【论文精读】MotionLM1背景2存在的问题3具体方案轨迹转运动序列模型轨迹去重和聚类loss1背景团队：Waymo时间：2023.9代码：简介：采用自回归的方式做轨迹生成，能够更好地建模交互，且避免模态坍缩，在数据集达到了SOTA。2存在的问题轨迹回归方面：原本xy预测认为空间过大，有的xy很大（t大速度快的时候），有的xy很小（t小速度慢的时候）。3具体方案Encoder采用了之前的论文Wa
【论文精读】Sparse4D v2: Recurrent Temporal Fusion with Sparse Model EEPI 自动驾驶人工智能论文阅读深度学习目标检测
1背景团队：地平线时间：代码：简介：这篇论文是Sparse4D的续作，区别主要在于特征时序融合上，新版提高了运算效率。后续端到端SparseDrive的基本框架与这篇基本类似。2存在的问题2.1其他稀疏3D检测的问题PETR是query-based方法，但是为了实现特征融合，进行了全局注意力机制，导致高计算量。2.2Sparse4Dv1的问题Sparse4Dv1的时序特征融合hierarchyfu
每周论文精读05-A2J:AnchortoJointRegressionNetwork for 3D ArticulatedPoseEstimation from a SingleDepthImage Jason_____Wang 精读笔记 python 计算机视觉卷积手势识别深度学习
https://download.csdn.net/download/Jason_____Wang/16502249论文精读——A2J:Anchor-to-JointRegressionNetworkfor3DArticulatedPoseEstimationfromaSingleDepthImage标题比较长，已经打不完了。。所以题目格式有些变形，望谅解。上周尝试做了一下代码复现的方向，因为生活
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他