qq_43469979

DIDFuse:用于红外和可见光图像融合的深度图像分解

论文地址：https://arxiv.org/abs/2003.09210

code地址： GitHub - Zhaozixiang1228/IVIF-DIDFuse: Official implementation for "DIDFuse: Deep Image Decomposition for Infrared and Visible Image Fusion" (IJCAI 2020)

摘要

红外与可见光图像融合是图像处理领域的一个热点问题，其目的是在保持源图像优势的前提下获得融合后的图像。提出了一种基于自动编码器的融合网络。其核心思想是编码器将图像分别分解为具有低、高频信息的背景特征图和细节特征图，解码器恢复原始图像。为此，loss函数使源图像的背景/细节特征图相似/不相似。在测试阶段，通过融合模块分别对背景和细节特征图进行融合，并由解码器对融合后的图像进行恢复。定性和定量结果表明，我们的方法可以生成包含高亮目标和丰富细节纹理信息的融合图像，具有较强的重现性，同时优于目前最先进的(SOTA)方法。

1 Introduction

图像融合是一种用于信息增强的图像处理技术。其原理是保留包含相同场景的源图像的互补和冗余信息而不产生伪像[Meher et al.， 2019]。在图像融合中，红外和可见光图像融合，又称IVIF，可以应用于许多领域，如监视[Bhatnagar和Liu, 2015]，现代军事和火灾救援任务[Lahoud和Susstrunk, 2018;Hu et al.， 2017]，人脸识别[Ma et al.， 2016]等。

众所周知，红外图像可以避免光照变化和人为干扰引起的视觉认知障碍，但其空间分辨率较低，纹理细节信息较差。相反，可见图像具有较高的空间分辨率，具有丰富的外观和梯度信息，但容易受到障碍物和光反射的影响。因此，使融合图像既保留了红外图像的热辐射信息，又保留了可见光图像的梯度信息，将有利于目标的识别和跟踪。

一般来说，IVIF算法可以分为两类:传统方法和深度学习方法。其中，具有代表性的传统方法有图像多尺度变换[Li et al.， 2011]、稀疏表示[Zong and Qiu, 2017]、子空间学习[Patil and Mudengudi, 2011]和基于显著性的方法[Zhang et al.， 2017]。

目前，深度学习(deep learning, DL)已成为IVIF领域的一种流行工具。基于DL的方法可分为三类。第一组基于生成对抗网络(GANs)。在fusongan [Ma et al.， 2019b]中，生成器生成具有红外热辐射和可见梯度信息的融合图像，识别器迫使融合图像从可见图像获得更多细节。根据Conditional GAN [Mirza and Osindero, 2014]，保留细节GAN [Ma et al.， 2020]通过改变FusionGAN的损失函数来提高细节信息的质量，锐化目标边界。第二组[Li et al.， 2018;Lahoud and S¨usstrunk, 2019]是图像多尺度变换的延伸。一般来说，它们通过滤波或基于优化的方法将图像从空间域转换为背景域和细节域。背景图像只是简单的平均。由于细节图像中存在高频纹理，他们融合了从预先训练的网络中提取的细节图像的特征图(例如，VGG [Simonyan and Zisserman, 2014])。最后，将融合后的背景图像与细节图像进行融合，得到融合后的图像。第三组是基于AE的方法[Li and Wu, 2018]。在训练阶段，对AE网络进行训练。在测试阶段，他们融合源图像的特征映射，然后通过解码器恢复融合图像。综上所述，在基于DL的方法中，通常采用深度神经网络(DNNs)提取输入图像的特征，然后利用某种融合策略将特征进行组合，完成图像融合任务。

值得指出的是第二种方法的缺点，即DL只在融合阶段使用，在分解阶段使用基于滤波或优化的方法。为了克服这一缺点，结合第二组和第三组的原理，我们提出了一种新的IVIF网络，称为基于IVIF的深度图像分解(DIDFuse)。我们的贡献有两方面:

(1)据我们所知，这是第一个用于IVIF任务的深度图像分解模型，融合和分解都是通过AE网络完成的。编码器和解码器分别负责图像的分解和重构。在训练阶段，对于分解阶段，损失函数强制两幅源图像的背景和细节特征图相似/不相似。同时，在重建阶段，损失函数保持了源图像和重建图像之间的像素强度，以及可见图像的梯度细节。在测试阶段，根据特定的融合策略分别融合测试对的背景和细节特征图，然后通过解码器获取融合图像。

(2)据我们所知，现有IVIF方法的性能[Ma et al.， 2016;李和吴，2018;Zhang et al.， 2017;Li et al.， 2018]仅在TNO数据集中有限数量的精选样本上进行验证。然而，我们在三个数据集上测试了我们的模型，包括TNO, FLIR和NIR。总共有132幅室内和室外场景、白天和夜间灯光照明的测试图像。与SOTA方法相比，该方法能够稳健地生成目标更亮、细节更丰富的融合图像。该算法在目标识别和跟踪方面具有潜在的应用价值。

其余的文章安排如下。相关工作将在第二节中介绍。提议网络的机制将在第3节中描述。然后，在第4节报告了实验结果。最后，在第5节中得出了一些结论。

2 Related Work

由于我们的网络结构与U-Net密切相关，我们将在2.1节介绍U-Net。然后，在2.2节简要回顾了传统的双尺度图像分解方法。

2.1 U-Net and Skip Connection

U-Net应用于生物医学图像分割[Ronneberger et al.， 2015]，与AE网络相似，U-Net由特征提取的收缩路径和精确定位的扩展路径组成。与AE相比，U-Net中收缩和扩展路径对应的特征映射具有通道级联的特点。通过这种方式，它可以提取“更厚”的特征，有助于在下采样时保持图像纹理细节。文献[Mao et al.， 2016]中使用了一种类似u - net的对称网络进行图像恢复。它采用跳跃连接技术，将卷积层的特征映射添加到相应的反卷积层，增强神经网络的信息提取能力，加快收敛速度。

2.2 Two-Scale Decomposition

IVIF中的双尺度分解作为多尺度变换的子集，将原始图像分解为包含背景信息和目标信息的背景图像和细节图像。在[Li and Wu, 2018]中，给定图像I，他们通过求解以下优化问题得到背景图像Ib:

其中∗表示卷积算子，gx =[−1,1]和gy =[−1,1]T是梯度核。然后通过Id = I−Ib获取细节图像。类似的，在[Lahoud and S¨usstrunk, 2019]中使用box filter来获取背景图像，获取细节图像的方法与[Li and Wu, 2018]相同。对分解后的背景图像和细节图像分别采用不同的融合准则进行融合。最后，将融合后的背景图像与细节图像相结合，重建出融合后的图像。

3 Method

在本节中，我们将介绍我们的DIDFuse算法和提议的网络结构。此外，还说明了培训和测试阶段的细节。

3.1 Motivation

如2.2节所述，两尺度分解将输入图像分解为包含大尺度像素强度变化的低频信息的背景图像和包含小尺度像素强度变化的高频信息的细节图像。目前，大多数算法都结合一定的先验知识，采用基于滤波或优化的方法对图像进行分解。因此，它们是手工设计的分解算法。我们强调图像分解算法本质上是特征提取器。在形式上，它们将源图像从空间域转换为特征域。众所周知，DNN是一种很有前途的数据驱动特征提取方法，与传统的手工设计方法相比有很大的优势。遗憾的是，该算法缺乏一种用于IVIF任务的基于DL的图像分解算法。

因此，我们提出了一种新的深度图像分解网络，利用编码器进行两尺度分解并提取不同类型的信息，利用解码器恢复原始图像。

3.2 Network Architecture

我们的神经网络由一个编码器和一个解码器组成。如图1所示，编码器被输入红外或可见光图像，并生成背景和细节特征图。然后，网络沿着通道将两种特征图串联起来。最后，串联的特征图通过解码器来恢复原始图像。为了防止特征图的细节信息在多次卷积后丢失，并加快收敛速度，我们将第一次和第二次卷积的特征图添加到最后一次和倒数第二次卷积的输入中，添加策略是沿通道串联相应的特征图。因此，源图像的像素强度和梯度信息可以更好地保留在重建的图像中。

表1列出了网络配置。编码器和解码器分别包含四层和三层卷积层。每一层由填充、3 × 3卷积、批量归一化和激活函数组成。第一层和最后一层利用反射填充来防止融合图像边缘的伪影。conv3和conv4的激活函数设置为双曲正切函数(tanh)，因为它们输出的是背景和细节特征图。对于conv7，由于它重建的是原始图像，因此被sigmoid函数激活。其他层之后是参数整流线性单元(PReLU)。

3.3 Loss Function

在训练阶段，我们的目标是获得一种对源图像进行两尺度分解的编码器，同时获得一种能够融合图像并很好地保留源图像信息的解码器。训练过程如图1(a)所示。

图像分解。背景特征图用于提取源图像的共同特征，细节特征图用于捕获红外和可见光图像的不同特征。因此，我们应该缩小背景特征图的差距。相反，细节特征图的差距应该很大。为此，图像分解的损失函数定义如下:

其中，BV、DV为可见光图像V的背景特征图和细节特征图，BI、DI为红外图像i的背景特征图和细节特征图。Φ(·)为将间隙限定为区间(−1,1)的双曲函数。

Image Reconstruction

对于图像重建，为了成功保留输入图像的像素强度和详细纹理信息，给出了重建损失函数

式中，I和ˆI, V和ˆV分别表示红外图像和可见光图像的输入图像和重建图像。∇为梯度算子，且

其中X和ˆX表示上述输入图像和重建图像，λ为超参数。SSIM是结构相似性指数[Wang et al.， 2004]，是衡量两幅图之间相似性的指标。那么LSSIM可以描述为

值得注意的是l2范数度量的是原始图像与重建图像的像素强度一致性，而LSSIM计算的是图像在亮度、对比度和结构方面的差异。特别地，由于可见光图像具有丰富的纹理，因此采用梯度稀疏惩罚对可见光图像进行正则化重建，以保证纹理一致性。

结合方程式。(1)(2)，总损失Ltotal可以表示为

其中，α1、α2、α3、α4为调优参数。

3.4 Fusion Strategy

在上面的小节中，我们提出了网络结构和损耗函数。经过培训，我们将获得一个分解器(或者说是编码器)和一个解码器。在测试阶段，我们的目标是融合红外和可见光图像。工作流如图1(b)所示。与训练不同，在测试阶段插入融合层。它分别融合了背景和细节特征图。在公式中，有

BF和DF分别表示融合后的背景特征图和细节特征图。本文考虑了以下三种融合策略:

•求和法:BF = BI⊕BV, DF = DI⊕DV，其中符号⊕表示逐元素相加。

•加权平均法:BF = γ1BI⊕γ2BV, DF = γ3DI⊕γ4DV，其中γ1 + γ2 = γ3 + γ4 = 1， γi(i = 1，···，4)的默认值均为0.5。

•L1-norm方法:参考[Li和Wu, 2018]，我们将L1-norm作为活动的度量，并结合softmax操作员。在细节中,我们可以获得活动水平的地图融合背景和细节特征图由kBi (x, y) k1和kDi (x, y) k1 (i = 1、2),B1, B2, D1和D2代表BI, BV, DI和DV,代表相应坐标(x, y)地图和融合特性图的特性。那么可以通过以下方法计算出相加权值:

where ψ(·) is a 3 × 3 box blur (also known as a mean filter operator). Consequently, we have

其中⊗表示基于元素的乘法。

4 Experiment

本节的目的是研究我们提出的模型的性能和比较其他SOTA模型,包括FusionGAN (Ma et al ., 2019 b), Densefuse(李、吴,2018),ImageFuse[李et al ., 2018), DeepFuse[角色et al ., 2017), TSIFVS (Bavirisetti和Dhuli, 2016),TVADMM(郭et al ., 2017), CSR(刘et al .,和ADF [Bavirisetti和Dhuli, 2015]。所有实验都是在一台配备Intel酷睿i7-9750H [email protected]和RTX2070 GPU的计算机上使用Pytorch进行的。

采用熵(EN)、互信息(MI)、标准差(SD)、空间频率(SF)、视觉信息保真度(VIF)和平均梯度(AG)等6个度量来评价融合图像的质量。这些指标的更多细节见[Ma等人，2019a]。

数据集和预处理。我们的实验是在三个数据集上进行的，包括TNO [Toet and Hogervorst, 2012]， NIR [Brown and S¨usstrunk, 2011]和FLIR(可在https://github.com/jiayi-ma/RoadScene获得)。在我们的实验中，我们将它们分为训练集、验证集和测试集。表2给出了数据集的图像对个数、光照和场景信息。我们在FLIR数据集中随机选取180对图像作为训练样本。在训练之前，所有的图像都被转换成灰度。同时，我们用128 × 128像素对它们进行中心裁剪。

Hyperparameters设置。损失函数中的调谐参数经验设定为:α1 = 0.05， α2 = 2， α3 = 2， α4 = 10， λ = 5。在训练阶段，Adam对网络进行了120多个epoch的优化，批量大小为24个。对于学习速率，我们将其设置为10 - 3，并每40个epoch降低10倍。图2显示了与epoch索引的损耗曲线。结果表明，120代以后，所有的损耗曲线都非常平坦。换句话说，网络能够收敛于这种配置。

4.1 Experiments on Fusion Strategy

如3.4节所述，融合策略在我们的模型中起着重要的作用。我们研究了三种策略在验证集上的性能。表3报告了验证集上六个度量的数值结果。很明显，求和策略获得了较高的值，尤其是SD、SF、VIF和AG。因此，以下实验采用求和策略。

4.2 Experiments on Image Decomposition

我们的贡献之一是深度图像分解。分解的特征图是否能够满足我们的需求是一个很有趣的问题。在图3中，它显示了由conv3和conv4生成的特征图的第一个通道。实验结果表明，该方法能够有效地分离红外和可见光图像的背景和细节。对于背景特征图，我们发现BI和BV在视觉上是相似的，它们反映了同一场景的背景和环境。相反，DI和DV之间的差距较大，说明了不同源图像所包含的不同特征。即红外图像包含目标的高亮和热辐射信息，而可见光图像包含目标的梯度和纹理信息。综上所述，在一定程度上验证了我们所提出的网络结构和图像分解损失函数的合理性。

4.3 Comparison with Other Models

在本小节中，我们将把我们的模型与其他流行的模型进行比较。

定性比较。图4展示了几种不同模型生成的具有代表性的融合图像。视觉检测表明，在包含人的图像中，其他方法存在高光对象弱、对比度差、目标和背景轮廓不突出等问题。同样，如果图像是自然景观，其他图像的山和树边界模糊，色彩对比差，清晰度不够。相反，我们的方法可以获得目标更亮、边缘轮廓更清晰、保留更丰富细节信息的融合图像。

图4:不同方法的定性结果用橙色和蓝色盒子标记的区域被放大以方便检查。

定量比较。随后，对测试集的定量比较结果列于表4。我们发现，在所有数据集上，我们的模型在所有指标上都是最好的。至于竞争对手，他们可能在数据集的部分指标上表现良好。结果表明，该模型融合的图像纹理丰富，满足人类视觉系统的要求。

4.4可重复性实验

众所周知，深度学习方法经常因不稳定性而受到批评。因此，我们在上一个实验中对DIDFuse的重现性进行了测试。我们反复训练网络25次，并定量比较25个并行结果。如图5所示，黑色实心曲线报告了25个实验中的6个指标。红色虚线和蓝色虚线分别代表比较方法中的最大值和第二大值。与上述结果类似，我们的方法基本上可以一直保持第一的位置，说明DIDFuse可以稳定地生成高质量的融合图像。

图5:模型重现性测试结果。从上到下:图像融合数据集TNO、FLIR和NIR。从左到右依次为:EN、MI、SD、SF、VIF、AG。

5 Conclusion

为了解决IVIF问题，我们构造了一种新的AE网络，其中编码器负责图像的二尺度分解，解码器负责图像的重建。在训练阶段，训练编码器输出背景图和特征图，然后解码器重构原始图像。在测试阶段，我们在编码器和解码器之间设置融合层，通过特定的融合策略融合背景和细节特征图。最后，通过译码器得到融合后的图像。我们在TNO、FLIR和NIR数据集上测试了我们的模型。定性和定量结果表明，该模型能稳定地获得高亮目标的融合图像，且细节丰富，优于其他SOTA方法。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo