浅若清风cyf

论文笔记（综述）：Deep Learning-based Multi-focus Image Fusion: A Survey and A Comparative Study

论文链接：https://ieeexplore.ieee.org/abstract/document/9428544/
以下为原文内容的整理与翻译

摘要（Abstract）

背景
多聚焦图像融合（Multi-focus image fusion (MFIF)）是图像处理中的一个重要领域。自2017年以来，深度学习（deep learning has）已被引入MFIF领域，并提出了各种方法。然而，缺乏详细讨论基于深度学习的MFIF方法的调查论文。
本文工作
- 详细调查基于深度学习的MFIF算法，包括方法、数据集和评估指标
- 比较基于深度学习的MFIF算法（deep learning-based MFIF algorithms）与传统MFIF方法（conventional MFIF approaches）的性能
- 通过对定性和定量结果的分析，我们对MFIF的现状进行了一些观察，并讨论了该领域的一些未来前景

一、引言（Introduction）

背景：
由于摄像机的景深depth-of-field (DOF) 的限制，很难获得全部聚焦的图像。具体地说，DOF范围内的物体保持清晰，DOF范围外的场景内容模糊。然而，在实际应用中，清晰的图像是需要的。实现这一目标的一种方法是多焦点图像融合multi-focus image fusion (MFIF)。
多焦点图像融合（MFIF）
- 目的：将具有不同聚焦区域的多幅图像组合成一幅在所有位置都聚焦的图像。
- 传统的MFIF方法（Conventional MFIF algorithms）
  - 基于空间域的方法（spatial domain-based methods）
    
    可进一步划分为三类：基于像素的方法（pixel-based）、基于块的方法（block-based）、基于区域的方法（region-based）
  - 基于变换域的方法（transform domain-based methods）
    - 思想：首先将图像变换到另一个域中，然后在该域中使用变换后的系数执行融合。最后通过相应的逆变换得到融合图像。
    到目前为止，已经提出了许多基于变换域的方法，如稀疏表示方法（sparse representation (SR) methods）、多尺度方法（multi-scale methods）、基于梯度域的方法（gradient domain-based methods）和混合方法（hybrid methods）。
- 基于深度学习的MFIF方法（deep learning-based MFIF methods）
  - 方法分类：监督学习（supervised MFIF algorithms）、无监督学习（unsupervised MFIF algorithms）
  - MFIF的深度学习模型：CNNs、GANs、ensemble learning
本文工作
- 出发点：
  - 填补了基于深度学习的MFIF方法的调查文献的空缺。
  - MFIF领域缺乏将传统算法与基于深度学习的MFIF算法进行比较和全面的性能评估。
- 贡献：
  - 基于深度学习的MFIF方法、评估指标和数据集的系统调查。
  - 综合性能评估。
    
    使用19种评估方法在3个数据集上比较35种MFIF方法。
  - 未来前景展望。

二、基于深度学习的多聚焦图像融合方法（DEEP LEARNING-BASED MULTI-FOCUS IMAGE FUSION METHODS）

1、动机

MFIF的两个关键任务：①焦点测量（Focus measurement (FM)）或活动水平测量（Activity level measurement）②融合规则（fusion rule）
传统方法与深度学习方法对比

传统方法的不足	深度学习方法的优点
手工设计FM和融合规则，在复杂的情况下可能限制解空间	基于深度特征学习FM、自动学习融合规则
将FM和融合规则分开，进一步限制融合性能	通过学习将活动水平测量和融合规则一起处理
基于变换域的方法采用手工设计的变换，限制了对源图像的表示，并且对各种输入不鲁棒	深度学习模型可以视为自适应变换，鲁棒性优于基于变换域的传统方法

注：并不是所有的基于深度学习算法能够解决以上的所有不足，因为在大多方法中，深度学习仅作为方法的一部分。

2、基于深度学习的MFIF方法类别

监督学习、无监督学习
基于决策图的方法（decision map-based methods）
- 首先生成一个表示焦点级别(或活动级别)的决策图。然后根据该决策图进行图像融合。
- 在这些方法中，深度学习通常被用于生成决策地图，然后可能的后处理步骤，以获得更好的决策地图。
端到端的方法（end-to-end methods）
- 将源图像输入网络直接生成融合图像。

注：大多数基于决策映射的方法类似于基于空间域的算法，而端到端方法类似于基于转换域的方法。

An overview of main deep learning-based MFIF algorithms：

3、监督的深度学习方法（Supervised deep learning-based methods）

1）基于CNN的方法

Liu et al.第一个提出了基于CNN的MFIF方法，该方法首先采用一个CNN学习源图像到focus map的映射，通过这种方式，可以联合学习传统方法中分别处理的活动级别测量和融合规则。经过一系列后处理步骤，得到最终的决策图，然后通过像素加权平均方法生成融合图像。

a）基于决策图的方法（Decision map-based methods）

此类方法的几个研究点如下：

①改进焦点测量（Improved focus measurement）
- 有了几项工作改进了MFIF中的FM。
  - Tang等人[41]提出了一种像素级卷积神经网络（pixel-wise convolutional neural network (p-CNN)），这是一种学习的FM，与传统手工制作的FM相比，能够更好地识别源图像中的聚焦和散焦像素。
  - Wang等人[23]提出了一种类似的方法，该方法利用基于具有非常深的卷积网络的Siamese CNN模型来识别聚焦和散焦像素。在这些方法中，FM是在训练过程中自动学习的，因此比手动设计的FM更具鲁棒性。
②多层次特征（Multi-level features）
- 多层次特征可以用来使特征表示更加强大。
  - 例如，Yang等人[45]为MFIF提出了一种多级特征卷积神经网络（MLFCNN）架构。主要的创新点是使用了不同层次的多层次特征，并采用了1×1卷积来降低特征空间的维数。
③多尺度特征（Multi-scale features）
- 在一些研究中，利用多尺度特征来提高性能。
  - 例如，Du等人[30]将CNN方法[39]扩展到多尺度框架（MCNN）。MCNN使用多尺度输入进行训练以获得焦点图，然后对焦点图进行形态学和分水岭运算（morphological and watershed operations） 以获得理想的决策图。
  - Lai等人[49]提出的多尺度视觉注意深度卷积神经网络（MADCNN） 也使用不同空间尺度的互补特征。
  - 此外，Wang等人[48]在离散小波变换域提出了一种新的基于CNN的MFIF算法。具体来说，将小波应用于源图像以获得高频和低频图像。然后将高频和低频图像馈送至相应的CNN以获得相应的分辨率图，然后利用这些分辨率图生成融合的高频和低频图像。最后通过小波逆变换（inverse wavelet transform） 得到融合图像。通过这种方式，该方法结合了基于空间域和基于变换域的方法的优点。
④注意力机制（Attention mechanism）
- 在Lai等人[49]提出的MADCNN中，视觉注意单元被用来帮助网络更准确地定位聚焦区域。
- 在郭等人[55]提出的SSAN中，注意机制也被利用，试图缓解卷积算子的局部感受野限制。
⑤聚焦和散焦边界的处理（Handling of the focused and defocused boundary）
- 聚焦和散焦边界（FDB）是一个重要的研究领域，许多算法在FDB附近表现不佳。
  - Ma等人[50]提出利用两种不同的网络，即边界细化网络（boundary refinement net）和正规细化网络（normal refinement net），来处理从初始网络获得的初始得分图。
    边界细化网络专门用于处理靠近FDB的面片，而正规细化网络应用于远离FDB的面片。
  - 此外，在MMF-Net[54]中，设计了一个α-亚光边界散焦模型（α-matte boundary defocus model），通过精确模拟FDB附近的散焦扩散效应（defocus spread effect (DSE) ） 来生成真实的训练数据。据我们所知，这是第一个在为MFIF生成训练数据时考虑DSE的工作。
    该方法设计了两个级联子网，即初始融合子网和边界融合子网。具体来说，初始融合子网首先生成guidance map，然后边界融合子网在FDB附近对融合结果进行细化。
⑥全卷积算法（Fully-convolutional algorithms）
- 背景：
  在上述基于决策图的方法中，除了MADCNN[49]和MMF Net[54]之外，网络中使用了全连接的层，因此测试图像的输入大小被限制为训练图像的大小。 回避此问题的一种方法是在图像上使用窗口，以获得与融合贴图大小匹配的面片[23]、[39]、[45]。在这些方法中，FM是在面片级计算的，然后平均得到与源图像大小相同的最终聚焦图。然而，这种方法类似于传统的基于块级空间域的方法。因此，这些方法具有基于块的方法的缺点，即可能在FDB附近引入伪影。此外，这些工作中使用的完全连接的层消耗了大量存储资源.。
- 解决方法：更合适的方法是使用对输入图像大小没有要求的完全卷积网络，因此不需要将输入图像分割成小块。
  
  Guo等人提出了第一个基于全卷积决策映射的方法。随后，开发了一些其他的完全卷积方法[19]，[49]，[54]。
  具体而言，Li等人[19]提出了DRPL，它直接将整个图像转换为二值掩码（加权贴图），而无需任何补片操作。然后根据这些加权映射生成融合图像。
  存在问题：该方法通过对源图像对施加互补约束，假设两个源图像是互补的。然而，正如[54]所指出的，前景和背景区域之间并不总是存在清晰的边界。因此，该方法在处理FDB时可能存在问题。

b）端到端方法（End-to-end methods）

端到端方法的关键优势是通过训练直接学习源图像和融合图像之间的映射，因此无需进行后处理步骤。

模型架构（ecoder-decoder架构）
- two-stream结构
  - Xu等人[42]提出了第一种双流MFIF方法，该方法各使用一个分支处理一个源图像，如下图所示。
    该方法采用卷积层提取特征，然后由融合层进行融合，再由反卷积层进行恢复。
  - Zhange等人[22]提出的IFCNN，如下图所示。IFCNN在几个方面与Xu等人[42]的方法不同。
    ①首先，特征尺寸保持与源图像相同，而在[42]中，特征尺寸在卷积层中减小，并在反卷积层中恢复。
    ②其次，在IFCNN中使用了感知损失 （perceptual loss），而在[42]中使用了均方误差（mean squared error (MSE) loss）损失。
    ③第三，Zhang等人[22]证明，尽管IFCNN使用MFIF数据集进行训练，但它对其他图像融合任务具有良好的泛化能力。
- one-stream结构（多通道模型）
  - Li等人[51]提出U-net。
    
    该方法首先将源图像转换为YCbCr颜色空间，然后利用U形网络对亮度分量进行融合。Cb和Cr组件采用加权融合方法进行融合。
  - Pena等人[53]提出了一种用于MFIF的多源沙漏深度网络（multiple source hourglass deep network for MFIF）
    
    该方法直接处理RGB图像，如图6（b）所示。实际上，Pena等人[53]使用相同的框架提出了两种方法，即HF-Reg（端到端算法）和HR-Seg（基于决策图的方法）
其他方法
- 基于CNN的多层次MFIF方法（multi-level method MFIF method, ML-CNN）
  
  ML-CNN从两幅源图像中提取并融合每一层特征，在此基础上为每一层重构图像，最终的融合图像是通过一个卷积层对不同层次的图像进行融合得到的。
  优点：
  ①由于低级特征可以捕获低频内容，而高级特征可以捕获高频细节，因此利用多级特征可以提高融合性能。
  ②在训练过程中对多级输出进行同时监督，以提高图像融合的性能。
- 小波变换域的MFIF方法（CNN- based MFIF method in the wavelet domain）
  
  Li等人[47]在小波域提出了一种基于CNN的MFIF方法。该方法类似于[48]，但在该方法中，子带网络直接输出融合子带图像，而不是子带决策图。

2）基于GAN的方法（GAN-based methods）

FuseGAN：将MFIF作为一个图像到图像的转换问题，并利用最小二乘GAN目标增强FuseGAN的训练稳定性。GAN生成如下图所示的置信图，然后通过高级卷积条件随机场重新细化。
ACGAN：Huang等人[57]提出了ACGAN，这是一种基于GAN的端到端MFIF方法。

ACGAN和FuseGAN之间存在一些差异。
① 首先，ACGAN是一种端到端的方法，可以直接输出融合图像，而FuseGAN需要后处理步骤。
② 其次，ACGAN使用了由强度损失、梯度损失和结构相似性指数度量（SSIM）损失组成的发生器损失（generator loss）[57]，[64]，而FuseGAN使用了最小二乘GAN目标（the least square GAN objective）。
③ 第三，ACGAN训练用于融合灰度图像，因此在融合彩色图像时需要进一步处理，而FuseGAN可以直接融合彩色图像

3）基于集成学习方法（Ensemble learning-based methods）

Naji等人提出了基于三个CNN（ECNN）集合的融合算法[32]。其主要思想是使用各种模型和数据集，而不仅仅是一个，以减少训练数据集的过度拟合问题。
Naji等人也提出了类似的方法HCNN。
基于集成学习的方法的主要新颖之处在于它可以结合多种模型的优点

4）其他监督方法（Other supervised methods）

Zhai等人[21]提出了一种基于去噪自编码器(DAE)和深度神经网络(DNN)的MFIF方法。
Deshmukh等人[40]提出了一种算法，在深度信念网络(DBN)的帮助下，计算表明输入图像清晰区域的权重。
Lahoud等人[52]提出使用预训练的神经网络提取特征，从而缓解了训练阶段。

4、无监督的深度学习方法（Unsupervised deep learning-based methods）

背景：监督方法需要大量的标记训练数据。然而，基准图像在MFIF任务中通常不可获得，因此几乎所有受监督的方法都使用实际不真实的合成数据集。
无监督方法：现有的所有无监督MFIF方法都是完全卷积的，而且大多数是端到端算法。

1）基于CNN的方法（CNN-based methods

a）端到端方法（End-to-end methods）

MFNet
- 实现无监督训练的关键是使用基于非参考SSIM[64]的损失函数，这是一种广泛使用的图像融合评估指标，用于测量源图像和融合图像之间的结构相似性。
- 损失函数：
x1、x2、ˆy分别是源图像和融合图像，w是局部窗口
SSIM：structural similarity index measure loss
std（x | w）是局部窗口w上图像块x的标准偏差（SD）
- 模型训练目标：优化参数，降低SSIM值，增强源图像与融合图像的结构相似性。
- 模型结构：
  - 输入输出：MFNet以一对多聚焦图像作为输入，可以直接输出全聚焦图像。MFNet的网络体系结构如下图。
  - 组成：四个子网络：三个特征提取子网络（feature extraction sub-networks）、一个特征重构子网络（reconstruction sub-network）。
  - 子网络作用：特征提取子网络负责从源图像和两个输入图像的平均值中提取特征。重建子网络用于产生基于特征的融合图像。
MFFNet（与MFNet相似）
- 损失函数：SSIM loss+pixel loss term
- 模型特点：MFFNet特征提取网络中的所有层以前馈方式连接，以从多聚焦图像对中提取更有用的公共低层特征。
MLDNet
- MFFNet只使用一个密集块（one dense block）来提取源图像的特征，而MLD-Net有多个不同核大小的密集块（several dense blocks with various kernel sizes.）。
- MLDNet引入了两个额外的卷积层来提取源图像的浅层特征（shallow features），然后将其与从密集块获得的深层特征相结合。
MSCNN
- 特点：MSCNN采用多尺度特征提取和多尺度重建
- 损失函数：SSIM loss+pixel loss
  
  O和I是输出和输入图像
DIF-Net
- 背景：一些无监督算法[28]、[60]、[61]被设计用于执行多个图像融合任务，如可见光和红外图像融合、MFIF和多曝光图像融合。
- 损失函数：使用基于多通道图像对比度结构张量表示的无监督损失函数。
- 其他特点：在一些图像融合任务（如可见光-红外图像融合）中，DIF网络还考虑了源图像和融合图像之间可能存在的不同通道数。
FusionDN
- Xu等人[60]提出了一种方法（Fusionn）来将不同的图像融合任务组织到一个统一的密集连接网络中
- 优点：他们采用弹性权重整合，以避免在顺序训练多个任务时忘记从以前的任务中学到的东西。通过这种方式，获得了适用于多个融合任务的单一模型。
- 损失函数：SSIM+perceptual loss+gradient loss 【该损失函数更适合于图像融合任务】
U2Fusion（针对FusionDN的修改）
- 特点：信息保存度分配是基于对提取的特征而不是源图像进行的信息度量。【有助于捕获源图像的基本特征】
- 损失函数：SSIM+MES 【有助于减少融合图像中的亮度偏差】
PMGI
- 思想：PMGI将图像融合任务统一到源图像的纹理和强度比例保持问题中
- 损失函数：两幅图的intensity loss+gradient loss

b）基于决策图的方法（Decision map-based methods）

SESF
- 基于encoder-decoder network
- 步骤：①编码器：特征提取；②特征图+空间频率→获得focus map；③获得最终决策图：采用一致性验证（consistency verificatio）方法
- 损失函数：SSIM loss+pixel loss
- 特点：SESF不需要多聚焦图像对来训练。相反，它只使用MS COCO[66]来训练编码器-解码器网络
GCF
- 基于梯度（gradients）和连通区域（connected regions）的基于决策图的无监督MFIF算法
- 步骤：
  - ①使用encoder-decoder network生成map $M_0$ 和初始的二分掩码图 $M_1$ ，用来计算梯度损失和连通区域损失【需要使用多聚焦图像对作为训练数据】
  - ②后处理步骤：使用一致性验证（consistency verificatio）生成最终的决策图 $M_F$

2）基于GAN的方法（GAN-based methods）

MFF-GAN
- 基于GAN的无监督MFIF方法
- 首先根据重复模糊原理，利用自适应决策块对源图像的每个像素进行锐度评估。
  
  具体地说，如果像素具有更高的清晰度，则添加模糊后像素值的变化更大。
- 然后，内容损失（content loss）被专门设计为强制生成器（generator）生成与聚焦源图像具有相同分布的融合结果。
- 最后，使用鉴别器（discriminator）与生成器（generator）建立对抗游戏，使融合图像的梯度图与基于源图像构建的联合梯度图相似。这可以进一步增强纹理细节。

5、总结

从以上调查可以看出，许多基于深度学习的MFIF算法可以同时学习活动水平度量和融合规则，避免了单独和手工设计。
关于监督方法，有些是端到端方法，但大多数不是。
相比之下，所有已发表的无监督MFIF方法都是完全卷积的，大多数无监督方法都是端到端方法。此外，在大多数无监督方法中，SSIM是损失函数的关键部分

三、数据集（DATASET）

1、Multi-focus image fusion datasets

特点：图像对的数量不是很大，大多数数据集用于测试，需要进行数据增强才能用于训练
三种生成不同聚焦区域的图像对的方法：

序号	方法描述	特点	应用
1 、多景深拍摄法	用不同的景深（DOFs）捕获相同场景的图像	真实拍摄	-
2 、合成法	即通过将模糊添加到全清图像来生成模糊图像	在合成生成的图像中，所谓的DSE并不明显	Aymaz et al.[69]、Tsai、MFI-WHU
3 、重新聚焦法	对光场数据应用重新聚焦来生成多聚焦图像	这种方法很少使用，但它是最有前途的方法，因为它有可能提供具有地面真实性的多聚焦图像。	Lytro、Real-MFIF

2、Training data for deep learning-based methods

四、评估指标（EVALUATION METRICS）

两种评估方式：主观评价（定性评价）、客观评价（定量评价）
主观评价：不能自动化（耗时）、不同标准（偏差）→ 通常结合客观评价
客观评价：数十项指标。每个指标主要从一个方面评估MFIF算法。因此，重要的是使用不同类型的度量来评估MFIF算法。
客观评价的四种类型：
- 基于信息论的度量（Information theory-based metrics）
- 基于图像特征的度量（Image feature-based metrics）
- 基于图像结构相似性的度量方法（Image structural similarity-based metrics）
- 基于人类感知的度量（Human perception inspired metrics）

1、Information theory-based metrics

符号说明：M是图像的宽度，N是图像的高度。A和B分别指示第一源图像（图像A）和第二源图像（图像B）。X表示源图像，F表示融合图像。

2、Image feature-based metrics

3、Image structural similarity-based metrics

4、Human perception inspired fusion metrics

5、总结

这些指标是用来检验图像融合性能，而不是产生融合图像。因此，在应用这些指标之前，融合图像F已经由mif算法产生。
所有的MIFI算法都将源图像A和B的信息以某种形式组合在一起，因此在实际中通常不会出现A=F或B=F的情况。
两种源图像都包含重要信息，因此设计了许多评价指标来衡量融合图像F与源图像之间的相似性。
一个好的图像融合算法应该将两幅源图像的重要信息传递给融合图像。

五、实验和结果（EXPERIMENTS AND RESULTS）

1、MFIF方法比较（Compared MFIF methods）

测试算法：35 MFIF algorithms（包含12 deep learning-based MFIF methods）

2、数据集（Datasets）

数据集	特点
The Lytro dataset	Lytro数据集广泛应用于MFIF领域。它由20对多焦点图像组成，这些图像是用光场摄像机拍摄的。
The MFI-WHU dataset	MFI-WHU数据集是基于公共COCO数据集[66]和[121]中提供的数据集，使用高斯模糊和手工制作的决策图构建的。它由120对图像组成，其中30对用于测试，90对用于训练。
The MFFW dataset	Xu等[68]认为Lytro数据集DSE不高，因此创建了包含13对具有强DSE的真实多焦点图像对的MFFW数据集。

3、评价指标（Evaluation metrics）

19个评价指标
对于CE和QCV，值越小表示性能越好，而对于其余17个指标，值越大表示性能越好

4、定量性能比较（Quantitative performance comparison）

1）算法整体排名

算法数量：35个算法
排名方法：首先计算每个算法在每个度量上的排名，然后根据Borda计数计算这些算法的总体排名
四种传统方法，即GFDF、QB、TF和MFM，通过在所有三个数据集上显示前五名性能
基于深度学习的方法，CNN取得了最佳的整体排名（第5位）
基于深度学习的MFIF方法在Lytro、MFI-WHU和MFFW上的最佳排名分别为6、4和2。
- 在MFFW数据集上，只有CNN位列前十。
- 在Lytro和MFI-WHU数据集上，只有三种基于深度学习的方法实现了前十名的性能。
- 这意味着，与传统方法相比，基于深度学习的MFIF方法没有表现出非常有竞争力的定量性能。

深度学习的方法性能对比【上图】：
- 就三个数据集的总体排名而言，CNN是最好的监督方法，SESF是最好的无监督算法。
  
  CNN和SESF都不是端到端的方法。特别是，采用了后处理步骤（一致性验证），表明后处理步骤有助于基于深度学习的方法。
- 一般来说，有监督的方法比无监督的方法表现出更好的结果。
- 专门为MFIF任务设计的方法优于一般的图像融合方法。这对于有监督和无监督的方法都是正确的。
  
  各种图像融合任务具有非常不同的关键点以实现良好的性能，因此最好设计特定的措施来处理不同的任务。
- 大多数有监督的方法在训练中使用合成的图像数据，而大部分无监督方法在训练中使用真实的多聚焦图像。
泛化能力（The generalization ability）
- 实验条件：本研究中选择的三个MFIF数据集具有不同的特征，并且与训练集不同。
- 实验结果【上方两幅图】：与有监督的方法相比，一般无监督方法具有更好的泛化能力。
  - 在无监督方法中，只有GCF的性能在不同的数据集上存在显著差异。相比之下，几乎所有有监督的方法在三个数据集上表现出显著的性能差异。
  主要原因是，有监督的MFIF方法使用合成数据集或ImageNet（PCANet）的所有清晰图像进行训练，但这些训练数据与真实多聚焦图像不一致[50]。因此，他们无法学习处理真实多焦点图像的良好能力。
  - 尽管Lytro数据集和MFFW数据集都是真实的多聚焦图像融合数据集，但MFFW数据集具有训练数据集所不具备的强大散焦扩散效应（DSE），因此MFFW数据集上的5种算法（共8种）的性能比Lytro数据集上的差。
  - 在所有的基于深度学习的方法中，SESF在总体排名和良好的泛化能力方面显示出第二好的总体性能。这有两个原因。首先，采用一致性验证作为后处理步骤来校正决策图。其次，SESF中使用的损失函数包括SSIM项和像素损失，因此训练模型对变化的源图像更具鲁棒性。
  - 仅使用一个损失项（ECNN、MADCNN、PCANet）或不采用后处理步骤（DRPL、MADCNN、IFCNN）的方法通常不会表现出良好的泛化能力。

2）基于度量的结果

没有一种能够获得优异的性能
GFDF在MFFW数据集上获得了最佳的整体定量性能，仅在1个指标上排名第一，在19个指标中的8个指标上排名前五。
不同的算法在不同的度量方面具有非常不同的性能。

例如：SFMD在MFFW数据集的2个度量上获得最佳值，但在所有35个算法中，它仅排名第32位。这是因为SFMD在基于图像特征的度量方面获得了良好的性能，而在其他度量方面表现不佳。

上图显示了MFFW数据集上每种方法在每种度量上的平均排名。
几乎每种算法在不同类型的度量上都表现出不同的性能，表明这些算法在处理不同信息方面的不同能力。这也发生在其他类型的图像融合任务中[38]，[130]。每种方法在不同类型度量上的性能在一定程度上受所使用的损失函数的影响。

例如：
1、MFF-GAN在基于图像特征的度量上表现出比其他三种度量更好的性能。这是因为MFF-GAN的鉴别器设计用于强制融合图像具有与源图像的联合梯度图相似的梯度图，并且梯度是基于图像特征的度量的重要组成部分。
2、一个类似的例子是GCF，它在基于图像特征的度量上比在其他类型的度量上获得更好的性能。原因是梯度损失是GCF损失函数中的一个主要项。

5、定性性能比较（Qualitative performance comparison）

伪影：从融合图像和贪婪虚线框中放大的图中可以看出，许多算法在融合图像中产生明显的伪影。CSR、ECNN、GCF、PCANet和QB制作的融合图像中，雕塑的手部周围存在伪影。
模糊：FusionDN和PMGI给出了仍然存在某种模糊的融合图像。
颜色失真：RP-SR和LP-SR方法产生的融合图像在图像右上角的墙壁上有颜色失真，GD的融合图像在左侧有颜色失真（看起来像过度曝光）。
边缘：有些算法无法很好地处理边缘。
综上所述，在本例中，CNN、IFM和MWGF的融合效果都比较好。
结论：
- MFFW 02图像对的定性结果与定量结果（表6和图11）在一定程度上一致。
- 目前还没有一个指标能够准确地指示MFIF算法的视觉性能。因此，在这种情况下，一些在人类感知指标上表现出良好性能的算法无法生成良好的融合图像。
- 定量和定性结果之间的不一致不仅存在于MFIF中，而且也出现在其他图像融合任务中，如多曝光图像融合和可见红外图像融合。
- 大多数基于深度学习的MFIF算法不能提供令人满意的融合图像，这表明基于深度学习的MFIF方法与传统方法相比没有优势。

6、运行时间比较（Running time comparison）

首先，MFIF方法的运行时间因方法而异。例如，运行时间最慢（ASR）的是最快的（IFCNN）的22800多倍。对于同一类别中的方法也是如此。

例如，在深度学习方法中，CNN的运行时间是IFCNN的7000多倍。值得一提的是，CNN和PCANet是在MATLAB中实现的，而所有其他基于深度学习的方法都是在PyTorch或TensorFlow中实现的。因此，在PyTorch或TensorFlow中实现基于深度学习的方法通常比使用MATLAB更有效。
其次，基于SR的方法是计算成本最高的方法，融合图像对需要6分钟以上的时间。
第三，一般来说，基于空间域的方法和基于变换域的方法（不包括基于SR的方法）的计算成本是相同的数量级，除了一些算法，如CBF和DWTDE。
最后，大多数MFIF算法的效率应进一步提高，以应用于实时应用。

六、讨论（DISCUSSION）

1、结果分析（Analysis of results）

基于深度学习的方法在MFFW数据集上的性能比传统方法差
可能原因：
- 首先，大多数基于深度学习的MFIF方法在训练中使用了Lytro数据集或合成数据集的一部分。然而，Lytro数据集相对容易，因为它不包含太多DSE，并且合成数据集不具有真实多聚焦图像的关键特征。因此，使用这些数据集训练的深度学习模型无法学习处理具有强DSE的具有挑战性的真实单词多焦点图像的能力。
- 第二，远离聚焦和散焦边界（FDB）和靠近FDB的区域情况不同。因此，最好采取一些具体措施来应对FDB。然而，大多数基于深度学习的方法使用单个网络来同时处理这两种情况。

2、基于深度学习方法的研究进展（The progress of deep learning-based methods）

自2017年以来，已经提出了70多种基于深度学习的MFIF方法。然而，根据我们的实验结果，性能改进是有限的。
限制性能的几个挑战：
- 缺乏在聚焦和散焦边界（FDB）附近具有强DSE的大规模真实训练数据集。
- FDB是基于深度学习的方法面临挑战的领域。实际上，很少有研究采取具体措施来处理FDB。
- 现有MFIF数据集中，ground truth不存在。这给MFIF算法的训练和性能评估带来了困难。
- MFIF任务中损失函数的有效设计仍然是一个挑战

七、总结（CONCLUSIONS）

本文详细介绍了基于深度学习的多聚焦图像融合算法。据我们所知，这是第一次针对基于深度学习的MFIF方法的调查。我们还详细总结了MFIF数据集和客观评估指标。
在详细调查之后，进行了大量实验，使用3个不同的数据集和19个评估指标综合评估35个MFIF算法的性能。实验结果表明，基于深度学习的MFIF方法没有显示出传统方法的优势。此外，尽管已经提出了70多种基于深度学习的MFIF方法，但自2017年以来，基于深度学习的MFIF方法的性能改进有限。
基于调查和比较研究，我们发现一些方法可能有助于提高基于深度学习的MFIF方法的性能。
- 首先，开发具有强大DSE的大规模真实世界训练数据集以填补合成数据和真实数据之间的差距至关重要。
- 第二，在大规模真实世界的训练数据集中获得基本事实是可取的。实现这一点的一种可能方法是从光场数据生成具有地面真实性的训练数据。
- 第三，重要的是在损失函数中包含不同的指标，其中每个指标从不同的方面评估性能。这样，损失函数可以更好地反映深度学习模型的性能，从而为通过反向传播改进训练过程中的参数提供更好的指导。
- 第四，尽管深度学习技术可以为MFIF任务提供端到端的解决方案，但实验结果表明，一致性验证等后处理步骤有助于提高性能。这是因为现有的训练数据集不够好，因此端到端模型的性能受到限制。
- 最后，重要的是使用不同类型的度量来评估MFIF方法，以获得适当的反馈，这对于改进深度学习模型的设计至关重要。
值得一提的是，已经设计了一些算法来执行多个图像融合任务。然而，根据我们的实验结果，与专门为MFIF设计的方法相比，通用的图像融合方法（general image fusion methods）几乎始终显示出较差的量化性能。这是因为与其他图像融合任务相比，MFIF具有独特的特性，因此应采取具体措施。因此，我们建议专门为MFIF任务设计基于深度学习的方法。
名词总结：
- defocus spread effect (DSE)：散焦扩散效应（DSE）
- focused and defocused boundary：远离聚焦和散焦边界（FDB）

你可能感兴趣的:(计算机视觉,论文笔记,深度学习,计算机视觉)

Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
网络爬虫再深入——对抗指纹检测、分布式架构与智能解析实战 rooney2024 爬虫
目录一、深入反爬：浏览器指纹检测与对抗（配图1）1.高级指纹检测原理2.对抗方案与实战二、分布式爬虫架构深度设计（配图2）1.容错与弹性设计2.智能限流算法三、智能解析：LLM与计算机视觉的融合（配图3）1.LLM解析非结构化文本2.视觉辅助定位元素四、法律与伦理：爬虫工程师的自我修养1.关键法律边界2.道德实践框架五、未来战场：Web3.0时代的爬虫技术演进1.去中心化网络挑战2.AI驱动的自适
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
计算机视觉：人工智能的“眼睛” 人工智能教程人工智能计算机视觉机器学习算法 pytorch python 数据结构
前言在人工智能的众多领域中，计算机视觉（ComputerVision）无疑是其中最为引人注目的方向之一。它赋予了机器“看”的能力，使计算机能够像人类一样理解和解释视觉信息。从自动驾驶汽车到医疗影像诊断，从安防监控到虚拟现实，计算机视觉的应用场景无处不在，深刻地改变着我们的生活和工作方式。本文将深入探讨计算机视觉的核心技术、应用场景以及未来的发展趋势，帮助您全面了解这一充满活力的领域。一、计算机视觉
计算机视觉：打开机器之眼看世界 LeafyJee_ 人工智能人工智能深度学习计算机视觉
计算机视觉是人工智能领域中备受关注的一部分，它的目标是赋予计算机类似于人类眼睛的功能，让机器能够感知和理解周围的世界。通过图像和视频数据，计算机视觉技术将信息转化为可理解和可操作的数据，为各种应用领域提供了强大的支持。一、计算机视觉的起源和发展计算机视觉起源于20世纪50年代，当时科学家们开始研究如何让计算机能够识别和理解图像。随着技术的不断进步，计算机视觉逐渐发展成为一门独立的学科，并广泛应用于
如何使用 OpenCV 打开指定摄像头
在计算机视觉应用中，经常需要从特定的摄像头设备获取视频流。例如，在多摄像头环境中，当使用OpenCV的cv::VideoCapture类打开摄像头时，如果不指定摄像头的ID，可能会随机打开系统中的某个摄像头，或者按照设备连接的顺序打开第一个可用的摄像头。比如： //打开两个摄像头 cv::VideoCapture cap0(0); if (!cap0.isOpened()){ c
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include