小郭同学要努力

【异构知识蒸馏：IVIF】

Heterogeneous Knowledge Distillation for Simultaneous Infrared-Visible Image Fusion and Super-Resolution

（同时进行红外-可见光图像融合和超分辨率的异构知识蒸馏）

近年来，红外-可见光图像融合引起了越来越多的关注，并且出现了许多出色的方法。但是，当融合低分辨率图像时，大多数融合结果都是低分辨率的，限制了融合结果的实际应用。尽管有些方法可以同时实现低分辨率图像的融合和超分辨率，但由于缺乏高分辨率融合结果的指导，融合性能的提高受到限制。为了解决这个问题，我们提出了一种具有多层注意嵌入的异构知识蒸馏网络 (HKDnet)，以共同实现红外和可见光图像的融合和超分辨率。准确地说，所提出的方法由高分辨率图像融合网络 (teacher network) 和低分辨率图像融合和超分辨率网络 (student network) 组成。教师网络主要融合高分辨率输入图像，引导学生网络获得融合和超分辨率联合实施的能力。为了使学生网络更加关注可见输入图像的纹理细节，我们设计了一种角嵌入注意机制。该机制集成了通道注意力，位置注意力和角落注意力，以突出可见图像的边缘，纹理和结构。对于输入的红外图像，通过挖掘层间特征的关系来构建双频注意 (dual-frequency attention (DFA))，以突出红外图像的显着目标在融合结果中的作用。实验结果表明，与现有方法相比，该方法保留了可见光和红外模态的图像信息，达到了良好的视觉效果，并显示了准确而自然的纹理细节。

介绍

本文提出了一种具有多层注意嵌入的异构知识蒸馏网络 (HKDnet)，以共同实现红外和可见光图像的融合和超分辨率。所提出的方法包括高分辨率图像融合网络以及低分辨率图像融合和超分辨率网络。前者网络融合高分辨率输入图像，引导低分辨率图像融合和超分辨率网络，实现融合和超分辨率的结合。它被称为教师网络。后一个网络是在教师网络的指导下训练的，被称为学生网络。异构知识提炼所需的知识是教师网络的融合特征和融合图像。在整个网络的训练过程中，教师网络中的知识将继续转移到学生网络中。为了解决同时图像融合和超分辨率时缺乏高分辨率融合图像标签的问题，我们以教师网络生成的高分辨率融合图像为标签，监督学生网络的训练。
在现有的知识提炼工作中，教师和学生网络通常共享相同的任务。教师网络更复杂，性能更高，而学生网络就网络结构而言是轻量级网络。在这项工作中，教师网络的任务与学生网络的任务不同。教师网络只负责融合高分辨率图像，学生网络负责低分辨率图像的融合和超分辨率。本工作中建议的教师网络具有更少的参数和更少的计算量。它为学生网络培训提供高分辨率融合图像标签。学生网络需要实现图像融合和超分辨率。它有更多的网络层，需要更重的计算量。学生网络接收到低分辨率红外和可见光图像后，可以直接生成高分辨率融合图像。教师网络包括编码器、融合层和解码器。学生网络包括实现融合和超分辨率的模块，比教师网络更复杂。因此，建议的网络是HKDnet。
我们针对学生网络中的不同模态图像设计不同的注意机制，以突出其信息差异。可见图像携带大量信息，例如边缘细节和纹理结构。通过将信息集成到融合结果中，可以提高融合性能。对于可见图像，角嵌入注意 (CEA) 机制旨在使网络能够专注于输入可见图像的纹理细节。CEA机制集成了通道注意力，位置注意力和角落注意力，以突出可见图像的边缘，纹理和结构。与可见光图像相比，红外图像携带了大量目标的亮度信息，反映了物体的显著性。如果可以将亮度信息传递到融合结果中，则有助于改善融合结果的视觉效果并突出物体的显着性。因此，对于输入红外图像，通过挖掘层特征之间的关系来构建双频注意 (DFA)，以突出红外图像的显着对象在融合结果中的作用。

贡献

1）提出了一种异构知识蒸馏模型，该模型首先将知识蒸馏的思想引入到红外-可见光图像融合和超分辨率的联合实现中，以解决由于缺乏标签指导而导致的融合质量差的问题。该模型使用异构教师网络来生成伪标签，并应用标签和融合的特征来训练学生网络以同时进行图像融合和超分辨率。

2）为红外和可见光图像设计了不同的特征提取分支。对于可见图像的特征提取，提出了CEA机制，该机制集成了角点注意，位置注意和通道注意，以突出可见图像的纹理，边缘和结构在融合和超分辨率中的作用。

3）对于红外图像的特征提取，提出了DFA机制，该机制可以保留红外图像中的显着性信息。该机制通过挖掘网络不同层特征之间的关系来保留红外图像的显着亮度信息，从而对显着区域赋予更大的权重。

方法

提出了一种具有多层注意嵌入的异构知识蒸馏框架，如图1所示，以同时实现红外-可见图像融合和超分辨率。该框架主要由五个部分组成: 1) 教师网络; 2) 特征提取模块; 3) 特征融合模块; 4) 超分辨率模块; 5) 损失与训练策略。
教师网络由编码器、融合层和解码器组成。通过将高分辨率源图像输入到预先训练的教师网络中，获得高清融合标签图像。
学生网络由特征提取模块、特征融合层和超分辨率模块组成。通过将低分辨率源图像馈送到学生网络中，可以获得高分辨率融合图像。
教师网络中高分辨率源图像的融合特征和融合结果用于指导学生网络的训练。

通过前馈网络，学生网络直接学习参数S_θ_s的映射函数θ_s:

其中 $I^l$ _ir和 $I^l$ _vis 分别为低分辨率红外和可见光图像， $I^s$ _f为学生网络生成的高分辨率融合图像。学生网络通过以下方式进行优化:

其中L_s是学生网络的损失函数， $I^t$ _f是教师网络生成的标签。具体地， $I^t$ _f由教师网络的映射函数T_θ_t生成:

其中，O和I分别为训练时教师网络的输出图像和输入图像，L_t为教师网络的损失函数。

Teacher Network

教师网络包括编码器、融合层和解码器。编码器由一个3 × 3卷积层和一个密集连接的块组成。卷积层用于提取浅层特征。密集连接的块包含三个卷积层。将每一层的输出级联作为下一层的输入，避免信息丢失，进一步增强高频信息。解码器由四个卷积层组成。教师网络的结构类似于DenseFuse网络。但是，DenseFuse的融合结果会遭受严重的亮度损失，因此我们也使用残差连接将源图像特征输入到解码器。除了融合的特征之外，红外和可见源图像的特征也被馈送到解码器中。令F_ir，F_vis和F_f分别表示红外源图像特征，可见源图像特征和融合特征。解码器的输出 $I^t$ _f可以表示为:

其中W2是解码器D的权重集，α 是控制红外和可见图像特征的输入比率的平衡参数。为了使融合结果补充更多的源图像像素强度信息，α 的值保持在0到1之间。

Feature Extraction Module（学生网络）

在图像融合中，源图像的显著性信息对提高融合图像的质量起着至关重要的作用。
DFA嵌入到红外图像特征提取分支中，以帮助网络提取红外图像中的像素强度信息。在红外图像特征提取分支中，采用3 × 3卷积层提取低分辨率红外源图像 $I^l$ _ir的浅层特征 $F^s$ _ir。深度特征 $F^d$ _ir是通过残差组 (residual group (RG)) 获得的。最后，由六个DFA块 (DFABs) 组成的DFAG获得了增强的 $F^e$ _ir特性。
CEA被引入可见图像特征提取分支，以支持网络提取可见图像中的纹理细节信息和上下文信息。在可见光图像特征提取分支中，采用3 × 3卷积层提取低分辨率可见光源图像 $I^l$ _vis的浅层特征 $F^s$ _vis，通过两个级联RGs得到深度特征 $F^d$ _vis。最后，通过CEA模块获得了增强的功能。
图像特征的频率随网络深度而变化。如果结合相邻网络层的特征来提取不同频率特征之间的相关性，则相关性可以增强图像特征。在红外图像中，强度代表热辐射信息。受不同频率特征具有互补信息的知识启发，相邻网络层的特征被哈达玛积（点积）融合。然后，通过softmax获得DFA映射。随着网络的训练，来自相邻层的特征的相关性将被自适应地编码到DFA映射中。通过使用DFA图对红外图像的特征进行加权，将为强度更高的区域分配更重要的权重，以增强热辐射信息。

基于上述思想，我们提出了DFAG，其中包含六个DFAB。DFAB的具体结构如图2所示，将特征F输入到两个级联的RCAB中，得到表示能力更强的特征D ∈ $R^{c × h × w}$ 。然后，将D馈入三个卷积层，以获得D₁ ∈ $R^{c × h × w}$ ，D₂ ∈ $R^{c × h × w}$ 和D₃ ∈ R^{c × h × w}$。D₁和D₂的哈达玛积经过softmax层后，可以得到DFA映射MDFA ∈ $R^{c × h × w}$ :

其中，M_DFA中的元素表示对象特征的显着性，该显着性随对象亮度的增加而增加。得到加权特征E ∈ $R^{c × h × w}$ :

其中 δ 是从0学习的权重参数。在E中，较亮物体的显着性得到了增强。从图2中可以看出，在通过DFAG之后获得增强的特征 $F^e$ _ir红外图像特征 $F^d$ _ir。

对于可见图像，如果更多地关注与纹理和边缘相对应的特征，则保留源图像的显着性信息将是有益的。通过捕获可见图像中对象之间的上下文关系，可以获得更好的特征表示。因此，我们设计了CEA机制来预测不同空间位置的可见图像特征的权重，并捕获空间和通道维度上的特征关系。如图3所示，CEA机制集成了通道注意力，位置注意力和角落注意力。 $F^d$ _vis是CEA的输入。当 $F^d$ _vis通过1 × 1卷积时，得到F_v ∈ $R^{c × h × w}$ 。F_v分别输入角落，位置和通道注意模块。

1) Corner Attention Module:
根据每个区域在不同方向上的梯度变化，可以将图像分为平滑区域，边缘区域和角落区域。角落包含关键的方向提示，并控制边缘和纹理的外观。在角落密集的区域，也有大量的边缘和纹理。因此，注意角区域相当于注意图像的纹理边缘细节。受上述想法的启发，我们提出了一个角落注意模块。将特征F_v输入角点注意模块，通过Harris算法进行处理，得到角点注意图M_COA ∈ $R^{c × h × w}$ 。

其中c = 1,2，…，C，i = 1,2，…，W和j = 1,2，…，H。 $M^{cij}$ _COA = 1表示F_v的第c通道的位置 (i，j) 属于角点区域，反之亦然，不属于角点区域。 $F^c$ _v表示F_v的第1个通道。Harris(x) 表示x由Harris函数处理。值越大，x越接近拐角区域。γ是一个介于0和1之间的系数。
同时，将特征F_v ∈ $R^{c × h × w}$ 输入到1 × 1卷积中，以获得新的特征B ∈ $R^{c × h × w}$ 。然后，应用M_COA和B的点积，获得增强的可见图像特征C ∈ $R^{c × h × w}$ 。通过将F_v和C的元素相加得到最终输出F_COA。F_COA中的元素 $F^{cij}$ _COA可以表示为：

其中 β 被初始化为0，随着网络提取特征的能力的提高，这将被分配一个更大的值。从 (9) 可以看出，特征F_v的所有位置均由角注意图M_COA加权。因此，可见图像的边缘角区域受到了更多的关注。

2) Position Attention Module:

判别特征对于图像处理很重要，通过捕获长距离上下文信息获得。基于此，使用自我注意机制来捕获可见图像中的上下文。位置注意模块的结构如图3所示。F_v被重塑为F_v，r ∈ $R^{C × N}$ ，其中N = H × W。在F_v，r和F_v，r的转置之间使用矩阵乘法，然后，采用像素级softmax函数计算位置i (i = 1,2，…，N) 和j (j = 1,2，…，N) 之间的相关性:

其中F_v，r (i，j) 表示位置j在F_v，r的第i个通道上的特征。最后，增强的可见图像特征F_POA ∈ $R^{C × H × W}$ 可以通过:

其中 Ω∈ $R^{N × N}$ 是由 ω i，j组成的矩阵。从 (11) 可以看出，F_POA是原始特征F_v与按位置注意的增强特征之间的加权和。因此，F_v中相似的语义特征可以相互增强，从而提高了特征的区分度。

3) Channel Attention Module:
对于可见图像，可以将每个通道的特征图视为图像的映射，并且在不同通道中的映射通常是不同的。通过挖掘不同通道之间的依赖关系，并为那些映射值较大的通道分配更大的权重，我们可以获得具有更强表示能力的特征图。基于该思想，通道注意模块用于捕获不同通道之间的依赖性，如图3所示。与位置注意模块类似，F_v也被重塑为F_v，r ∈ $R^{C × N}$ 。矩阵乘法用于对F_v，r及其转置 $F^T$ _v，r的不同通道之间的依赖性进行建模，并使用像素级softmax函数来计算第i个 (i = 1,2，…，C) 第j (i = 1,2，…，C) 通道上的通道。

最后，通道注意力增强的特征可以表述为

融合了功能F_COA，F_POA和F_CHA，以获得更好的特征表示。然后，使用1 × 1卷积来获得增强的特征 $F^e$ _vis。

Feature Fusion Strategy and Super-Resolution Network

假设F_ir ∈ $R^{c × h × w}$ 和F_vis ∈ $R^{c × h × w}$ 代表红外和可见光图像的特征。C是频道的数量。H和W分别是行数和列数。假设F_ir ∈ $R^{c × h × w}$ 和F_vis ∈ $R^{c × h × w}$ 代表红外和可见光图像的特征。C是频道的数量。H和W分别是行数和列数。l1-norm和softmax用于融合F_ir和F_vis。在获得F_ir和F_vis之后，需要一种特征融合策略来融合它们。l1-norm和softmax用于融合F_ir和F_vis。师生网络中的融合层采用相同的融合策略。具体地，分别计算F_ir和F_vis各位置的所有信道特征的l1-norm，得到活动水平图M_ir ∈ $R^{H × W}$ 和M_vis ∈ $R^{H × W}$

最后，通过W_ir和W_vis对F_ir和F_vis的每个通道的特征进行加权求和，得到融合特征

我们选择RCAN作为超分辨率的基本网络。与RCAN不同的是，我们的超分辨率模块中只有五个RGs，而RCAN中有十个RGs。此外，我们的超分辨率模块中的高分辨率特征提取和图像重建是由教师网络指导的。

Loss Function

原始的红外和可见图像是真实图像，它们的低分辨率版本用作模型训练的输入。为了实现更好的性能和特征学习能力，损失函数使学生网络能够使用多任务学习同时进行融合和超分辨率。由于缺乏真实数据作为同时融合和超分辨率的标签，教师网络生成相应的伪标签来训练学生网络。
在教师网络训练中，同时利用像素损失和结构相似性损失，使输入图像和重建图像具有相似的像素强度和结构。由于可见图像中的纹理细节主要由梯度变化表示，因此使用梯度损失来约束重建图像，使其梯度变化类似于输入图像。此外，感知损失 用于实现重建图像的更好视觉效果。教师网络的总损失可以表示为

其中L_t、L_pixel、L_ssim、L_grad和L_percep分别表示总损失、像素损失、结构相似性损失、梯度损失和感知损失。Μ 是权重参数，它平衡了结构相似性损失对总损失的贡献。像素损耗L_pixel、结构相似性损耗L_ssim、梯度损耗L_grad、感知损耗L_percep定义为:

其中||·||2表示l2-norm。SSIM(·）表示结构相似性函数。对于梯度损失，首先，计算输入图像和输出图像的梯度，然后，使用它们之间的欧氏距离来获得梯度损失值。▽表示梯度算子。对于感知损失，输入和输出图像被馈送到预先训练的VGG16网络中，以获得它们各自的特征表示。它们之间的欧几里得距离被定义为感知损失。Φ i，j表示VGG网络中第i个maximun池化层之前的第j个卷积 (激活) 得到的特征图。
教师网络的预培训完成后，我们开始学生网络的培训。由于学生网络结构复杂，因此在前60个时期仅对融合部分进行训练，以使其具有初步的融合能力，从而为融合特征提供更好的表征知识，以用于后续的超分辨率。在此阶段，低分辨率红外和可见光光源图像被馈送到学生网络和教师网络中。教师网络解码器倒数第二层的输出为 $F^t$ _f，用作学生网络低分辨率特征融合的标签。学生网络的融合部分的输出是低分辨率融合特征 $F^s$ _f。在 $F^s$ _f和 $F^t$ _f之间，l₁损失用于训练学生网络的融合部分

由于均方误差的损失会导致输出图像模糊 ，因此使用l₁损失为学生网络提供更好的收敛性。为了将丰富的高分辨率融合特征知识从教师网络传递到学生网络，在两个网络的中间层特征中还使用了l₁损失。学生网的总损失由

$I^s$ _f和 $I^t$ _f分别是教师网络生成的标签和学生网络生成的高分辨率融合图像，φ 是一个平衡参数， $T^m$ 是教师网络中第m层的特征， $S^n$ 是学生网络中第n层的特征。H是一组候选特征对。我们在提出的方法中使用了两个特征对。第一特征对是教师网络和学生网络中倒数第二层的特征，第二特征对是教师网络中倒数第四层的特征和学生网络中倒数第三层的特征。

Training Strategy

培训分为两个步骤: 1) 教师网络培训和2) 学生网络培训。
在教师网络的训练阶段，我们只训练网络的编码器和解码器，其中没有训练融合层。教师网络培训完成后，将生成的标签用于监督和培训学生网络。
在学生网络的培训过程中，我们使用两个阶段: 1) 在前60个时期中训练融合部分; 2) 用Ls训练整个学生网络，如算法1中所示的HKDnet训练过程中所述。

【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
AI交互的初期魅力与后期维护挑战
AI交互的初期魅力与后期维护挑战引言在当今数字化时代，人工智能（AI）技术正迅速渗透到各个领域，特别是人机交互方面。许多开发者、设计师和用户在初次与AI交互时，往往感受到一种“一时爽”的快感。这种交互方式看似高效、智能，能够快速响应需求，提供即时反馈。然而，随着时间的推移，这种初期魅力往往会转化为高昂的后期维护成本。本文将深入讨论AI交互的这一双面性，重点分析细节沟通不足以及UI设计中AI难以处理
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例你喜欢喝可乐吗？ deep learning deploy 深度学习 YOLO 目标检测
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例深度学习模型从开发到部署的完整流程包含需求分析、数据准备、模型训练、模型优化、模型测试和部署运行六大核心环节。YOLOv11作为新一代目标检测模型，不仅延续了YOLO系列的高效实时性能，还在检测精度和泛化能力上取得显著突破，使其成为工业质检、安防监控、自动驾驶等领域的理想选择。本文将详细阐述这一完整流程，并结合YOLOv11的具体实现，提
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
深度学习：让 AI 拥有 “思考” 能力的核心技术田园Coder 人工智能科普人工智能科普
1.深度学习：突破传统的AI“进阶版”1.1什么是深度学习？深度学习是机器学习的一个分支，它通过模拟人脑神经网络的多层结构，让AI能够自动学习数据中的复杂特征，从而完成更高级的认知任务。例如，传统机器学习需要人类手动提取“猫有尖耳朵、胡须”等特征，而深度学习能直接从原始图片中，自主学习从像素到轮廓、再到整体形态的多层特征，最终实现更精准的识别。这种“自主提取特征”的能力，让深度学习突破了传统AI的
马斯克整出的半仙儿，Chat GPT会让多少白领失业？可能会带来哪些变化？良辰美景5566
这几天，ChatGPT火了，是美国一家叫OpenAI的高科技公司研发的，背后的投资人是谁？——埃隆马斯克！这哥们儿只要一出手，注定就和新奇呀伟大呀啥的绑在一起了，他搞的项目，比如特斯拉、星链、脑机接口，光听名字就透着不俗。很多人纳闷儿，他这次搞得ChatGPT是个啥玩意儿？简单说就是一个人工智能聊天软件，这个软件比以往的智能聊天软件强在哪儿？这么说吧，这简直就是个半仙儿啊。如果您是一位老人，这个C
PyTorch torch.no_grad() 指南（笔记）拉拉拉拉拉拉拉马 pytorch 人工智能 python 笔记深度学习
PyTorchtorch.no_grad()权威在PyTorch深度学习框架中，高效的显存管理对于训练复杂模型和执行大规模推理任务至关重要。显存不足（OutOfMemory,OOM）错误是开发者经常面临的挑战之一。torch.no_grad()作为PyTorch提供的一个核心工具，能够在推理（inference）和验证（validation）阶段显著优化显存使用并提升计算速度。本报告旨在全面、深入
【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？
目录1.核心功能对比2.使用场景对比3.区别与联系4.典型代码示例(1)模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算7.最佳实践8.总结以下是PyTorch中model.eval()、withtorch.no_grad()和.d
量子计算与AI融合的技术突破与实践路径
量子计算与人工智能的融合正开启一个全新的技术纪元，这种"量智融合"不是简单的技术叠加，而是多领域、多学科的横向连接，通过协同创新实现非线性增长。本文将深入探讨这一领域的最新进展、技术实现路径以及行业应用案例。电子-光子-量子一体化芯片：硬件基础突破2025年7月，美国波士顿大学、加州大学伯克利分校和西北大学团队联合开发出全球首个电子-光子-量子一体化芯片系统。这一突破性成果发表在《自然·电子学》杂
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
2024年，想要靠做软件测试获得高薪，还有机会吗？朱公子的Note 软件测试
2024年，科技行业风云变幻，随着自动化技术和人工智能的发展，软件测试领域的竞争愈发激烈。很多人会问，现在还投身软件测试，真的能拿到高薪吗？尤其是当越来越多的自动化工具涌现，手动测试员会不会被淘汰？时间过得真快，一眨眼，2024年已经过去了一大半。最近正值金九银十招聘季，后台不免又出现了这几个同学们关心的问题：2024年还能转行软件测试吗？零基础转行可行吗？那么，2024年，软件测试行业的高薪岗位
2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

【异构知识蒸馏：IVIF】

Heterogeneous Knowledge Distillation for Simultaneous Infrared-Visible Image Fusion and Super-Resolution

介绍

贡献

相关工作

Infrared and Visible Images Fusion

Joint Implementation of Image Fusion and Super-Resolution

Teacher–Student Network

方法

Teacher Network

Feature Extraction Module（学生网络）

Feature Fusion Strategy and Super-Resolution Network

Loss Function

Training Strategy

你可能感兴趣的:(图像融合,人工智能,深度学习)