小郭同学要努力

【多层交叉transformer：高光谱和多光谱图像融合】

MCT-Net: Multi-hierarchical cross transformer for hyperspectral and multispectral image fusion

（MCT-Net：用于高光谱和多光谱图像融合的多层交叉transformer）

考虑到光学成像的局限性，图像采集设备通常在空间信息和光谱信息之间进行折衷。高光谱图像（HSI）具有丰富的光谱信息，能够对成像目标进行精细的识别和分类;多光谱图像（MSI）具有丰富的空间信息，能够提供精细的几何特征。因此，融合HSI和MSI以实现信息互补已成为一种普遍的方式，这增加了所获得信息的可靠性和准确性。然而，与传统的光学多聚焦图像融合和MSI全色锐化不同，现有的HSI和MSI融合方法在实现跨模态信息交互和缺乏空间位置信息的有效利用方面存在问题。为解决上述问题，实现高光谱与多光谱图像更有效的信息融合，提出了一种新的多层次交叉变换算法（MCT-Net）。提出的MCT-Net由两个组件组成：(1)多层次跨模态交互模块（MCIM），其首先提取HSI和MSI的深层多尺度特征，然后应用多层次交叉变换（MCT）在相同尺度上进行它们之间的跨模态信息交互，以重构MSI所缺失的光谱信息和HSI所缺失的空间信息；(2)特征聚合重构模块（FARM），其组合来自MCIM的特征，使用条带卷积进一步恢复边缘特征，并通过级联上采样重构融合结果。

介绍

高光谱图像（HSIs）广泛用于描述材料的光谱差异，因为其具有从可见光波长到近红外波长的数百个连续窄光谱带。鉴于其准确表示对象属性信息的能力，HSI在诸如图像分类、对象检测、频带选择和变化检测等任务中发挥重要作用。与HSI相比，多光谱图像（MSI）具有高空间分辨率和低光谱分辨率。由于成像平台的限制，采集设备通常需要在光谱分辨率和空间分辨率之间进行折衷设计。遥感平台可以捕获具有低空间分辨率和高光谱分辨率（LR-HSI）的HSI或具有高空间分辨率和低光谱分辨率（HR-MSI）的MSI，但是难以捕获具有高空间分辨率（HR-HSI）的HSI。因此，利用空间和光谱信息融合的方法获得高分辨率的遥感影像越来越受到人们的关注。现有的MSI和HSI融合方法基本上包括传统方法和基于深度学习的方法。早期将LR-MSI和全色（PAN）图像进行融合，以提高图像的光谱和空间分辨率，称为全色锐化图像融合算法。随后，随着高光谱成像技术的发展，全色锐化图像融合技术逐渐扩展到HSI和MSI融合领域。Chen等人总结并提出了一个由两部分组成的全色锐化框架。该算法的关键是将HSI光谱划分为若干区域，然后将每个区域的MSI和HSI进行融合，得到融合图像。Selva等人提出了一种超锐化方法，利用线性回归将每个HSI波段的高分辨率图像作为MSI波段图像的线性组合，并成功地将基于多分辨率分析（MRA）的全色锐化方法应用于HSI和MSI融合。结果表明，利用合成的高分辨率波段进行超锐化可以获得更好的融合效果。当MSI谱带数目较少时，基于全色锐化的方法通常表现出较好的性能。然而，缺少MS波段的光谱区域通常具有较低的PSNR值，因为这些光谱波段通常与对应的高分辨率图像具有低相关性。如果单纯地将全色锐化算法应用于HSI和MSI的融合，很难得到满意的结果。
另一种融合HSI和MSI的流行方法称为基于子空间的融合方法。该方法基于子空间中两幅输入图像的光谱信息融合，为以后的融合方法提供了启示。近年来，光谱分解已被用于多传感器多分辨率图像融合。基于非混合的融合方法的思想是在相关传感器属性（如点扩展函数（PSF）和光谱响应函数（SRF））的约束下，分别从HSI和MSI获得端元信息和高分辨率丰度矩阵。Veganzones等人证明了由于融合过程中潜在的稀疏回归问题是一个严重的不适定问题，因此解混方法可以减少可能的映射，达到提高融合结果质量的目的。Wei等人提出了一种基于贝叶斯的多波段融合技术。该方法是一种基于子空间的方法。由于子空间系数的估计精度随子带数目的增加而提高，因此基于子空间的方法比超锐化方法更适合于HSI和MSI融合。但这些方法过于依赖人工设计的融合规则，缺乏通用性，因此不能通过空间和光谱模态有效传递信息。
基于深度学习的方法由于其强大的特征提取能力，在HSI和MSI融合中显示出巨大的潜力。该方法主要利用多层深度神经网络学习HR-MSI、LR-HSI与对应的HR-HSI之间的对应关系，完成融合任务。通常认为，基于深度学习的融合方法不仅利用输入图像的信息，而且利用学习到的对应关系作为先验知识来重建MSI和HSI中缺失的光谱和空间信息。因此，与传统的基于人工定义先验信息的融合方法相比，基于深度学习的融合方法能够获得更好的性能。近年来，随着卷积神经网络的发展，出现了许多基于卷积神经网络的融合方法。Yang等人提出了一种将CNN和空间注意力相结合的HSI和MSI融合方法。空间注意在提取微小纹理和增强空间结构方面能发挥更好的作用。Cai等人介绍了两种特定的结构设计，超分辨率模块和渐进学习，这使得网络能够连续捕获不同尺度的空间细节，并将其连续注入到上采样的多光谱图像中。虽然现有的基于神经网络的融合算法通过卷积核学习局部线性映射来提高泛化能力，但它们缺乏对空间位置信息的有效利用，无法提取图像中的长程依赖性，从而导致缺乏一些全局上下文信息。受transformer在自然语言处理领域的成功启发，一些学者最近提出了视觉transformer（ViT）并将其应用于融合任务。Zhu等人融合了多模态MRI数据的深度语义信息和边缘信息进行脑肿瘤分割，设计了基于swin变换的语义分割模块，并在swin变换中引入了移位面片标记化策略，使得在小规模数据集上训练更加容易。Vibashan等人提出了一种图像融合变换器（IFT），其将局部信息与全局信息相结合以提高融合性能。Cai等人提出了一种用于超光谱图像重建的掩模引导光谱式变换器。他们开发了一种光谱式多头自注意（S-MSA）来捕捉光谱之间的相似性和依赖性。ViT方法在建立长距离依赖模型方面表现良好，其自注意机制能够有效地关注全局上下文信息，有助于进一步提高融合性能。然而，现有的基于变换的HSI和MSI融合方法大多使用单一模态的特征提取和融合最后阶段的特征拼接。该方法忽略了空间模态和光谱模态之间的跨模态信息交互，不利于融合任务的完成。
基于上述研究，提出了一种新的多层次交叉变换算法（MCT-Net）用于高光谱图像和多光谱图像融合。MCT-Net由两大部分组成，包括多层次跨模态交互模块（MCIM）和特征聚合重构模块（FARM）。由于不同尺度的特征在重建图像上承载着各自的功能，低层次的细节特征映射反映了丰富的空间信息，而高层次的语义特征映射反映了具体的位置信息。由于遥感图像具有较大的尺度空间，充分利用其层次信息显得尤为重要。因此，在MCIM阶段，我们采用双分支结构来充分提取HR-MSI和LR-HSI的层次特征。首先对双支输入图像进行上采样和下采样操作以实现多尺度信息提取。对于相同尺度的特征地图，提出了一种多层次交叉变换（MCT）来获取两幅图像的全局上下文信息，实现光谱信息和空间信息的充分融合。在FARM阶段，联合收割机MCT的输出特征图和输入特征图，利用条带卷积块恢复空间细节特征，并通过级联上采样操作逐步重建HRHSI。

贡献

1）提出了一种新的HSI和MSI融合网络结构MCT-NET。MCT-NET将CNN和transformer与多层次跨模态交互模块（MCIM）和特征聚合重构模块（FARM）相结合，实现融合图像的空间-光谱信息保留。
2）提出了一种多层次交叉transformer（MCT），在传统transformer的自注意机制中加入了交叉注意思想，不仅解决了融合过程中空间信息的长程依赖性，而且实现了空间模态和谱模态的跨模态信息融合。
3）在编码器端采用条带卷积块来细化边缘特征，这对空间重构至关重要。条带卷积块使用四个条带卷积从四个不同方向捕获长程上下文信息：水平、垂直、左对角线和右对角线。

方法

提出MCT-Net的总体架构如图1所示。MCT-Net由多层次跨模态交互模块（MCIM）和特征聚合重构模块（FARM）两大部分组成。在MCIM中，分别通过线性插值和卷积运算对LR-HSI和HR-MSI分别进行上采样和下采样，以提取体现在低级细节特征中的空间信息和体现在高级语义特征中的语义信息。MCT用于全局特征提取和相同尺度特征地图的信息交互与融合。在FARM中，设计了一种多层次特征融合策略。这里，将提取的不同尺度的特征组合在一起，在重复叠加上采样层和条带卷积操作之后，逐步重构HR-HSI。

Multi-hierarchical cross-modality interacting module

LR-HSI和HR-MSI具有不同的性质。由于LR-HSI具有较高的光谱分辨率，因此具有更丰富的光谱信息。HR-MSI由于其较高的空间分辨率而具有更丰富的空间细节。同时，遥感图像与自然图像相比，具有更大的尺度范围。为了充分提取HSI的频谱信息和MSI的空间信息，首先采用双分支结构对HR-MSI和LR-HSI进行上采样和下采样，从不同尺度和不同模态进行特征提取。对于输入图像HR_MSI ∈ R^H×W×c，LR_HSI ∈ R^h×w×C，首先对LR_HSI进行×4上采样（双线性上采样），得到与HR_MSI具有相同空间分辨率的LR₀ ∈ R^H×W×C。由于transformer的计算复杂度在序列长度上是二次的，因此直接将输入图像平坦化为序列以输入到transformer是不切实际的。为了解决这个问题，ViT提出将图像分割成固定大小的面片，然后将每个面片重新整形为一个序列，这可以满足transformer的计算要求。本文采用3 × 3卷积（步长为2）进行下采样，并进行两次卷积运算，每次下采样4次，逐步获得输入图像的低分辨率高级特征。例如，对HR_MSI进行降采样，得到与LR_HSI尺度相同的HR₁ ∈ $R^{H/4 × W/4 × C}$ 。然后，对HR₁和LR_HSI进行同样的下采样操作，得到一对相同尺度的特征映射，HR₂ ∈ $R^{H/8 × W/8 ×2C}$ ，LR₂ ∈ $R^{H/8 × W/8 ×2C}$ 。以此类推，我们可以得到n对相同大小的特征图。第n次下采样后的特征映射可以表示为HR_n ∈ $R^{H/4n × W/4n ×nC}$ 和LR_n ∈ $R^{H/4n × W/4n ×nC}$ 。在逐步下采样的过程中，提取出丰富的局部空间信息，然后将HR_n和LR_n输入到MCT中，进一步在全局空间对长距离依赖性进行建模。通过迭代充分提取和融合两种特征图的信息，实现空间模态和光谱模态的跨模态信息融合。

Multi-hierarchical cross transformer

为了实现光谱模态和空间模态之间的跨模态信息融合，并对全局特征表示的整体图像依赖性进行建模，设计了一种多层次交叉transformer（MCT）。MCT的示意图如图2所示。
MCT采用双分支结构，包括线性投影、前馈网络（FFN）、层范数等，值得一提的是，两个分支之间的信息交互是通过多头部融合注意（MHFA）块进行的。首先对LR-HSI和HR-MSI特征映射进行线性映射，然后对特征映射对两个分支的全局依赖性进行建模，利用MHFA实现空间模态和谱模态的跨模态信息融合。FFN包含一个两层的多层感知器，隐层的扩展率为r。在每个块之前应用层规格化（LN），并且在每个块之后应用残余连接。我们可以将多个MCT连接到网络中，以使两个模态之间的信息交换更加充分。最后生成具有丰富光谱信息和空间信息的特征地图。
Image Sequentialization. 假设给定两个局部特征映射Feature1 ∈ R^H×W×C，Feature2 ∈ R^H×W×C。为了减少计算负担并降低Feature1和Feature2中包含的冗余信息的不利影响，应用线性投影来将信道维度从C压缩到d（在本文中，d=64和128）。MCT需要一个序列作为输入。因此，我们对输入特征图执行降维操作以获得两个d×N（N = H×W）序列x₁和x₂。为了对特征图的位置信息进行编码，引入了一种可学习的位置嵌入（PE），并将其分别与特征图x1和x2以直接相加的方式进行融合，然后对特征进行层归一化操作。上述过程可以描述如下：
Multi-head-fusion-attention. 不同分支上的特征映射包含不同的语义信息。为了建立图像在两个特征映射上的整体依赖性模型，实现空间模态和谱模态的跨模态信息融合，引入了多头部融合注意力（MHFA）。所提出的MHFA的体系结构如图3所示。
给定两个特征向量y₁和y₂，MHFA可以表示为：
其中Q表示查询，K表示键，V是值，C表示输入数据的维度。z₁和z₂是MHFA的两个输出特征图。MHFA不同于传统的自我注意机制。MHFA的目标是获得查询Q与关键字K之间的相关性，得到注意图，然后在其他注意图的基础上得到特征值。这种交叉注意机制更有利于两个特征图在融合任务中的信息交互，从而提高融合效果。
Feature Mapping. 在特征映射经过层归一化和前馈网络之后，特征映射的维度不能适应下一个网络结构。因此，我们利用特征映射模块将MHFA的输出序列转换回尺寸为H×W×d的标准3D特征图。然后，通过卷积运算减少特征图的通道数，得到与特征图Feature1和Feature2维数相同的特征图k₁，k₂ ∈ R^H×W×C。最后将两个特征图相加得到特征图Out_Feature，以达到更好的信息融合。上述过程可描述为：
所提出的MCT算法可以概括为算法1。

Feature aggregation reconstruction module

两个具有丰富空间信息和光谱信息的输入经过MCT得到一个充分融合光谱信息和空间信息的输出。此外，我们还在MCT的输入和输出特征之间建立了一个跳连接。空间细节是否准确重构影响重建图像的质量，以及功能是否有效融合利用率的关键是学习多层次特征表示。为此，我们设计了特征聚合重构模块（FARM），将这三个特征映射连接在一起，并通过条带卷积块和级联上采样等操作逐步恢复空间细节信息。
Strip Convolution Blocks. 在条带卷积块中，特征图经历条带卷积操作，之后是上采样和卷积操作。受1D转置卷积的启发，我们在FARM中添加了条带卷积模块。条带卷积块的结构如图4所示。
对于输入特征映射，条带卷积块从四个不同方向捕获长程上下文信息：水平、垂直、左对角线和右对角线。设F ∈ R^H×W×C为输入特征。在条带卷积模块中，F在1 × 1卷积之后输入到四个不同形状的条带卷积路径。四个路径的输出特征映射被连接起来。然后进行上采样和1 × 1卷积运算，得到条带卷积块的最终输出。设w∈ $R^{2k+1}$ 为2k + 1的条带卷积滤波器，D =（Dh，Dw）表示滤波器w的方向，H∈ $R^{H×W×C′}$ 为条带卷积的结果。条带卷积可定义如下：
其中D是带状卷积的方向矢量，对于水平、垂直、左对角和右对角卷积分别为（0，1）、（1，0）、（1，1）和（−1，1）。对于滤波器w，我们设置k = 4，使得每个条带卷积具有9个参数，这与3 × 3卷积滤波器相同。
Cascade Upsampling. 最后，对融合后的图像进行渐进上采样。MCIM中的下采样获得空间细节信息，而FARM中的级联上采样过程将来自下采样层的空间细节信息与来自上采样层的输入信息组合。这一步可以充分利用图像的语义特征，保留每个波段的空间细节，逐步重建HS-HSI结果。因此，我们将第n层融合后的图像Fus_n定义为：

Loss function

本文采用简单常用的均方误差作为损失函数，在不给网络增加太多约束的情况下，取得了较好的收敛效果。重构的HR-HSI Z^ ∈ $R^{H×W×C}$ 通过MSE损失进行优化，表示为L_fus。L_fus公式为

总结

本文提出了一种基于transformer的HSI和MSI融合方法，称为MCT-Net，由两个主要部分组成，包括多层次跨模态交互模块（MCIM）和特征聚合重构模块（FARM）。特别地，MCIM包含多个多层次交叉transformer（MCT）。MCT借鉴了交叉注意的思想，使跨模态信息融合的HSI和MSI，我们希望MCT可以带来一些启示，其他功能融合任务。在MCIM中，我们首先从HR-MSI和LR-HSI中提取多尺度空间局部信息，并使用建议的MCT从相同尺度的特征图中提取全局信息。在FARM中，设计了一种多层次的特征融合策略。在这里,提取不同尺度的特点结合在一起,使用带重建卷积和空间细节信息。最后,HR-HSI逐渐重建通过级联上采样操作。在未来，我们将探索将此方法扩展到其他融合任务，并改进此变换器结构以实现高光谱数据的性能和效率之间的折衷。

探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
文末含资料链接！YOLOv11性能飞跃：深度融合iRMB注意力机制，实战教程助你突破检测极限！博导ai君深度学习教学-附源码 YOLO
文章目录1.介绍：揭秘iRMB——轻量化与高性能的完美融合1.1摘要：洞察iRMB的设计哲学与卓越表现1.2简单描述：深入剖析iRMB的构造与工作原理核心灵感：CNN与Transformer的珠联璧合iRMB的核心结构：短距离与长距离的协同设计理念：实用、统一、有效、高效1.3模块结构：iRMB的内部构造图（概念描述）2.代码解析：逐行揭秘iRMB的魔法2.1`LayerNorm2d`：为2D数据
Teacher Forcing--------一种用于序列生成任务的训练技巧 AI扶我青云志自然语言处理人工智能
好的，我们来详细介绍一下TeacherForcing，这是一种在训练序列生成模型（如循环神经网络RNN、长短期记忆网络LSTM、门控循环单元GRU、以及后来的Transformer）时常用的重要技术。核心概念目标：训练一个模型，使其能够根据给定的输入序列（如前一个词、图像编码、时间步数据等）预测下一个输出元素（如下一个词、下一个音符、下一个时间点的值等）。这在机器翻译、文本摘要、对话生成、语音合成
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
【图像超分】论文复现：密集残差链接Transformer！DRCT的Pytorch源码复现，跑通超分源码，获得指标、模型复杂度、结果可视化，核心模块拆解与源码对应，注释详细！十小大超分辨率重建（理论+实战科研+应用）pytorch 深度学习超分辨率重建图像处理计算机视觉 python transformer
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通DRCT源码，获得与论文一致的PSNR/SSIM、Params、超分可视化结果，修正论文中FLOPs的计
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
Transformer已死？2025年十大替代架构实战评测
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站封面图建议：十大架构3D渲染图环绕碎裂的Transformer图标，背景为动态性能雷达图副标题：实测推理速度/显存占用/长文本能力，附迁移成本决策树一、争议源起：Transformer的时代性局限（2025版）graphLRA[Transformer痛点]-->B[显存黑洞：千亿模型推理需1.6
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
聚焦的伟力：注意力机制与Transformer的创世纪田园Coder 人工智能科普人工智能科普
当LSTM和GRU凭借其精密的门控系统，成功驯服了时间的长河，让神经网络能够跨越数十甚至数百步记住关键信息，并在机器翻译、文本生成等领域大放异彩时，一个看似微小却影响深远的瓶颈逐渐浮出水面，尤其是在序列到序列（Seq2Seq）框架中。在标准的Seq2Seq模型（如用于神经机器翻译）里，编码器（通常是一个RNN如LSTM）需要将整个输入序列（如一个英语句子）的信息压缩成一个固定长度的上下文向量（Co
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
YOLO融合synergisticNet中的模块今天炼丹了吗 YOLOv11与自研模型专栏 YOLO
YOLOv11v10v8使用教程：YOLOv11入门到入土使用教程YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总《HyperSINet:ASynergeticInteractionNetworkCombinedWithConvolutionandTransformerforHyperspectralImageClassification》一、模块介绍论文链接：https://ieeex
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Happy-LLM 第二章 Transformer HalukiSan transformer 深度学习人工智能
Transform架构图片来自[Happy-llm](happy-llm/docs/chapter2/第二章Transformer架构.mdatmain·datawhalechina/happy-llm)，若加载不出来，请开梯子注意力机制前馈神经网络每一层的神经元都与上下两层的每一个神经元完全连接数据在其中只向前流动，用于处理静态的数据，进行图像识别或者分类，但是该网络没有记忆能力，数据在它里面没
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

【多层交叉transformer：高光谱和多光谱图像融合】

MCT-Net: Multi-hierarchical cross transformer for hyperspectral and multispectral image fusion

介绍

贡献

相关工作

Hyperspectral and multispectral image fusion

Vision transformer

方法

Multi-hierarchical cross-modality interacting module

Multi-hierarchical cross transformer

Feature aggregation reconstruction module

Loss function

总结

你可能感兴趣的:(遥感图像,图像融合,transformer,深度学习,计算机视觉)