Jorko的浪漫宇宙

MICCAI 2022 | mmFormer:Multimodal Medical Transformer for Incomplete Multimodal Learning of BTS

Multimodal Medical Transformer for Incomplete Multimodal Learning of Brain Tumor Segmentation

摘要

从磁共振成像（MRI）中准确地分割脑肿瘤是多模态图像的联合学习所需要的。

然而，在临床实践中，并不总是能够获得一套完整的MRI，缺失模态的问题导致现有多模态分割方法的性能严重下降。

在这项工作中，我们首次尝试利用Transformer进行多模态脑肿瘤分割，该方法对可用模态的任何组合子集都具有鲁棒性。具体而言，我们提出了一种用于不完全多模态学习的新型多模态医学Transformer（mmFormer）。

它具有三个主要组件：

the hybrid modality-specific encoders（混合模态专用编码器），它桥接卷积编码器和模态内Transformer，用于在每个模态内进行局部和全局上下文建模；

an inter-modal Transformer（模态间的Transformer），用于构建和对齐模态间的长程相关性，以获得具有对应于肿瘤区域的全局语义的模态不变特征；

Decoder（解码器），其执行渐进上采样并与模态不变特征融合以生成鲁棒分割。此外，在编码器和解码器中引入了辅助正则化器，以进一步增强模型对不完整模态的鲁棒性。我们在用于脑肿瘤分割的公共BraTS 2018数据集上进行了广泛的实验。结果表明，所提出的mmFormer在几乎所有不完整模态子集上都优于最先进的不完整多模态脑肿瘤分割方法，尤其是在只有一种可用模态的情况下，Dice对肿瘤分割的平均改善率为19.07%。

1. Introduction

1.1 不同模态的重要性：

脑肿瘤在MRI中主要有四个模态 T1-weighted (T1), contrast-enhanced T1-weighted (T1c), T2-weighted (T2), and Fluid Attenuated Inversion Recovery (FLAIR) images。每种成像模式都提供了大脑结构和病理的鲜明对比。多模态图像的联合学习对于脑肿瘤分割至关重要，可以显著提高分割性能。已经广泛探索了许多方法来有效地融合多模态MRI用于脑肿瘤分割，例如，通过将通道维度的多模态图像拼接为输入或融合潜在空间中的特征。

1.2 存在的实际问题：

然而，在临床实践中，由于数据损坏、各种扫描协议和患者的不合适条件，并不总是能够获得一套完整的MRI。在这种情况下，大多数现有的多模态方法可能无法处理不完整的成像模态，并面临分割性能的严重退化。因此，对于具有一个或多个缺失模态的灵活和实际的临床应用，强烈需要鲁棒的多模态方法。

1.3 应对方法：

不完全多模态学习，也称为异模态学习旨在设计对任何可用模态子集都具有鲁棒性的方法。

1.脑肿瘤分割的不完全多模态学习的一种直接策略是通过生成模型合成缺失的模态。

2.另一系列方法探索了从完整模式到不完整模式的知识蒸馏。尽管获得了令人满意的结果，但此类方法必须为缺失模态的每个子集训练和部署特定的模型，这在临床应用中是复杂和繁重的。Zhang等人提出了一种具有自适应融合的单模态模型集成学习，以实现多模态分割。然而，它仅在一种或所有模式可用时才起作用。同时，所有这些方法都需要在训练过程中采用完整的模式。

最近的方法侧重于学习统一的模型，而不是一堆提取的网络，用于不完全多模态分割。例如，HeMIS通过计算任意数量的可用模态的特征的均值和方差来学习多模态信息的嵌入。U-HVED进一步引入了多模态变分自动编码器，以利于生成缺失模态的不完全多模态分割。最近的方法还提出了利用特征分离和注意力机制进行鲁棒的多模态脑肿瘤分割。全卷积网络（FCN）在医学图像分割中取得了巨大成功，并广泛用于上述方法中的特征提取。

尽管FCN具有优异的性能，但卷积的归纳偏差（即局部性）使得FCN难以显式地构建长距离依赖关系。在脑肿瘤分割的不完全多模态学习中，当处理不同的模式时，用有限的感受野提取的特征往往会有偏差。

相比之下，具有跨不同模态的肿瘤区域的全局语义信息的模态不变量嵌入可能有助于更稳健的分割，尤其是当一个或多个模态缺失时更为明显。

Transformer最初被提出用于对序列到序列任务的长期依赖性进行建模，并在各种计算机视觉任务上显示出最先进的性能。很多一致的工作从骨干网络的角度利用Transformer进行脑肿瘤分割。然而，用于脑肿瘤分割的多模态建模的专用Transformer尚未被仔细开发，更不用说不完整的多模态分割了。

本文旨在利用Transformer为脑肿瘤分割的不完全多模态学习建立统一模型。我们提出了多模态医学变换器（mmFormer），它利用混合模态特定编码器和模态相关编码器来构建不同模态内和跨不同模态的长程依赖性。通过显式构建和对齐不同模态之间的全局相关性来提取模态不变表示，所提出的mmFormer显示出优于脑肿瘤分割的不完全多模态学习的鲁棒性。

同时，在mmFormer中引入了辅助正则化器，以鼓励编码器和解码器学习辨别特征，即使缺少一定数量的模态。

2 方法

在本文中，我们提出了用于脑肿瘤分割的不完全多模态学习的mmFormer。我们采用编码器-解码器架构来构建mmFormer，包括用于每个模态的混合模态特定编码器、模态相关编码器和卷积解码器。此外，在编码器和解码器中都引入了辅助正则化器。

mmFormer的概述如图1所示。我们在下面详细介绍了每个组件的细节。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-98Nm5lCZ-1671247939503)(C:\Users\qiaoqiang\AppData\Roaming\marktext\images\2022-11-28-19-23-50-image.png)]

2.1 混合模态特定编码器

混合模态特定编码器旨在通过桥接卷积编码器和模态内Transformer来提取特定模态内的局部和全局上下文信息。我们用M＝{FLAIR，T1c，T1，T2}表示完整的模态集合。

给定Xm的输入∈ R 1×D×H×W，尺寸为D×H x W，m∈ M、我们首先利用卷积编码器生成具有局部上下文的紧凑特征图，然后利用模态内Transformer对全局空间中的长程相关性进行建模。

卷积编码器。 卷积编码器通过堆叠卷积块来构建，类似于U-Net的编码器部分。卷积编码器Fconvm产生的具有每个模态内的局部上下文的特征图可以公式化为

其中 F local m ∈R C× D/2的(l-1)次方× H/2的(l-1)次方× W/2的(l-1)次方，C是通道维，并且l是编码器的阶段的数量。具体的说，构建了一个五级编码器，每个块由两个卷积块组成，每个块包含级联的group normalization、Re 和卷积核大小为3的卷积层，但第一阶段的第一个卷积块仅包含卷积层。

在两个连续块之间，采用步长为2的卷积层对特征图进行下采样。编码器每级的滤波器数量分别为16、32、64、128和256。

模态内Transformer 受限于卷积网络的固有局部性，卷积编码器无法有效地在每个模态内建立长距离依赖性。因此，我们利用模态内Transformer进行显式远程上下文建模。模态内Transformer包含一个标记器、一个多头自我关注（MSA）和一个前馈网络（FFN）。

当Transformer以序列到序列的方式处理嵌入时，卷积编码器产生的局部特征图F local m首先被展平成1D序列，并通过线性投影转换成token空间。

然而，平坦化操作不可避免地破坏了空间信息，这对于图像分割至关重要。为了解决这个问题，我们引入了一个可学习的位置嵌入Pm，以通过逐元素求和来补充平坦的特征，其公式化为

MSA通过查看特征图中的所有可能位置来构建每个模态内的关系

FFN是具有GELU激活的两层感知器。模态内Transformer生成的每个模态内具有全局上下文的特征图定义为

2.2 模态相关编码器

模态相关编码器设计用于为具有与肿瘤区域相对应的全局语义的模态不变特征构建跨模态的长程相关性。它被实现为一个模态间Transformer。

模态间Transformer。与模态内Transformer不同，模态间Transformer通过级联将来自所有模态特定编码器的嵌入合并为输入模态令牌，其定义为

其中δm∈ ｛0，1｝是一个伯努利指标，其目的是在构建不同模态之间的长期依赖关系时，即使某些模态缺失，也能增强鲁棒性。通过将δm设置为0，在训练期间随机进行这种模态级丢失。如果缺少模态，则缺少模态的多模态令牌将由零向量保持。随后，MSD和FFN对其进行处理，以获得跨模态的模态不变特征，其公式如下

2.3 卷积解码器

卷积解码器被设计为将空间分辨率从高级潜在空间逐步恢复到原始mask空间。模态相关变换器的输出序列F global被重塑为与平坦化之前的大小相对应的特征图。卷积解码器具有卷积编码器的对称架构，类似于U-Net。此外，还增加了编码器和解码器之间的跳过连接，以保持更多的低级别细节，从而实现更好的分割。来自特定级别上不同模态的卷积编码器的特征被级联并作为跳过特征转发到卷积解码器。

2.4 辅助正则化器

传统的多模态学习模型倾向于根据辨别模式识别脑肿瘤。当缺少辨别模式时，此类模型可能面临严重退化。因此，即使没有其他模式的辅助，鼓励每个卷积编码器分割脑肿瘤也是至关重要的。为此，卷积编码器的输出由共享权重解码器上采样，以分别从每个模态分割肿瘤。共享权重解码器具有与卷积解码器相同的架构。此外，我们还在卷积解码器中引入辅助正则化器，以迫使解码器即使在缺少某些模态时也生成准确的分割。这是通过在卷积解码器的每个阶段内插特征图来实现的，以通过深度监督来分割肿瘤。

Dice损失被用作正则化器。将网络输出的训练损失与辅助正则化器相结合，总损失函数定义为

其中C是分割类的数量，Nc是类C的体素的数量，如果类标签C是像素i的正确分类，则gci是二进制指示符，pci是相应的预测概率，M＝{FLAIR，T1c，T1，T2}，L是卷积解码器中的级数。

3 实验和结果

数据集和实现。

实验是在BraTS 2018数据集上进行的，该数据集包括285次多对比度MRI扫描，具有四种模式：T1、T1c、T2和FLAIR。

脑肿瘤的不同亚区域被组合成三个嵌套的亚区域：全肿瘤、肿瘤核心和增强肿瘤。组织者已将所有体积共同登记到同一解剖模板上，并将其插值到同一分辨率。采用等式（8）中定义的Dice相似系数（DSC）进行评估。该框架使用PyTorch 1.7 在四个NVIDIA Tesla V100 GPU上实现。

输入大小为128×128×128体素，批量大小为1。随机翻转、裁剪和强度偏移用于数据增强。mmFormer具有106M参数和748G FLOP。使用Adam优化器对网络进行训练，1000个epoch的初始学习率为0.0002。该模型在每个GPU上使用17G内存训练约25小时。

不完全多模式分割的性能。 我们评估了我们的方法对不完全多模态分割的鲁棒性。通过设置δi，i∈ ｛F L A IR，T 1c，T 1，T 2｝为零来实现模态的缺失，用于在推断时丢弃特定模态。我们将我们的方法与使用共享潜在空间的两个代表性模型进行了比较，即HeMIS 和UHVED。为了公平比较，我们使用[21]中的相同数据分割，并直接引用结果。在表1中，我们的方法在所有15种可用模式的可能组合上的增强肿瘤和肿瘤核心的分割以及15种模式中的12种模式的整个肿瘤的分割方面显著优于HeMIS和U-HVED。在表2中，我们表明，随着缺失模式的数量增加，mmFormer获得的平均改善更为显著。同时，观察到当目标更难分割时，mmFormer获得了更多的改进。这些结果证明了mmFormer对脑肿瘤分割的不完全多模态学习的有效性。图2显示，即使有一种模式可用，mmFormer也可以实现脑肿瘤的正确分割。

我们还将mmFormer与ACN进行了比较。ACN依赖于不完全多模态脑肿瘤分割的知识提取。如果总共有N种模态，ACN必须训练 $x^4 -1$ 次蒸馏 $x^N -1$ 个学生模型用于所有缺失模式的情况，而我们的mmFormer仅通过统一模型学习一次。具体而言，ACN在1名教师和14名学生模型中使用144M参数训练672小时，而mmFormer仅需要25小时，使用106M参数。然而，mmFormer增强肿瘤、肿瘤核心和整个肿瘤的平均DSC（分别为59.85、72.97和82.94）仍然接近ACN（分别为61.21、77.62和85.92）。

完整多模式分割的性能。 我们将我们的方法与最近的基于Transformer的方法（即TransBTS）进行了比较，以实现具有全模态的多模态脑肿瘤分割。我们使用官方存储库复制结果。TransBTS在增强肿瘤、肿瘤核心和整个肿瘤方面分别获得72.66%、72.69%和79.99%的DSC。我们的mmFormer在脑肿瘤的所有分区上都优于TransBTS，DSC分别为77.61%、85.78%和89.64%，证明了mmFormer即使在完整的多模式脑肿瘤分割中的有效性。

消融研究。 我们研究了模态内Transformer、模态间Transformer和辅助正则化器作为我们方法中三个关键组件的有效性。我们通过从mmFormer中排除其中一个组件来分析每个组件的有效性。在表3中，我们将三种变体的性能与具有DSC的mmFormer进行了比较，对15种可能的输入模态组合进行了平均。它表明，模态内变换器、模态间变换器和辅助正则化器在所有肿瘤子区域带来了性能改进。

4 结论

我们提出了一种基于Transformer的脑肿瘤分割不完全多模态学习方法。所提出的mmFormer桥接Transformer和CNN，以在MRI图像的不同模态内和不同模态之间建立长期依赖关系，从而实现模态不变表示。我们在各种缺失模式的组合下验证了我们的脑肿瘤分割方法，并在BraTS基准上优于最先进的方法。当缺少更多模态和/或目标模态更难分割时，我们的方法获得了更多的改进。
ansformer和CNN，以在MRI图像的不同模态内和不同模态之间建立长期依赖关系，从而实现模态不变表示。我们在各种缺失模式的组合下验证了我们的脑肿瘤分割方法，并在BraTS基准上优于最先进的方法。当缺少更多模态和/或目标模态更难分割时，我们的方法获得了更多的改进。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring