Slientsake

[深度学习论文笔记]Modality-aware Mutual Learning for Multi-modal Medical Image Segmentation

Modality-aware Mutual Learning for Multi-modal Medical Image Segmentation
多模态医学图像分割中的模态感知互学习

Published: Jul 2021
MICCAI 2021
论文：https://arxiv.org/abs/2107.09842
代码：https://github.com/YaoZhang93/MAML

摘要：
肝癌是全世界最常见的癌症之一。由于肝脏肿瘤的纹理变化不明显，对比增强计算机断层扫描（CT）成像对肝癌的诊断是有效的。在这篇文章中，作者致力于通过整合多模态CT图像来改进肝脏肿瘤的自动分割。为此，作者提出了一种新的相互学习（ML）策略，用于有效且鲁棒的多模式肝脏肿瘤分割。与现有多模态方法不同的是，多模态方法通过单个模型融合来自不同模态的信息，使用ML，模态特定模型的集合协作学习，并相互教导，以提取不同模态的高级表示之间的特征和共性。该方法不仅具有多模式学习的优势，而且可以通过将知识从现有模式转移到缺失模式来处理缺失模式。此外，作者还提出了一个模态感知（MA）模块，其中模态特定的模型通过注意权重进行互连和校准，以实现自适应信息交换。所提出的模态感知互学习（MAML）方法在大规模临床数据集上的肝脏肿瘤分割中取得了良好的效果。此外，作者还展示了MAML处理肝肿瘤和公共脑肿瘤（BRATS 2018）数据集缺失模式的有效性和稳健性。

问题动机：
肝癌是世界上最常见的癌症之一。CT图像是最初评估肝癌最常用的成像方式。从CT图像中准确测量肝脏肿瘤的状态，包括肿瘤的体积、形状和位置，可协助医生进行肝细胞癌评估和手术计划。然而，肝脏肿瘤在CT容积上的一部分纹理不明显，因此，即使是有经验的放射科医生也很容易忽略。在临床实践中，放射科医生通常通过注射方案增强CT图像，以清晰地观察肝脏肿瘤。当造影剂在血管内通过肝脏时，在肝组织和异常（包括肝肿瘤）之间产生良好的对比。双通道方案中使用的对比增强CT成像包括静脉期和动脉期，并伴有静脉对比延迟。双时相图像具有良好的互补性，有助于更好地诊断肝脏肿瘤。
近年来，深度学习极大地推进了计算机辅助诊断（CAD）领域，尤其是医学图像分割。全卷积神经网络（FCN）超越了手工特征的限制，并通过编码器-解码器架构显著提高了肝脏肿瘤分割的性能。在多模态分割中应用模糊神经网络存在两个主要问题。一个是如何有效地整合来自多模态医学图像的信息。另一个问题是如何处理实践中常见的缺少模式的情况。（提出问题）
多模态信息融合被应用于不同的目的，例如：大脑分割、诊断和三维牙齿重建，也扩展到了CT图像。大多数方法将单模态方法扩展到多流模型，其中每个流用于特定模态。由不同流提取的特定于模态的特征在后续模块中进行融合。值得注意的是，输入的多模态图像应在输入模型之前进行注册。基于编解码结构，多模态特征融合策略可分为四类。第一种是早期融合策略，在输入端集成多模态图像，并沿单一网络联合处理。其次，中间融合策略不是在网络输入端合并两个阶段，而是在相应的编码器中独立处理不同的模式，这些模式共享相同的解码器，用于特征融合和最终分割。第三，后期融合方式使每个相位通过编码器-解码器网络的独立流，并且在每个流的末尾融合学习的特征。最后，一个终极方案引入了编码器-解码器网络之间和内部的超连接，以实现不同模式之间更有效的信息交换。然而，在这些方法中，每个模态的特征被直接组合，因此，不同模态的不同贡献被忽略。（问题）

提出的处理缺失模态的策略包括通过生成模型合成缺失模态或学习模态不变特征空间。然而，合成缺失的模态需要大量的计算，现有的模态不变方法通常在大多数模态缺失时失败。最近的KD-Net通过知识提炼将多模态网络中的知识从单模态网络中转移出来。然而，KD-Net依赖于一个学生模型和一个额外的教师模型来完成对学生模型的单向知识传递，这带来了额外的计算成本，限制了多模态表示。

思路来源：
所以，在本文中，作者提出了一种新的模态感知相互学习（MAML）方法，用于有效和鲁棒的多模态肝脏肿瘤分割。具体而言，作者构建了一组特定于模态的模型来处理多模态数据，其中每个模型用于一种模态。为了在不同的模式之间实现更有效和可解释的信息交换，作者仔细设计了一个模式感知（MA）模块，以可学习的方式自适应地聚合特定于模型的特征。对于每个模型，MA模块生成权重映射，逐像素对特征进行赋值，然后通过加权聚合对特征进行合并，以实现有效的多模态分割。此外，作者设计了一种新的相互学习（ML）策略，ML支持交互式知识转移，以提高模型的泛化能力，避免使用多余的教师模型。使用ML，特定于模态的模型协同解决任务。
作者通过模态内和联合损失训练模型来实现这一点：前者鼓励每个模型学习有区别的模态特定特征，而后者鼓励每个模型相互学习，以保持高层特征之间的共性，以便更好地融合多模态信息。为了充分利用深度学习方法的能力，作者收集了一个具有654个CT体积的大规模临床数据集来评估所提出的方法。实验结果表明，所提出的MAML比其他先进的多模态方法有显著的优势。此外，在临床数据集和public BRATS 2018数据集上，作者展示了MAML在只有一种模式可用的极端情况下处理缺失模式的有效性和鲁棒性。

小结：
MAML采用一组特定于模式的模型，协同自适应地合并动脉和静脉相图像，以实现精确的肝脏肿瘤分割。在这种情况下，它包括两个模态特定模型，用于学习每个模态中的特定特征，以及一个MA模块，用自适于应地探索两个模态之间的相关特征。方法可以很容易地扩展到更多的模式。

特定模态模型：
模态特定模型是用于单模态分割的常见FCN。由于UNet在医学图像分割中已被证明是成功的，MAML采用了功能强大的nnUNet模型，这是一种先进的类似UNet的医学图像分割框架，用于从原始CT图像中提取特征。双相CT体积的输入分别经过每个模型，并从最后一层获得特定相位的高层语义嵌入。值得注意的是，高级语义嵌入共享输入图像的相同形状。不同模态特定模型的输出表示为Fi∈ R^(C×D×H×W)，其中C=32是通道数，D，H，W是深度、高度和宽度。

如图1所示，作者提出了通过注意机制的MA模块，以自适应地测量每个阶段的贡献。注意模型广泛用于各种任务，包括语义分割。已经提出了几种注意机制来增强网络的代表性。在这个研究中，作者探索了跨模态注意机制，以选择性地突出嵌入单个模态中的目标特征，从而获得更具辨别力的用于肝脏肿瘤分割的双模态特征。
模态特定模型的输出沿通道连接在一起，通过后续卷积层生成Fdual。虽然Fdual对肝脏肿瘤的动脉和静脉信息进行编码，但在进行肝脏肿瘤分割时不可避免地会引入来自每种模式的冗余噪声。作者建议通过注意机制自适应地测量每个阶段的贡献并对其进行视觉解释，而不是从Fdual获得直接的分割。

图1.框架示意图。输入的多模态CT图像首先由不同模态的特定FCN嵌入。然后，模态感知模块回归注意力图，该注意力图反映了如何实现模态特定特征的有效且可解释的融合。该框架通过内部和连接损失组成的相互学习策略进行训练。

相互学习策略：
模态特定模型集的学习被描述为一个关于背景真实度掩模的体素二值分类误差最小化问题。作者仔细设计了用于多模式肝脏肿瘤分割的ML策略。具体地说，每一个特定于情态的模型作为教师和学生相互作用。因此，静脉模型不仅从静脉期提取肿瘤分割的线索，而且从动脉模型学习，反之亦然。为了实现这一点，作者引入了相位内损耗和联合损耗。前者鼓励每个流学习区分阶段的特定特征，而后者鼓励每个流相互学习，以保持高层特征之间的共性，以便更好地融合多模态信息。
ML的优点在于：
(1）该模型能够在不作任何修改的情况下处理多模态分割和缺失模态，在临床实践中是适用和有效的
(2）单个模态的每个模型都可以通过学习其他模型隐式地利用双模态信息，从而在缺少其他模态的情况下获得更好的分割结果
(3）结合每个模态的特点和共性，所有特定于模型的模型的协作可以更好地进行多模态分割。

实验与结果：
数据集和评估指标：
对中国人民解放军总医院获得的增强CT容积进行了对比实验。我们获得654个动脉期和静脉期增强CT容积。所有CT体积均使用西门子扫描仪获取。CT体积的平面大小为512×512，间距为0.56～0.91mm，切片数为67～198，间距为1.5mm。三名经验丰富的肝胆外科临床医生参与了验证，他们在解释CT图像方面具有丰富的经验。为了有效地结合多模式图像，作者利用一种配准方法来获得不同相位图像之间的空间关系。对于数据预处理，截断初始HU值0.5%-99.5%范围内的原始强度值，并对每个原始CT病例进行归一化，使其具有零均值和单位方差。
BraTS 2018数据集包含285名患者的MR扫描，采用四种模式：T1、T2、T1对比增强（T1ce）和Flair。该数据集的目标是分割脑肿瘤的三个子区域：整个肿瘤（WT）、肿瘤核心（TC）和增强肿瘤（ET）。用于定量评估分割的度量包括dice相似系数（Dice）和平均对称表面距离（ASSD）。
实施细节：该框架是在Nvidia Tesla V100 GPU上使用Pytork构建的。网络由Adam优化器进行训练，初始学习率为0.0003。由于GPU内存的限制，每个卷在送入网络之前被分割成大小为128×128×128的补丁。该网络的训练时间为600个epoch，约150小时。由于作者只打算评估网络设计的有效性，因此未采用进一步的后处理策略。

多模态建模的有效性：
为了证明MAML的有效性，作者在临床数据集上分别对MA和ML进行了消融研究，其中五分之一的图像用于测试，其余用于训练。基线是特定于模态模型的输出的直接平均值，表示为“MS+Ensemble”。然后作者应用MA自适应地聚合特定形态的模型，表示为“MS+MA”。最后，结合了MA和ML，表示为“MAML”。

表1：多模式肝肿瘤分割结果。最好的结果用粗体突出显示。
如表1所示，MA在Dice和ASSD方面都优于基线。此外，ML还以显著的优势进一步提高了性能。实验结果证明了MAML在多模式肝脏肿瘤分割中的有效性。然后将MAML与nnUNet和OctopusNet进行比较。前者将两个相位的拼接作为输入，而后者分别对每个相位进行编码并由一个解码器生成分割。表1的结果显示了MAML的出色性能。

可解释性的融合：
MA不仅提供了不同模式的有效融合，而且是一种可解释的模式。作者通过定性地可视化学习到的注意力图来说明可解释性。从图2(左)可以看出，静脉注意图集中在肿瘤边缘，动脉注意图集中在机体。此外，在一定数量的肿瘤表面及邻近肝脏处，常被勾勒出假性包膜。图2(右)静脉注意图聚焦于伪包膜及肿瘤内部出血部分。结果表明，该方法能够获取医学影像的知识，实现可解释的多模式肝肿瘤分割。

图2：Modality-Aware Module生成的注意图能够捕捉到肿瘤的增强部分(左)、出血部分和伪包膜(右)。

处理缺失的方式：
ML策略的一个优点是能够处理多模态分割中缺失的模态。作者考虑一种极端的情况，即只有一种方式可用。在临床数据集上，无论是动脉期还是静脉期的CT图像都可以用于推断程序。将nnUNet (MAML中模式特异性模型的对应物)设置为baseline，并仅在动脉或静脉阶段对其进行训练。
从表2中可以看出，MAML显著优于基线。此外，MAML的动脉和静脉相之间的表现差距明显小于nnUNet，这表明ML在不同模式之间传递知识的出色能力。

表2：肝肿瘤分割模式缺失处理结果。最好的结果用粗体突出显示

作者还比较了MAML和专门处理缺失模式的方法。仅使用T1ce模式作为输入，对公共BRATS 2018数据集进行了3次交叉验证。KD-Net、U-HVED和HeMIS的Dice结果直接取自论文。从表3中，、观察到作者的方法优于其他三种先进的方法，证明了MAML处理缺失模式的有效性。拟议的框架在目前执行中的局限性在于，它允许以一整套方式或仅以一种方式作为投入。作者希望在今后的工作中对任意数量的缺失模式进行改进。

表3：脑肿瘤分割缺失模式处理结果。HeMIS、U-HVED和KD-Net的结果由论文导出，其中不提供HeMIS和U-HVED结果的标准偏差。使用dice进行评估。

总结：
在本研究中，作者提出了MAML，使有效和稳健的多模态分割。ML实现了模态特定模型的集成，协同学习互补信息。MA以一种自适应和可解释的方式进行更好的多模式肝脏肿瘤分割。结果表明，MAML可以显著提高多模态切分的性能，有效地处理缺失模式，在临床应用中具有重要价值。

【剪裁Patch】已标注的WSI剪裁Patch的处理流程（以QuPath软件得到的标注信息为例） X CODE WSI 病理图像 QuPath Python
1.整体处理思路整体处理流程如图所示，概括来说就是：根据标注信息将WSI区分为肿瘤区域和正常区域，对这个区域进行采样裁剪得到具有Patch级别标签的Patch。当然，这里的Patch标签是根据标注信息决定的，如果标注的是癌症亚型信息，那么也可以将不同亚型的Patch区分出来。那么下面就对每个步骤进行介绍以及提供具体的Python代码。2.详细步骤（提供代码）2.0标注文件示例以下是用QuPath软
【网络安全】网络基础第一阶段——第三节：网络协议基础---- VLAN、Trunk与三层交换技术
目录一、交换机1.1交换机定义1.1.1交换机1.2工作原理1.2.1数据帧的转发1.2.2交换机处理数据帧的三种行为1.2.3交换机通信二、虚拟局域网（VLAN）2.1虚拟局域网简介2.1.1为什么需要VLAN2.1.2广播域的分割与VLAN的必要性2.1.3VLAN使用场景2.2VLAN机制详解2.2.1实现VLAN的机制2.2.2直观描述VLAN2.2.3需要VLAN间通信时应该怎么办2.3
Kotlin协程：Flow的融合、Channel容量、溢出策略
一.协程间的通信当需要进行协程间的通信时，可以调用Channel方法，创建一个Channel接口指向的对象，通过调用该对象的send方法和receive方法实现消息的发送与接收。协程对Channel接口的实现，本质上与阻塞队列类似，这里不再赘述。1.通道容量事实上，send方法与receive方法并没有定义在Channel接口中，而是分别定义在SendChannel接口和ReceiveChanne
python之数据库操作婵婵子~ python 数据库 python
python操作sqlserver数据库python标准数据库接口为pythonDB-API，具体可参考：https://wiki.python.org/moin/DatabaseInterfacesPython的DB-API，为大多数的数据库实现了接口，使用它连接各数据库后，就可以用相同的方式操作各数据库。PythonDB-API使用流程：引入API模块。获取与数据库的连接。执行SQL语句和存储
【FR801xH】富芮坤FR801xH之SPI读写W25Q64 沧海一笑-dj 物联网专栏 FR801xH 富芮坤富芮坤SPI W25Q64 ssp_send_data ssp_recv_data
00.目录文章目录00.目录01.FR801xH概述02.FR801xH功能框图03.SPI相关类型3.1ssp_frame_type_t3.2ssp_ms_mode_t3.3ssp_cs_ctrl_op_t3.4ssp_int_type_t3.5ssp_int_status_t04.SPI相关API4.1ssp_init_4.2ssp_send_then_recv4.3ssp_send_data
YOLOv11 改进策略 | GFPN：超越 BiFPN，跳层与跨尺度连接重塑特征金字塔
YOLOv11改进策略|GFPN：超越BiFPN，跳层与跨尺度连接重塑特征金字塔！介绍颈部网络（Neck）在目标检测任务中扮演着至关重要的角色，它负责有效地融合来自骨干网络（Backbone）不同层级的特征图，为检测头部（Head）提供包含丰富语义和空间信息的多尺度特征。FPN、PANet和BiFPN等结构是特征金字塔融合的代表。BiFPN作为其中的佼佼者，通过双向连接和加权融合取得了优异的性能。
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
《剑指迷宫：破解矩阵路径之谜》一只咸鱼大王故事版本数据结构与算法 C++数据结构算法递归回溯
故事标题：《剑与路之书——矩阵迷宫的路径密钥》引子：迷宫之城的秘密在遥远的算法大陆，有一座神秘的城市——“迷宫之城”。在这座城市的中心，矗立着一座名为“命运之塔”的古老建筑。传说中，这里藏着一本神秘的典籍——《剑指天书》，书中记载着无数关于矩阵、路径和逻辑推理的奥秘。在这片土地上，有一种被称为“矩阵迷宫”的古老魔法阵。它由一个个字符格子组成，每一步只能向上下左右移动一格。而最神奇的是，如果一条路径
Latex beamer 常用操作记录
最近组会要讲论文，试着用latex做下slide，感觉效果不错。在此，记录一些可能会比较常用的一些操作。以后学到了新的操作，再继续更新。用的是这个主题，感觉比较简洁：https://www.overleaf.com/latex/templates/artrabeamer/cvtmgdbwvdmr放置图片图片感觉有好多参数，因为这次汇报比较水，所以只用了scale这个缩放参数凑合，以后再补上一些常用
LaTex 写演示文稿 - Beamer 入门之彩色文本框 joefsong LaTeX 学习笔记 latex
Beamer入门之彩色文本框创建彩色文本框tcolorbox宏包使用技巧及文本框简元素介绍更改彩色文本框外观样式预定义样式标题字体字号标题颜色位置字体位置标题框位置正文边框边框形状方法一：边框变直角方法二：标题框下移边框颜色边框外观附录代码及拓展：本节内容给大家分享如何绘制彩色表格，大致的效果如下：该节的内容主要包括（链接可跳至B站视频链接）：创建简单彩色文本框更改彩色文本框样式最终效果如下：创建
LaTex 写演示文稿 - Beamer 入门之彩色表格 joefsong LaTeX 学习笔记 latex
Beamer入门之彩色表格背景颜色单元格插入斜线更改行、列及单元格颜色更改列的背景颜色更改行的背景颜色定义单元格背景颜色实现合并单元格解决单元格合并后字体显示不全问题解决列表横线覆盖字体问题定义表格字体颜色更改表格线形和颜色本节内容给大家分享如何绘制彩色表格，大致的效果如下：该节的内容主要包括（链接可跳至B站视频链接）：更改表格背景颜色，包括行、列和单元格修改合并单元格后的单元格的颜色表格内字体及
Hadoop之HDFS 只年大数据 Hadoop HDFS hadoop hdfs 大数据
Hadoop之HDFSHDFS的Shell操作启动Hadoop集群（方便后续测试）[atguigu@hadoop102~]$sbin/start-dfs.sh[atguigu@hadoop102~]$sbin/start-yarn.sh-help：输出这个命令参数[atguigu@hadoop102~]$hadoopfs-helprm-ls：显示目录信息[atguigu@hadoop102~]$h
【GitHub开源项目实战】Agent-Zero 多模态 Agent 框架的架构实现与实战落地观熵 GitHub开源项目实战 github 开源架构
开源项目实战解析：Agent-Zero多模态Agent框架的架构实现与实战落地关键词：Agent-Zero、LLMAgent、多模态融合、LangGraph、结构化对话、函数调用、RAG、真实场景实战、开源项目分析摘要：Agent-Zero是一个以LangGraph为核心构建的多模态智能体框架，专注于大语言模型（LLMs）驱动下的多模态Agent系统实现，具备高度模块化、支持结构化对话状态流转、工
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
JSP汽车网站yzp17--（程序+源码+数据库+调试部署+开发环境） CK3042 java 汽车开发语言 oracle 数据库服务器大数据
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、项目背景随着互联网的飞速发展和人民生活水平的日益提高，汽车已成为许多家庭的重要交通工具。为了更好地满足消费者对汽车信息的需求，提升购车体验，我们计划开发一个功能全面、信息丰富的汽车网站。该项目旨在为用户提供便捷的汽车资讯查询、车型对比、购车指南以及售后服务等功能，打造
Grab×亚矩云手机：重构东南亚数字出行的“超级接口“
——从"多国拼图"到"云端一体"，破解区域化与规模化的终极矛盾在东南亚这个由11个国家、6亿人口、上千种语言文化组成的碎片化市场，Grab作为超级App的代表，长期面临"本地化深不下去"与"规模化扩不出来"的双重困境：在印尼需适配300余种方言，在新加坡需满足金融管理局对支付数据的严格隔离要求，在越南需应对摩托车与汽车混行的复杂路况。亚矩云手机的介入，通过"硬件虚拟化+场景智能"的融合创新，不仅让
Vue3高级-第二十六篇：Vue3 与 WebGL 的融合探索程序员勇哥前端全套教程 vue.js 前端 javascript 开发语言前端框架
Vue3高级-第二十六篇：Vue3与WebGL的融合探索1.WebGL基础与Vue3集成准备深入了解WebGL的概念、功能与应用场景概念：WebGL（WebGraphicsLibrary）是一种用于在网页上进行2D和3D图形渲染的JavaScriptAPI。它基于OpenGLES2.0规范，允许开发者在浏览器环境中直接操作图形硬件，无需安装额外插件。WebGL通过在浏览器中创建一个绘图上下文，利用
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
超详细yolov8/11-segment实例分割全流程概述：配置环境、数据标注、训练、验证/预测、onnx部署(c++/python)详解
因为yolo的检测/分割/姿态/旋转/分类模型的环境配置、训练、推理预测等命令非常类似，这里不再详细叙述，主要参考**【YOLOv8/11-detect目标检测全流程教程】**，下面有相关链接，这里主要针对数据标注、格式转换、模型部署等不同细节部分；【YOLOv8/11-detect目标检测全流程教程】超详细yolo8/11-detect目标检测全流程概述：配置环境、数据标注、训练、验证/预测、o
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
PHP接单涨薪系列（十）之智能BI系统：PHP+AI数据决策平台（2025高溢价秘籍）攻城狮凌霄 PHP接单涨薪 AI PHP php 人工智能开发语言
案例场景某零售集团采用本方案后，决策效率提升300%，库存周转率优化40%，单季度利润增长¥2,800万。本文将彻底解密如何用PHP+AI打造高价值商业智能系统，让你成为企业数字化转型的核心供应商！一、智能BI：企业决策的新引擎1.1传统报表vs智能BI数据源传统报表智能BI静态图表历史数据人工分析交互式探索预测分析自动决策2025年BI系统价值对比：指标传统报表智能BI系统提升幅度数据准备时间3
YOLOv11深度解析：Ultralytics新一代目标检测架构创新与实战指南芯作者 D2:YOLO YOLO 神经网络计算机视觉
2024年Ultralytics重磅推出YOLOv11**：在精度与速度的平衡木上再进一步，参数减少22%，推理速度提升2%，多任务支持全面升级！一、YOLOv11核心创新：轻量化与注意力机制的完美融合YOLOv11并非颠覆性重构，而是通过模块级优化实现“少参数、高精度、快推理”的目标。其三大创新点如下：1.1C3k2模块：动态卷积核的灵活设计取代YOLOv8的C2f模块，C3k2通过参数c3k动
CentOS7之Dify部署 weifacai docker
CentOS安装时IP4设置成手动，DNS设置为8.8.8.8,8.8.4.4宝塔安装地址：宝塔面板下载，免费全能的服务器运维软件1.CentOS安装DockerDockerCE支持64位版本CentOS7，并且要求内核版本不低于3.10，CentOS7满足最低内核的要求，所以我们在CentOS7安装Docker。1.1.卸载（可选）如果之前安装过旧版本的Docker，可以使用下面命令卸载：yum
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
国内中小制造业“内卷”困局六大问题：盟接之桥的六大建议盟接之桥制造人工智能大数据服务器运维数据可视化
近年来，中国制造业正面临前所未有的“内卷”压力。企业不仅要应对不断压缩的利润空间，还需在复杂的供应链、生产流程和客户需求之间艰难平衡。本文基于多位制造业老板的实际反馈，梳理当前行业的主要痛点，并结合“盟接之桥”的专业建议，提出切实可行的破局路径。一、当前制造业面临的六大核心问题账期压力加剧现金流紧张大客户普遍要求3个月账期，甚至6个月银行承兑汇票结算。导致企业资金链长期处于高压状态，尤其对中小型企
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

[深度学习论文笔记]Modality-aware Mutual Learning for Multi-modal Medical Image Segmentation

你可能感兴趣的:(深度学习之医学图像分割论文,多模态融合,深度学习,人工智能,医学图像分割,肿瘤分割)