Jayden yang

CANet: Class-Agnostic Segmentation Networks with Iterative Refinement and Attentive...（论文解读十九）

Title：CANet: Class-Agnostic Segmentation Networks with Iterative Refinement and Attentive Few-Shot Learning

From：CVPR2019

Note data：2019/07/17

Abstract：引入一种CANet，一个类不可知的分割网络，可以对新类进行几次分割，只有少量带注释的图像。

Code ：暂未开源

1 Abstract

2 Introduction

3 Related Work

4 Task Description

5 Method

5.1 Dense Comparison Module

5.2 Iterative Optimization Module

5.3 Attention Mechanism for k-shot Segmentation

5.4 Bounding Box Annotations

6 Experiments

7 Conclusion

1 Abstract

论文提出一种基于新的Senmantic segmentation模型CANet

网络结构：一个双分支密集比较模块，同时引入了注意力机制

创新：考虑到语义分割网络训练模型只局限于既定类别的问题，提出了新的分割思路，提出了CANet模型。

动机：像素分割的数据标记既有成本又有成本，已训练模型只能在一组预定义的类中进行预测。

在本文中，我们介绍了CANet，这是一个类不可知的分割网络，可以对新类进行几次分割，只有少量带注释的图像。网络包括一个双分支密集比较模块，它执行支持图像和查询图像之间的多级特征比较，以及迭代优化模块，迭代地优化预测结果。此外，引入了一种注意机制，以在k-shot学习的设置下有效地融合来自多个支持示例的信息。

2 Introduction

在以往的语义分割任务中使用大量的标注数据进行训练，同时训练模型的泛化能力也很差。在这篇论文中仅仅使用一些带标注的图像对新类进行分割。

先前的一些工作中采用双分支结构设计，包括支持分支和查询分支。支持分支目的从支持数据集中提取信息以指导查询分支中的分段。这篇论文采用相同的双分支设计来解决少数分割问题。

网络包括一个双分支密集比较模块，其中共享特征提取器从查询集和支持集中提取表示进行比较。密集比较模块的设计从图像分类任务的度量学习中获取灵感，其中距离函数评估图像之间的相似性。然而与每个图像具有标签的图像分类不同，图像分割需要具有结构化表示的数据进行预测。很难将度量学习应用于密集预测。

一种解决的方法就是在所有的像素对之间进行比较，然而造成巨大的计算成本。相反，我们目标是从支持图像中获取全局表示进行比较。为了只关注指定的类别，我们使用前景区域上的全局平均池化来过滤不相关的信息。然后将全局特征与查询分支中的每个位置进行比较，这可以看作是度量学习方法的密集形式。在少数设置下，网络应该能够处理在训练期间从未见过的新类。因此，我们的目标是从CNN中挖掘可转移的表示进行比较。

如在特征可视化文献中观察到的，较低层中的特征涉及低级线索，例如边缘和颜色，而较高层中的特征涉及诸如类别的对象级概念。我们专注于可能构成由看不见的类共享的对象部分的中间级功能。例如，如果CNN在类车上训练模型时学习与车轮相关的特征，则这种特征对于新车类（例如卡车和公共汽车）的特征比较也是有用的。我们在CNN中提取多个级别的表示以进行密集比较。
由于同一类别中的外观存在差异，因此来自同一类别的对象可能只共享一些类似的特征。密集特征比较不足以指导整个对象区域的分割。然而，这给出了对象所在位置的重要线索。在半自动分割文献中，弱类注释用于类不可知分割，例如，使用点击或涂鸦注释的交互式分割和具有边界框或极点前体的实例分割。在训练过程中学习定位对象区域的可传递知识。受半自动分割任务的启发，我们希望在将密集比较结果作为先验的情况下逐渐将对象与背景区分开来。我们提出一个迭代
优化模块（IOM），学习迭代地细化预测结果。细化以循环形式执行，密集比较结果和预测掩模被发送到IOM以进行优化，并且输出被反复发送到下一个IOM。经过几次细化迭代后，我们的密集比较模块能够生成细粒度的分割图。在每个IOM内部，我们采用残余连接以在最后的迭代步骤中有效地合并预测的掩模。

用于k-shot分割的先前方法基于1-shot模型。他们使用不可学习的融合方法融合单个1-shot结果，例如平均1-shot预测或中间特征。相反，我们采用注意机制来有效融合来自多个支持示例的信息。
为了进一步减少针对少数镜头分割的标注工作，我们探索了一种新的测试设置：我们的模型使用边界框注释支持集来在查询图像中执行分割。我们对PASCAL VOC 2012数据集和COCO数据集进行了全面的实验，以验证我们网络的有效性。

本文的主要贡献概括如下。

开发了一种新颖的双分支密集比较模块，该模块有效地利用来自CNN的多级特征表示来进行密集的特征比较。
提出迭代优化模块，以迭代方式改进预测结果。迭代细化的能力可以推广到具有少量镜头学习的看不见的类，以生成细粒度图。
采用注意机制有效地融合来自k-shot设置中的多个支持示例的信息，其优于单次结果的不可学习的融合方法。
证明给定的支持集具有弱注释，即边界框，我们的模型仍然可以获得与昂贵的像素级注释支持集的结果相当的性能，这进一步减少了新类别对于少数镜头分割的标记工作量。
PASCAL VOC 2012数据集的实验表明，我们的方法实现了单次分割的IOU得分为55.4％，5次分割得分为57.1％，其显着优于14.6％和13.2的最新结果。

3 Related Work

论文从小样本学习介绍相关的一些工作。few-shot旨在学习可转换的知识，这些知识可以推广到具有稀缺标记的训练数据的新课程。在few-shot中存在许多公式，包括具有记忆的RNN，细粒度模型，网络参数预测和度量学习。基于度量学习的方法在少数few-shot中实现了最先进的性能，并且具有快速和以前馈方式预测的特性。我们的工作与关系网络有很大关系。关系网络元学习深度距离度量以比较图像并计算分类的相似性得分。该网络包括生成图像表示的嵌入模块和比较嵌入并输出相似性得分的关系模块。我们网络中的密集比较模块可以看作是密集形式的关系网络的扩展，以解决分割任务。
few-shot语义分割。完全监督的语义分割是将图像中的每个像素分类为一组预定义类别的任务。另一方面，少数几个语义分段旨在将分割能力推广到任何新类别，只有几个带注释的label。以前关于few-shot语义分割的工作采用了双分支结构。首先采用语义分割的few-shot学习。支持分支直接预测查询分支中最后一层的权重以进行分段。支持分支生成嵌入，该嵌入与查询分支融合为附加特征。我们的网络也遵循双分支设计。但是，与以前两个分支具有不同结构的工作不同，我们网络中的两个分支共享相同的骨干网络。之前方法中的模型侧重于单次拍摄设置，当将1-shot延伸到k-shot时，他们将1-shot独立应用于每个支持示例，并使用不可学习的融合方法融合图像中的各个预测结果级别或功能级别。平均嵌入在由不同支持示例生成的支持分支中。相反，我们通过注意机制采用可学习的方法来有效融合来自多个支持示例的信息。

4 Task Description

假设我们的模型是在C_train数据集上进行训练，我们的目标是使得训练的模型在新的C_test上依然可以进行预测分割，其中只有少数的label可以使用。训练模型后参数固定后，新的数据集无需优化便可以测试新的类。这其中涉及一些K-shot的一些公式。我们将训练和测试与情节范式结合起来，以处理少数几个场景。具体地，给定k-shot学习任务，每个片段通过样本1）支持（训练）集进行采样来构建的。

5 Method

论文提出了一个新的框架来解决小样本语义分割问题。我们首先在1-shot设置中首先说明我们的模型而不失一般性。我们的网络由两个模块组成：

密集比较模块（DCM），DCM在支持示例和查询示例之间执行密集特征比较
迭代优化模块（IOM），IOM执行预测结果的迭代细化

为了概括我们的网络从1-shot到k-shot学习，我们采用了一种注意机制来融合来自不同支持示例的信息。此外，提出了一种新的测试设置，该设置使用带有边界框注释的支持图像进行few-shot分割，随后将对此进行描述。

5.1 Dense Comparison Module

双分支密集比较模块，它将查询图像中的每个位置与支持示例进行密集比较，如图2（b）所示。该模块由两个子模块组成：

提取表示的特征提取器
执行特征比较的比较模块。

特征提取器

特征提取器从CNN收集不同级别的表示以进行特征匹配。我们使用ResNet-50 作为特征提取器的主干。正如之前的few-shot分割工作所做的那样，骨干模型在Imagenet上进行了预训练。较低层中的特征通常涉及低级提示，例如边缘和颜色，而较高层中的特征涉及诸如对象类别的对象级概念。在少数几个场景中，我们的模型应该适应任何看不见的类。因此，我们不能假设在训练期间学习对应于看不见的类别的特征。相反，我们专注于可能构成由看不见的类共享的对象部分的中间级功能。 ResNet中的层基于空间分辨率被划分为4个块，其自然对应于4个不同的表示级别。我们选择block2和block3生成的特征进行特征比较，并在block3之后放弃图层。我们在块2之后的层中使用扩张卷积来维持特征映射的空间分辨率。在block2之后的所有特征映射具有输入图像的1/8的固定大小。块2和块3之后的特征被连接并通过3×3卷积编码为256维。支持分支和查询分支使用相同的特征提取器。我们在训练期间将ResNet中的权重保持固定。
密集的比较

由于支持图像中可能存在多个对象类别和杂乱背景，因此我们希望获取仅与目标类别对应的嵌入以进行比较。在这里，论文使用前景区域上的全局平均池来将特征映射压缩为特征向量。全局图像特征在分割任务中很有用，这可以通过全局平均合并来轻松实现。对前景区域的特征进行平均以过滤掉不相关的区域。在从支持集获得全局特征向量之后，我们将向量与查询分支生成的特征映射中的所有空间位置连接起来。此操作旨在将查询分支中的所有空间位置与来自支持分支的全局特征向量进行比较。然后，级联特征映射通过另一个卷积块与256个3×3卷积滤波器进行比较。

首先将二进制支持掩码双线性地下采样到特征映射的相同空间大小，然后将元素乘法与特征映射一起应用。结果属于背景区域的特征变为零。然后我们采用全局和池并将得到的矢量除以前景区域以获得平均特征向量。我们将向量上采样到查询要素的相同空间大小，并将它们连接起来进行密集比较。

5.2 Iterative Optimization Module

由于在同一类别中存在外观差异，因此密集比较只能匹配对象的一部分，这可能不足以精确地分割图像中的整个对象。我们观察到初始预测是关于物体粗略位置的重要线索。我们提出了迭代优化模块来迭代地优化预测结果。结构如图2（c）所示。

模块的输入是密集比较模块生成的特征映射和上次迭代的预测掩码。直接连接具有预测掩模的特征图作为附加通道导致与特征分布不匹配，因为没有预测的第一前向通过的掩模。相反，我们建议将预测的掩模合并为残留形式：

其中x是密集比较模块的输出特征; y_t-1是来自最后一次迭代步骤的预测掩模，并且M_t是残余块的输出。函数F（·）是特征x和预测掩模y_t-1的串联，接着是两个具有256个滤波器的3×3卷积块。然后我们添加两个具有相同数量的卷积滤波器的残余块。使用Deeplab V3 中提出的Atrous空间金字塔池模块（ASPP）来捕获多尺度信息。传送门！该模块由四个并行分支组成，包括三个3×3卷积，其中的空洞率为6,12,和18 分别和1×1卷积。

1×1卷积在图像级特征上操作，该特征通过全局平均合并来实现。然后将得到的矢量双线上采样到原始空间大小。来自4个分支的输出特征被连接并由另外的1×1卷积与256个滤波器融合。最后，我们使用1×1卷积生成最终的掩码，其中包括背景掩码和前景掩码。我们使用softmax函数来标准化每个位置的得分，从而输出前景和背景的置信度图。然后将置信图馈送到下一个IOM以进行优化。我们的最终结果是通过双线性地将置信度图上采样到查询图像的相同空间大小并根据置信度图对每个位置进行分类来实现。在训练时，为了避免迭代优化模块过度拟合预测的掩模，我们交替使用最后一个时期的预测掩模和空掩模作为IOM的输入。预测的掩模t-1被重置为空掩模，概率为pr 。这可以看作是整个掩模的丢失，是标准丢失的扩展。与先前的迭代细化方法相比，我们的方法将细化方案集成到具有剩余连接的模型中，以便整个模型可以运行以前馈的方式进行端到端的培训。

5.3 Attention Mechanism for k-shot Segmentation

为了有效地合并k-shot设置中的信息，我们使用注意机制来融合由不同支持示例生成的比较结果。具体来说，我们在DCM中添加一个与密集比较卷积平行的注意模块（参见图3）。

注意分支由两个卷积块组成。

第一个有2563×3filters，接着是3×3maxpooling。

第二个有一个3×3卷积，然后是全局平均池。从意图分支中得出的重量为λ。然后，通过softmax函数对来自所有支持示例的权重进行归一化：

最终输出是不同支持样本生成的特征的加权和。

5.4 Bounding Box Annotations

由于我们的密集比较模块的本质是将查询图像中的每个位置与支持示例提供的全局表示进行密集比较，因此我们探索了一种使用边界框的支持集注释的新形式。与逐像素注释相比，边界框注释使用矩形框来表示对象区域，该对象区域通常用于对象检测任务。标记边界框注释比按像素标记便宜得多。我们通过将整个边界框区域视为前景来放松支撑集。我们在此设置下测试我们的模型以评估我们框架的功能。两种测试设置的比较如图4所示。

6 Experiments

实验细节

项目	属性
数据集	PASCAL VOC 2012 / COCO
损失函数	cross-entropy loss
优化器	SGD
学习率	0.0025
mini-batch	4(Pacal) / 8（coco）
实现工具	pytorch

评估指标

我们为分析实验选择了meanIoU评估指标，原因如下：

1）不同类别的测试样本数量不均衡（例如，49只类羊与378名类人）。忽略图像类别可能会导致对具有更多图像的类的偏向结果。此外，我们可以使用meanIoU评估指标观察我们的模型在不同类别中的有效性。

2）由于大多数对象相对于整个图像较小，即使模型无法分割任何对象，背景IoU仍然可能非常高，因此无法反映模型的能力。

3）前景IoU更常用于二进制分割文献（例如，视频分割和交互式分割）。

尽管如此，我们仍然将我们的结果与两项评估指标下的先前工作进

7 Conclusion

我们已经介绍了CANet，这是一种新颖的类不可知的分割网络，具有小样本学习能力。密集比较模块利用CNN中的多个级别的特征来执行密集特征比较，并且迭代优化模块学习迭代地细化预测结果。我们解决k-shot问题的注意机制比不可学习的方法更有效。综合实验表明了我们框架的有效性，并且性能明显优于以前的所有工作。

[论文解读] 多机器人系统动态任务分配综述「已注销」算法
https://www.emerald.com/insight/content/doi/10.1108/IR-04-2020-0073/full/html多机器人/多智能体动态环境任务分配决策动态任务调度策略该文章主要是想对目前stateoftheart多机器人动态任务调度策略做一个全面的评价，注意定语挺多的，里面的方法也较多为近几年的智能调度那些算法。衡量方法主要考虑到了应用场景、限制、目标方程
【每日论文】Forgetting Transformer: Softmax Attention with a Forget Gate WHATEVER_LEO 每日论文 transformer 深度学习人工智能自然语言处理计算机视觉语言模型
下载PDF或查看论文，请点击：LlamaFactory-huggingfacedailypaper-每日论文解读|LlamaFactory|LlamaFactory摘要现代循环序列模型的一个关键组件是遗忘门。虽然Transformer没有显式的循环形式，但我们展示了一种通过以数据依赖的方式降低未归一化注意力分数的自然方法，将遗忘门融入Transformer。我们称这种注意力机制为“遗忘注意力”，并
针对AF调试过程中PD多窗机制是如何打分的爱写BUG的长歌人工智能计算机视觉算法
在AF（自动对焦）调试中，PD多窗机制（PhaseDetectionMulti-Window）是提升相位对焦精度和鲁棒性的关键技术，其核心是通过在画面中划分多个相位检测窗口，分别计算各窗口的相位差（PhaseDifference）并进行综合评分，最终选择最优对焦位置。以下是其打分机制的核心逻辑和调试要点：1.多窗口布局与权重分配窗口划分根据Sensor的PDAF像素分布，将画面划分为多个区域（例如
【氮化镓】GaN HEMTs结温和热阻测试方法北行黄金橘氮化镓器件可靠性学习科学研究科技多尺度模拟
文章《TemperaturerisedetectioninGaNhigh-electron-mobilitytransistorsviagate-drainSchottkyjunctionforward-conductionvoltages》，由XiujuanHuang,ChunshengGuo,QianWen,ShiweiFeng,和YaminZhang撰写，发表在《Microelectroni
深度学习项目十一：mmdetection训练自己的数据集小啊磊_Vv 深度学习和视觉项目实战目标跟踪人工智能计算机视觉 python 深度学习
mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码三：训练dataset数据文件配置configs1.在configs/faster_rcnn/faster-rcnn_r101_fpn_1x_coco.py
MMDetection实用工具详解（上）：日志分析、结果分析、混淆矩阵 MickeyCV 目标检测 python 深度学习 linux 目标检测
实用工具目录一、日志分析使用方法实际案例二、结果分析pkl结果文件生成使用方法实际案例三、混淆矩阵使用方法实际案例遇到的UserWarning解决方案MMDetection官方除了训练和测试脚本，他们还在mmdetection/tools/目录下提供了许多有用的工具。本帖先为大家重点介绍其中三个简单而实用的工具：日志分析、结果分析、混淆矩阵。一、日志分析tools/analysis_tools/a
[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调强化学习曾小健 #LLM大语言模型语言模型人工智能自然语言处理
该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abstract）背景：大型语言模型（LLMs）在多种应用中展现了卓越的推理能力，但需要有效的微调方法来适应下游任务。问题：现有的高效微调方法缺乏一个系统化
了解目标检测：两阶段检测（Two-Stage Detection）、单阶段检测（Single-Stage Detection）和区域建议网络（RPN） fydw_715 深度学习基础目标检测网络目标跟踪
了解目标检测：两阶段检测（Two-StageDetection）、单阶段检测（Single-StageDetection）和区域建议网络（RPN）在目标检测领域，模型架构在很大程度上决定了模型的性能、速度和应用场景。本文将详细探讨两类主要的目标检测方法——两阶段检测（Two-StageDetection）和单阶段检测（Single-StageDetection），以及它们的核心组件之一：区域建议网
网络安全主动防御技术与应用坚持可信信息安全 web安全 php 安全
入侵阻断技术（IntrusionPreventionTechnologies）是指通过检测并阻止网络和系统中的恶意活动，防止攻击者利用系统漏洞或其他手段进行破坏或未经授权访问的技术和方法。这些技术通常结合入侵检测（IntrusionDetection）功能，通过实时监控和响应机制，有效防御各种类型的网络攻击。以下是入侵阻断技术的详细介绍及其应用。一、入侵阻断技术入侵检测和防御系统（IDS/IPS）
MoE-FFD：Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection Sherry Wangs Deepfake Detection 人工智能 pytorch
来源：2024arXiv（submittedTDSC，CCF-A）作者：ChenqiKong1,AnweiLuo2,PeijunBao1,YiYu1,HaoliangLi3,ZengweiZheng4,ShiqiWang3andAlexC.Kot1单位：1新加坡南洋理工大学;2中山大学;3香港城市大学;4浙江大学;Paper：https://arxiv.org/pdf/2404.08452Code
【MATLAB源码-第128期】基于matlab的雷达系统回波信号仿真，输出脉压，MTI,MTD等图像。 Matlab_猿助手调制解调通信原理 MATLAB matlab 开发语言信息与通信
操作环境：MATLAB2022a1、算法描述雷达（RadioDetectionandRanging）是一种使用无线电波来探测和定位物体的系统。它的基本原理是发射无线电波，然后接收这些波从目标物体上反射回来的信号。通过分析这些反射波，雷达能够确定物体的位置、速度、方向和其他特性。历史背景雷达技术起源于20世纪初。最初的发展动机主要是军事上的需求，特别是在第二次世界大战期间，雷达在侦测敌机和舰船上发挥
linux执行ll报异常Segmentation fault 迷路的小犀牛 linux 运维服务器 centos java
linux执行ll报异常Segmentationfault在Linux系统中，当你执行ll命令时出现Segmentationfault异常，表示程序访问了它不允许访问的内存区域，这通常是由于程序的错误、内存损坏或者系统环境问题引起的。ll命令通常是ls-l的别名，它用于列出目录内容并显示详细信息。出现Segmentationfault错误可能的原因有很多，下面是一些常见的排查方法和解决方案：1.检
【Gaussian Model】高斯分布模型 HP-Succinum 机器学习机器学习算法人工智能
目录高斯分布模型用于异常检测（GaussianModelforAnomalyDetection）1.高斯分布简介2.高斯分布模型用于异常检测(1)训练阶段：估计数据分布(2)检测阶段：计算概率判断异常点3.示例代码4.高斯分布异常检测的优缺点优点缺点5.适用场景6.结论高斯分布模型用于异常检测（GaussianModelforAnomalyDetection）在数据分析和机器学习任务中，异常检测（
VoVNet（2019 CVPR）刘若里论文阅读人工智能计算机视觉学习笔记网络
论文标题AnEnergyandGPU-ComputationEfficientBackboneNetworkforReal-TimeObjectDetection论文作者YoungwanLee,Joong-wonHwang,SangrokLee,YuseokBae,JongyoulPark发表日期2019年04月22日GB引用>LeeYoungwan,HwangJoong-won,LeeSangr
【目标检测论文解读复现NO.38】基于改进YOLOv8模型的轻量化板栗果实识别方法人工智能算法研究院中文核心论文解读复现目标检测 YOLO 目标跟踪
前言此前出了目标改进算法专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读最新目标检测算法论文，帮助大家解答疑惑。解读的系列文章，本人已进行创新点代码复现，有需要的朋友可关注私信我。本文仅对论文代码实现，如果原文章的作者觉得不方便，请联系删除，尊重每一位论文作者。一、摘要为实现自然环境下的板栗果实目
征程 6 工具链 BEVPoolV2 算子使用教程 1 - BEVPoolV2 算子详解算法自动驾驶
1.引言当前，地平线征程6工具链已经全面支持了BEVPoolingV2算子，并与mmdetection3d的实现完成了精准对齐。然而，需要注意的是，此算子因其内在的复杂性以及相关使用示例的稀缺，致使部分用户在实际运用过程中遭遇了与预期不符的诸多问题。在这样的背景下，本文首先会对BEVPoolingV2的实现进行全方位、细致入微的剖析讲解，，让复杂的原理变得清晰易懂。随后，还会通过代表性的示例，来进
python segmentation fault是什么意思-A Python Segmentation Fault? weixin_37988176
ThisgeneratesaSegmentationFault:11andIhavenocluewhy.BeforeIgetintoit,here'sthecode:importnumpy.randomasnprndimportheapqimportsyssys.setrecursionlimit(10**6)defrlist(size,limit_low,limit_high):for_inxr
Python解决Segmentation Fault错误代码飞翔网络 linux 运维 Python
在Python编程中，有时候你可能会遇到"SegmentationFault"（分段错误）的错误。这通常是由于程序访问了无效的内存地址或者出现了内存访问冲突导致的。本文将向你介绍一些常见的原因和解决方法，帮助你解决Python中的SegmentationFault错误。缓冲区溢出（BufferOverflow）缓冲区溢出是导致SegmentationFault错误的常见原因之一。当你使用数组或者其
AI视觉觉醒：深度学习如何革新视频标注，释放数据潜力基于深度学习的视频自动标注系统海棠AI实验室 AI理论探索与学术前沿人工智能深度学习音视频
目录引言：被忽视的视频数据金矿传统视频标注的困境：效率、成本与瓶颈深度学习：视频自动标注的破局之道深度学习视频自动标注系统架构系统架构图核心技术解析目标检测（ObjectDetection）行为识别（ActionRecognition）视频分割（VideoSegmentation）代码实践：基于YOLOv5的目标检测视频标注示例挑战与未来展望结语：AI赋能，释放视频数据的无限可能引言：被忽视的视频
[论文阅读]DAMO-YOLO——实时目标检测设计报告一朵小红花HH 知识蒸馏目标检测 YOLO 目标检测目标跟踪论文阅读人工智能
DAMO-YOLODAMO-YOLO:AReportonReal-TimeObjectDetectionDesign实时目标检测设计报告论文网址：DAMO-YOLO简读论文这篇论文介绍了一个名为DAMO-YOLO的新型目标检测方法,相比YOLO系列的其他方法有着更好的性能。该方法的优势来自于几项新技术:使用了MAE-NAS作为骨干网络,可以自动搜索出不同延迟预算下的优化网络结构。MAE-NAS被称
（脑肿瘤分割笔记：五十二）RFNet: Region-aware Fusion Network for Incomplete Multi-modalBrain Tumor Segmentation 不想敲代码的小杨脑肿瘤分割论文笔记计算机视觉人工智能
目录摘要：Introduction方法3.1任务定义3.2模型结构3.3RFM模块概率图学习区域感知多模态融合3.4分割正则化器3.5整体损失函数总结摘要：在现有的脑肿瘤分割方法中，常常会出现缺少某些模态图像的问题，从而导致分割网络的性能下降--遇到的问题在本文中提出了一个区域感知融合网络（RFNet），它能够自适应和有效利用多模态的数据进行组合进行肿瘤分割，考虑到不同模态对不同的脑肿瘤区域的敏感
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-tasks.py 红色的山茶花 YOLO 笔记深度学习
tasks.pyultralytics\nn\tasks.py目录tasks.py1.所需的库和模块2.classBaseModel(nn.Module):3.classDetectionModel(BaseModel):4.classOBBModel(DetectionModel):5.classSegmentationModel(DetectionModel):6.classPoseModel
b s架构网络安全网络安全架构分析黑客Ash web安全架构网络
目录文章目录目录网络安全逻辑架构微分段（Micro-segmentation）防火墙即服务（FirewallasaService，FWaaS）安全网络网关（Securewebgateway）净化域名系统（SanitizedDomainNameSystem，S-DNS）网络安全策略管理（NetworkSecurityPolicyManagement，NSPM）网络防火墙（Networkfirewal
文章精读篇——用于遥感小样本语义分割的可学习Prompt LiXiang like coding吗学习 prompt 人工智能
题目：LearnablePromptforFew-ShotSemanticSegmentationinRemoteSensingDomain会议：CVPR2024Workshop论文：10.48550/arXiv.2404.10307相关竞赛：https://codalab.lisn.upsaclay.fr/competitions/17568年份：2024任务背景小样本语义分割（Few-shot
记一次pytorch训练loss异常的问题 lyyiangang pytorch 人工智能 python
记一次pytorch训练loss异常的问题问题描述使用mmdetection框架训练时，某项loss出现异常大的值，比如1781232349724294.000。这个问题只在多卡训练时才会出现。解决方法在确认target和predction没有问题后，发现是在dataset中的数据处理出现了问题。在dataset中的__getitem__函数中，对数据进行了处理，但是在处理时，将数据转换为了num
Elasticsearch——动态映射 java编程小帅 Elasticsearch elasticsearch 大数据 es java 搜索引擎
目录Dynamicfieldmappingsdatedetection(日期检测)Disablingdatedetection(禁用日期检测)Customizingdetecteddateformats(自定义检测到的日期格式)Numericdetection(数字检测)Dynamictemplates验证动态模板在动态模板映射运行时字段Elasticsearch最重要的功能之一就是它会尽量避开我
串口收发大数据和接收发送不定长数据 ✧˖‹gσσ∂ иιghт›✧ 单片机嵌入式硬件
一.首先是大家想知道的接收发送不定长数据这里我仅仅推荐一种方法，虽然有很多方法STM32HALCubeMX串口IDLE接收空闲中断+DMA_idlelinedetectioninterrupt-CSDN博客但是我还是仅仅推荐我这种：利用HAL库的HAL_UARTEx_ReceiveToIdle_DMA()函数,代码简洁。在HAL里面能用回调函数直接实现功能的就别去自己写逻辑代码配置就是打开串口中断
esp-who配置与编译流程分析 - esp32-s3-eye 生活需要深度 esp32-eye 配置编译
book@100ask:~/esp/esp-who/examples/motion_detection/lcd$idf.pyset-targetesp32s3Adding"set-target"'sdependency"fullclean"tolistofcommandswithdefaultsetofoptions.Executingaction:fullcleanBuilddirectory'
论文解读（全头皮重建方向）：3DCMM FLOWVERSE 3d 3D人头补全
从面部到完整头部：3DCMM的技术原理解析引言在计算机图形学和人体工学领域，3D头部模型的需求日益增加。无论是虚拟化身的创建还是头盔的个性化设计，仅有面部模型往往不足以满足要求，完整的头部几何（包括头皮）才是关键。传统的3D可变形模型（3DMM）多集中于面部重建，头皮区域因数据稀缺和技术限制常被忽略。2022年发表于VRCAI’22的论文《3DCMM:3DComprehensiveMorphabl
【PyTorch项目实战】图像分割 —— U-Net：Semantic segmentation with PyTorch 胖墩会武术深度学习 PyTorch项目实战 python unet pytorch
文章目录一、项目介绍二、项目实战2.1、环境搭建2.1.1、下载源码2.1.2、下载预训练模型2.1.3、下载训练集2.2、环境配置2.3、代码优化+架构优化2.4、模型预测：predict.pyU-Net是一种用于生物医学图像分割的卷积神经网络架构，最初由OlafRonneberger等人于2015年提出。论文：U-Net:ConvolutionalNetworksforBiomedicalIm
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

CANet: Class-Agnostic Segmentation Networks with Iterative Refinement and Attentive...（论文解读十九）

1 Abstract

2 Introduction

3 Related Work

4 Task Description

5 Method

5.1 Dense Comparison Module

5.2 Iterative Optimization Module

5.3 Attention Mechanism for k-shot Segmentation

5.4 Bounding Box Annotations

6 Experiments

7 Conclusion

你可能感兴趣的:(Segmentation,and,Detection,论文解读)