AI科技大本营

何恺明团队推出Mask^X R-CNN，将实例分割扩展到3000类

翻译 | AI科技大本营（ID：rgznai100）

参与 | shawn，刘畅

今年10月，何恺明的论文“Mask R-CNN”摘下ICCV 2017的最佳论文奖（Best Paper Award），如今，何恺明团队在Mask R-CNN的基础上更近一步，推出了（以下称Mask^X R-CNN）。

这篇论文的第一作者是伯克利大学的在读博士生胡戎航（清华大学毕业），标题非常霸气，叫是“Learning to Segment Every Thing”。从标题上可以看出，这是一篇在实例分割问题(instance segmentation)中研究扩展分割物体类别数量的论文。

由于现有的目标实例分割（object instance segmentation）方法要求所有训练实例都必须标记有分割掩码（segmentation mask），使得注释新类别的成本十分昂贵，而且还将实例分割模型限制在约100个详细注释的类别。本论文提出了一种全新的偏监督（partially supervised）训练方式以及一个新的权重传递函数（weight transfer function），用大量的类别（所有类别都标有边界框注释（box annotations），但只有一小部分类别标有掩码注释）训练实例分割模型。

论文作者表示，他们成功使用Visual Genome数据库中的边界框注释以及COCO数据库中80个类别的掩码注释，训练Mask R-CNN检测并分割3000个视觉概念。此外，该论文还首次探究了如何让实例分割模型可以全面地理解视觉世界。

以下是论文简介，enjoy！

介绍

图1. 我们通过偏监督方法来探索如何训练实例分割模型：在训练时，一个类的子集（绿色框）具有实例掩码的注释; 剩余的类（红色框）只有边界框注释。该图显示了我们的模型在Visual Genome数据集上训练了3000个类后的输出，这个过程中仅使用了COCO数据集中80个类别的掩码注释。

目标检测器已经变得非常准确了，并拥有了很重要的新功能。其中最令人兴奋的功能是能够为每个检测到的对象预测前景分割掩码，这个任务我们称之为实例分割。在实际应用中，传统的实例分割系统往往只能对包含约100个对象类别的数据集起作用，而这只是大千世界中的沧海一粟。

造成这种现象的一个主要原因是，现有最领先的实例分割算法都需要强监督学习，而这样的监督学习有很大的限制，并且采集新类别图片的代价也是十分昂贵的。相比之下，带边界框注释的图片则会更丰富和也更便宜。这就引出了一个问题：在不是所有类别都标有完整实例分割注释的前提下，是否有可能训练出高质量的实例分割模型为此，本文介绍了一种新的偏监督实例分割任务，并提出了一种新的迁移学习的方法来完成它。

我们制定的基于偏监督学习的实例分割任务如下：

（1）给定一组感兴趣的类别和一个有实例掩码注释的小的子集，而其他类别只有边界框注释;

（2）实例分割算法可以利用这个数据来拟合一个模型，该模型可以分割所感兴趣的集合中的所有对象类别的实例。由于训练数据是完整注释数据（带掩码的示例）和弱注释数据（仅带框的示例）的混合，因此我们将该任务称为偏监督任务。

本文所提出的偏监督学习样例流程的主要好处是它允许我们通过利用两种类型的现有数据集来构建一个大规模的实例分割模型：那些在大量的类上使用边界框注释的数据集，比如Visual Genome，以及那些在少数类别上使用实例掩码注释的，例如COCO数据集。正如我们接下来将要展示的那样，这使得我们能够将最先进的实例分割方法扩展到数千个类别，这对于在现实世界中部署实例分割是非常重要的。

为了解决偏监督的实例分割问题，我们提出了一种基于Mask R-CNN的新型迁移学习的方法。 Mask R-CNN非常适合我们的任务，因为它将实例分割问题分解为了目标的边界框检测和掩码预测两个子任务。这些子任务是由专门的网络“头部（heads）”共同训练的。我们的方法背后的直觉是，一旦训练完成了，边界框头部（the bounding box head）参数编码嵌入到每个对象类别，使该类别的视觉信息转移到偏监督掩码头部（the partially supervised mask head）参数上。

为了让这个直觉具象化，我们设计了一个参数化的权重传递函数，该函数被训练成根据图片类别的边界框检测参数来预测类别的实例分割参数。权重传递函数可以在Mask R-CNN中使用带有掩码注释的类作为监督学习的数据来进行端到端的训练。在推理时，权重传递函数用于预测每个类别的实例分割参数，从而使模型能够分割所有目标的类别，包括在训练时没有掩码注释的目标类别。

我们在两种不同的设置环境中评估了我们的方法。首先，为了在数据集上建立包含高质量的注释和评估指标的定量的结果，我们使用了COCO数据集来模拟偏监督的实例分割任务。具体地说，我们将COCO数据集所有的类别划分为带有掩码注释的子集和一个只提供给实例分割系统边界框注释的子集。由于COCO数据集仅涉及少量（80类）的语义分离很好的类，因此定量评估的结果是准确可靠的。实验结果表明，我们的方法得到了比该任务基准线高很多的结果，在没有采用训练用的掩码的情况下，掩码的AP相对增幅高达40％。

在第二种设置中，我们使用包含3000个类别的Visual Genome（VG）数据集进行了一次大规模的实例分割模型训练。VG数据集包含大量目标类别的边界框注释，但是由于许多类别在语义上重叠（例如，近义词）并且注释并不详尽，使得模型的精确度和召回率难以衡量。而且，VG数据集不是用实例掩码来标注的。作为替代，我们采用VG数据集来提供大规模实例分割模型的定性输出。我们模型的输出如图1和5所示：

图2.我们提出的Mask^X R-CNN方法的详细说明。Mask^X R-CNN不是直接学习掩码预测参数，而是使用学习权重传递函数T从其对应的检测参数中预测出类别的分割参数。在训练阶段，函数T只需要数据集A中每个类别的掩码数据，它就可以在测试阶段对数据集A∪B（并集）中的所有类进行参数学习。我们还使用了一个互补的全连接的多层感知器（MLP）来增加了掩码头部（mask head）的内容。

学习分割一切物体

假设集合C为一组对象类别（例如‘things’），我们要用这些类别来训练一个实例分割模型。大多数现有方法假设C中所有的训练实例都标有掩码注释。我们放宽了这个要求，只假设C=A∪B，也就是说：集合A中的类别实例都标有掩码注释，集合B中的类别实例只有边界框注释。由于集合B中的类别只带有关于目标任务（实例分割）的弱标签，我们将使用组合强标签（strong labels）和弱标签（weak labels）的类别来训练模型的问题称为偏监督学习问题。

注意：我们可以轻易地将实例的掩码注释转换为边界框注释，因此我们假设A中的类别也带有边界框注释。由于Mask RCNN这样的实例分割模型都带有一个边界框检测器和一个掩码预测器，我们提出的

利用权重传递函数预测掩码

我们的方法建立在Mask R-CNN上，因为Mask R-CNN实例分割模型不仅结构简单，而且可以实现非常优秀的结果。简单来说，我们可以将Mask R-CNN看作为添加有一个掩码预测分支（小型全卷积网络）的Faster R-CNN边界框检测模型。在预测阶段，模型用掩码分支处理每个检测对象，为每个对象预测一个实例级别的前景分割掩码。在训练阶段，并行训练掩码分支和Faster R-CNN中的标准边界框检测器。

在Mask R-CNN中，边界框分支的最后一层以及掩码分支的最后一层均包含对每个类别执行边界框分类和实例掩码预测任务时所用的类别参数。我们选择的方法是：使用一个通用的权重传递函数，根据某一类别的边界框参数预测它的掩码参数，这个函数可以作为模型的组部分与模型一起进行训练；而不是分别学习某一类别的边界框参数和掩码参数。

给定一类别 c，假设为类别c在边界框检测器最后一层上的的目标检测权重，为类别c在mask分支上的mask权重。我们使用一个通用的权重预测函数将参数化，而不是将直接作为参数。

其中θ 为类别不可知的学习参数。

同一传递函数可应用于任何类别c，因此选择的θ值应使可以泛化到训练期间掩码未被观察到的任何类别。我们预计这种泛化是可能实现的，因为检测权重可以被视为基于外观的类别视觉嵌入。

传递函数可以作为一个小型的全卷积神经网络。图2展示了权重传递函数与Mask R-CNN结合形成Mask^X R-CNN的过程。注意：边界框识别器包含两种类型的检测权重：RoI分类权重以及边界框回归权重（regression weights）。

在试验时我们可以使用一种类型的检测权重（即：），

也可以使用两类权重的级联（concatenation）（即：）。

基准：类别不可知的掩码预测

DeepMask证明了：训练深度学习模型执行类别不可知掩码预测任务（不考虑类别而预测目标掩码）是不可能实现的。对于掩码质量稍微损失的Mask R-CNN而言也是这样。在其他试验中，如果类别不可知模型经过训练后可以预测COCO类别中一个类别子集的掩码，那么这些预测值在预测阶段（inference time）就可以泛化到其他60个COCO类别上。依据这些结论，我们用带有一个不可知FCN掩码预测器的Mask R-CNN作为基准。事实证明，这是一个非常优秀的基准。接下来，我们提出了一个可以用于改进该基准和权重传递函数的扩展。

扩展：FCN+MLP 掩码预测器

两种类型的掩码检测器都可用于Mask RCNN：

（1）FCN预测器使用一个全卷积网络预测M × M掩码；

（2）MLP预测器使用一个多层感知器预测掩码，这个多层感知器是由全连接层构成的，类似于DeepMask。在Mask R-CNN中，FCN预测器获得的掩码平均精度（AP）。但是，这两种预测器可以互补。直观看来，MLP 掩码预测器可以更好地捕捉物体的“主要特征”，而FCN 掩码测器可以更好地捕捉物体的细节（例如：物体的边界）。根据这一观察，我们通过将基准类别不可知FCN预测器和权重传递函数（使用的是一个FCN预测器）与类别不可知MLP 掩码预测器作出的预测整合在一起，以此来改进前两者的表现。试验结果表明，这个扩展可以改进基准和权重传递方法。

当对K个类别的class-agnostic 和class-specific 掩码预测进行整合时，这两个预测值都被添加到最终的K×M×M输出中，其中class-agnostic掩码预测值（1×M×M）被分割了K次并添加到每个类别中。然后，K×M×M 掩码预测值经一个sigmoid单元处理后转化为每个类别的掩码概率值，其大小被调整为实际的边界框大小，并作为边界框最终的实例掩码。在训练期间，我们对K×M×M 掩码概率应用了二元交叉熵损失函数。

在COCO数据集上进行试验

(a) Ablation on input to T .

(b) Ablation on the structure of T .

(d) Ablation on the training strategy.

表1. 方法的简化测试。(a,b,c)中的结果基于分阶段训练，我们在(d)中研究了端对端训练的影响。我们还用COCO数据集val2017评估了掩码的AP值，该数据集包含20个PASCAL VOC类别（voc）和60个其他类别（非voc）。用强监督数据集A训练模型得出的结果用灰色字体表示。

图3. 每个点代表我们的方法在COCO数据集随机划分的类别集A和类别集B上的表现。我们类别集A的类别数设定为20至60，然后绘制出类别集B中类别（无掩码注释）的掩码AP对比类别集A中每个类别的掩码注释数的平均值的变化图。

图4.类别不可知基准方法（第一行）与Mask^X R-CNN方法（第二行）的掩码预测对比。绿色方框代表类别集A中的类别，红色方框代表类别B中的类别。左侧两栏为A = {voc}，右侧两栏为A ={ non-voc }。

表2. Mask^X R-CNN的端对端训练。如表1所示，我们用‘cls+box, 2-layer, LeakyReLU’作为Mask^X R-CNN的实现结构，然后添加了MLP 掩码分支(‘transfer+MLP’)，按照相同的评估方案进行评估。我们还报告了AP50 和 AP75（以0.5 和 0.75为IoU临界值分别估计出平均准确度），小型（APS）、中型（APM）的大型（APL）物体的AP（平均准确度）。在ResNet-50-FPN 和 ResNet-101-FPN 基础网络无掩码训练数据的前提下，使用类别集B中的类别进行评估，得出的结论是：我们方法的表现远远优于基准。

表2对比了完整的Mask^X R-CNN的方法。它的表现大幅超越基准方法的表现（掩码平均准确度相对增加了20%多）。除了ResNet-50-FPN，我们还将ResNet-101 FPN作为基础网络进行了试验，如表2下半部分所示。我们在ResNet-50-FPN上发现的趋势也出现在 ResNet-101-FPN上，这表明基础网络并不会影响试验结果。图4给出了类别不可知基准方法和我们的方法的掩码预测示例。

大规模的实例分割

到目前为止，我们已经实验过了一个我们真正目标的模拟版本：即用宽阔的视觉理解来训练大规模的实例分割模型。我们相信这个目标代表了一个激动人心的视觉识别研究的新方向，要完成它，可能需要从偏监督中学习到某种形式。为了实现这一目标，我们使用Visual Genome（VG）数据集的边界框和COCO数据集的实例掩码[22]两种数据，用偏监督任务的学习方式训练了一个大规模的Mask^X R-CNN模型。 VG数据集包含了108077张图像，以及超过7000类的用目标边界框注释（但不包括掩码）的同义词集。

为了训练我们的模型，我们选择了3000个最常见的同义词数据集作为我们的数据集A 和数据集B来实现实例分割的任务，该数据集AB覆盖了COCO数据集中的所有80个类别。由于VG数据集图像与COCO数据集重叠较大，因此在用VG数据集训练时，我们将所有不在COCO val2017数据集中的图像作为训练集，并将其余的VG图像作为验证集。我们将VG数据集中所有与COCO数据集重叠的80个类别作为我们的带掩码的数据集A，VG数据集中其余的2920个类别作为我们的数据集B，因为它们只有边界框的注释。

训练。我们使用阶段式训练策略来训练我们的大规模Mask^X R-CNN模型。

具体来说，我们使用ResNet-101-FPN网络结构作为我们的骨干网络，按照4.1节中所提到的超参数,训练了一个Faster R-CNN模型来检测VG数据集中的3000个类别。然后，在第二阶段，我们用'cls + box，2-layer，LeakyReLU'这几个结构构造了权重传递函数T，接着用函数T和类别未知的MLP掩码预测（即，'transfer + MLP'）组成了掩码头部(the mask head)。训练掩码头部的数据集是用包含80个类别的COCO数据集(数据集A)的子集，这些子集采用了COCO数据集train2017中拆分出来的掩码注释。

定性的结果。掩码AP（平均精确度）很难在VG数据集上进行计算，因为它只包含了目标边界框的注释。因此，我们使用我们的权重传递函数将结果可视化，以了解模型在A和B一起组成的数据集中所有3000个类别上训练完的性能。图5显示了在验证集上一些掩码预测的例子，可以看出，在那些与COCO数据集类别不重叠的VG数据集类别（红框中显示的是数据集B）上，我们的模型预测了比较合理的掩码。

这个可视化的结果显示了我们大规模实例分割模型的几个有趣的特性。首先，它已经学会了检测一些抽象的概念，如阴影和路径。这些往往是难以分割的。其次，能够简单地从VG数据集中获得前3000个同义词，一些概念比“事物(thing)”更像“东西(stuff)”。例如，该模型对孤立的树进行了合理的分割，但当检测到的“树”更像森林时，该模型往往会分割失败。最后，检测器在分割整个物体和部分物体（例如电车的窗户或冰箱的手柄）时做的是比较合理的。与在COCO数据集80个类别上训练的检测器相比，这些结果说明了现在训练的实例分割系统有很好的潜力去识别和分割数千个概念。

图5. Mask^X R-CNN模型在数据集Visual Genome上进行3000个类的掩码预测的示例。绿色框是与COCO（带掩码训练数据的数据集A）重叠的80个类，而红色框是剩余的2920个不在COCO数据集中的类（没有掩模训练数据的数据集B）。可以看出，我们的模型在数据集B中的许多类上生成了一个比较合理的掩码预测。

结论

本文针对大规模实例分割的问题，构造了一个偏监督的学习样例流程。其中只有一部分类在训练时具有实例掩码数据，而其余部分具有边界框注释。我们提出了一种新的迁移学习的方法，其中是用训练好的权重转移函数来预测：如何根据学习的参数来检测每个类别的边界框。在COCO数据集上的实验结果表明，在没有掩码训练数据的情况下，我们的方法大大提高了掩码预测的泛化能力。通过采用该方法，我们在Visual Genome数据集中建立了超过3000个类的大规模实例分割模型。我们得到的结果非常鼓舞人心，这足以说明我们开创了了一个令人兴奋的新的大规模实例分割的研究方向。研究人员还提到了一个非常具有挑战性的问题，在没有监督学习的情况下，如何将实例分割扩展到数千个类别。应该可以有很多方式来改进此方法去解决这样的问题。

论文链接：https://arxiv.org/pdf/1711.10370.pdf

热文精选

深度学习高手该怎样炼成？这位拿下阿里天池大赛冠军的中科院博士为你规划了一份专业成长路径

专访图灵奖得主John Hopcroft：中国必须提升本科教育水平，才能在AI领域赶上美国

2017年首份中美数据科学对比报告，Python受欢迎度排名第一，美国数据工作者年薪中位数高达11万美金

重温经典：五言之冠冕5 海滨公园
重温经典：五言之冠冕5重温经典：五言之冠冕55.西北有高楼西北有高楼，上与浮云齐。交疏结绮窗，阿阁三重阶。上有弦歌声，音响一何悲！谁能为此曲，无乃杞梁妻。清商随风发，中曲正徘徊。一弹再三叹，慷慨有余哀。不惜歌者苦，但伤知音稀。愿为双鸿鹄，奋翅起高飞。重温经典：五言之冠冕5【背景】南朝萧统在编选《文选》时，由于这十九首诗歌思想内容和艺术风格都比较接近，在古诗中是一个有独立意义的作品群，于是将失去乐调
C#，List＜T＞与 Vector＜T＞大语言模型掘墓人 c#list 开发语言 vector SIMD
List是C#中最常用的动态数组实现，位于System.Collections.Generic命名空间。Add(T)将对象添加到List的末尾。AddRange(IEnumerable)将指定集合的元素添加到List的末尾。AsReadOnly()返回当前集合的只读ReadOnlyCollection包装器。BinarySearch(Int32,Int32,T,IComparer)使用指定的比较器
唯品会618超级红包官方领取入口，唯品会2023年优惠减免规则攻略一览氧惠佣金真的高
一年一段的618年中大促马上就要开始了，不少小伙伴都非常期待，届时淘宝京东得物唯品会等平台都会推出优惠活动，唯品会是大家喜欢的网购软件之一，今天小编把唯品会618优惠减免规则，以及红包领取方式分享给大家，唯品会红包一天可以领取3次，5月23到5月30日每天可以领取3次，下方入口保存好，记得每天领取红包！️唯品会整体时间线：5月23日-6月21日记住两大核心玩法--【超荭+会场】领荭包时间（边领边用
如何分析用户满意度？这4种常用满意度分析模型，一定要学会 spssau
说到问卷调查，满意度调查算是众多问卷调查类型中应用最广泛的。不论是大小企业，或是政府、机构都可以通过满意度问卷调查了解服务对象的满意程度。比如医院需要了解患者对医护人员服务的满意程度，企业需要了解顾客对自家产品的满意程度及需求，政府需要了解公众的的服务需求等等。本文将介绍4种常用的顾客满意度模型，以及如何使用SPSSAU进行这些模型的建立和分析。1、四分图四分图，又称为四象限图，是一种简单实用的满
Python 并发调试工具（py-spy、GDB、pyperf）解析赛博社畜联盟 python 开发语言
```htmlPython并发调试工具（py-spy、GDB、pyperf）解析Python并发调试工具（py-spy、GDB、pyperf）解析在现代软件开发中，Python以其简洁的语法和强大的库支持，成为了许多开发者首选的语言。然而，随着程序复杂度的增加，尤其是涉及并发编程时，调试和性能优化变得尤为重要。本文将介绍三个常用的Python并发调试工具：py-spy、GDB和pyperf，并深入
Python 依赖管理的新动向：pip、Poetry 和 Conda 谁是未来的标准？
```htmlPython依赖管理的新动向：pip、Poetry和Conda谁是未来的标准？Python依赖管理的新动向：pip、Poetry和Conda谁是未来的标准？在Python生态系统中，依赖管理是一个至关重要的环节。无论是小型脚本还是大型企业级项目，依赖管理的好坏直接影响到项目的开发效率和稳定性。近年来，随着Python社区的快速发展，依赖管理工具也经历了显著的变化。本文将探讨三种主流的
高效能人士的学习法，期待对你有所帮助廖斋笔谈
学习美国物理学费曼(RichardDFeynman)在大学教授物理学时，他总是能够深入浅出地将复杂的专业理论讲得通俗易懂，无论多么抽象、晦涩的概念，都能用非常生活化的例子表达出来，非常风趣幽默。后来，越来越多的人便采用他的这种方法学习，最终形成了人们众所周知的「费曼学习法」。具体步骤「费曼学习法」可以用四个关键词来概括：概念(Concept)、以教代学(Teach)、评价(Review)、简化(S
AI交互的初期魅力与后期维护挑战
AI交互的初期魅力与后期维护挑战引言在当今数字化时代，人工智能（AI）技术正迅速渗透到各个领域，特别是人机交互方面。许多开发者、设计师和用户在初次与AI交互时，往往感受到一种“一时爽”的快感。这种交互方式看似高效、智能，能够快速响应需求，提供即时反馈。然而，随着时间的推移，这种初期魅力往往会转化为高昂的后期维护成本。本文将深入讨论AI交互的这一双面性，重点分析细节沟通不足以及UI设计中AI难以处理
SCP命令传输文件惟余惟余运维
SCP进行文件传输一、基本语法：二、具体用法1.从本地将文件传输到服务器2.从本地将文件夹传输到服务器3.将服务器上的文件传输到本地4.将服务器上的文件夹传输到本地一、基本语法：Linuxscp命令用于Linux之间复制文件和目录。scp概述：scp是securecopy的缩写,scp是linux系统下基于ssh登陆进行安全的远程文件拷贝命令。scp与rcp的区别：scp是加密的，rcp是不加密的
LeetCode 725 分割链表哎呦，帅小伙哦 #LeetCode每日一题 #链表链表 leetcode
模拟，先计算平均每段链表的长度，在计算前面有几段偏长的链表，最后进行分割。/***Definitionforsingly-linkedlist.*structListNode{*intval;*ListNode*next;*ListNode():val(0),next(nullptr){}*ListNode(intx):val(x),next(nullptr){}*ListNode(intx,Li
周末涂鸦植物 POPO_c220
以前就知道菊花，野菊花，黄花，菜花下次装个x苦苣花，黄色或白色，直茎，头状花序，舌状花，一年2年生，菊科。各种叶型，披针形，椭圆形，倒披针型图片发自App图片发自App图片发自App萝卜花，粉紫色，白色，4瓣，卵型，根可以吃图片发自App图片发自App图片发自App图片发自App
【linux安装git+配置gitlab+推送】 hi+ git linux gitlab
【安装】$sudoaptupdate$sudoaptinstallgit$git--version【配置】A：安装Git之后，您需要做的第一件事就是配置您的git用户名和电子邮件地址。Git将您的身份与您所做的每次提交相关联。要设置全局提交名称和电子邮件地址，请运行以下命令：zly@ubuntu:~$gitconfig--globaluser.name"git用户名"zly@ubuntu:~$gi
Linux C语言中的IO--标准IO ぃ未来可期 C c语言 linux
文章目录1.IO概述系统调用和库函数有什么区别？2.标准IO2.1缓冲区/缓存区行缓冲区刷新方法全缓冲区刷新方法2.2文件指针2.3标准IO常用函数fopen()fclose()perror()errnofgetc()fputc()feof()/ferror()判断返回值EOF类型ungetc()将字符放回输入流fgets()fputs()fprintf()/sprintf()/dprintf/s
matlab中数据输出格式符_MATLAB 显示输出数据的三种方式
1.改变数据格式当数据重复再命令行窗口时，整数以整形形式显示，其他值将以默认格式显示。MATLAB的默认格式是精确到小数点后4位。如果一个数太大或太小，那么将会以科学记数法的形式显示。比如：>>x=100.11x=100.1100>>y=1001.1y=1.0011e+03>>z=0.00010011z=1.0011e-041234567891011121314151617改变默认输出格式要用到f
免疫系统也需“食补” 胡军锋
免疫系统就像身体的其他任何部分一样，也需要某些含有能强化其营养素的食物。这些营养素是：维生素A、B6、C、D、E，叶酸，以及锌、铜、硒和铁等矿物质。维生素C在水果和蔬菜中含量丰富，尤其是柑橘类水果和红甜椒。但是维生素C在高温下会分解，因此吃生的或稍微煮熟的富含这种营养素的食物是获取足量维生素C的最佳方法。黄色和橙色的蔬菜和水果，如红薯、杏和胡萝卜，富含维生素A。绿叶蔬菜，如菠菜和西兰花，以及煮熟的
Leetcode 02.04 分割链表 wanglitaozai 链表 leetcode 数据结构 c++
面试题：02.04分割链表给你一个链表的头节点head和一个特定值x，请你对链表进行分隔，使得所有小于x的节点都出现在大于或等于x的节点之前。你不需要保留每个分区中各节点的初始相对位置。示例1：输入：head=[1,4,3,2,5,2],x=3输出：[1,2,2,4,3,5]示例2：输入：head=[2,1],x=2输出：[1,2]提示：链表中节点的数目在范围[0,200]内-100valnext
Java单例模式：饿汉式VS懒汉式
概要单例模式是Java设计模式中最常用的模式之一，确保一个类只有一个实例，并提供一个全局访问点。下面结合您提供的代码，详细讲解饿汉式和懒汉式单例模式的区别与实现。饿汉式单例模式（EagerInitialization）特点类加载时就创建实例（急切初始化）线程安全（由JVM类加载机制保证）简单直接，但可能造成资源浪费（即使不用也会创建实例）代码实现publicclassSingleton{//类加载
雨后江南鸿鹄是只鸟
窗外，早起的鸟儿在唱着歌，远处的山和宝塔如一幅水墨画，就连眼前的黑瓦白墙也让人眼前一亮。风从窗口路过，调皮地吻了下我的脸，我打了个激灵，睡意瞬间没有了。连续几夜的春雨，将天地焕然一新，我站在窗口，任风将我的思绪吹散吹远。时间回到了2012年，我看到两个争吵的人，他们卯足了劲儿，像是进行摔碗比赛，可怜的瓷碗，发出此生最后一声脆响，就变成了无数的小碎片，纷纷躲进了床底，柜子底，也有调皮的，在逃跑时划破
leetcode725 分隔链表斜月&三星 leetecode
给定一个头结点为root的链表,编写一个函数以将链表分隔为k个连续的部分。每部分的长度应该尽可能的相等:任意两部分的长度差距不能超过1，也就是说可能有些部分为null。这k个部分应该按照在链表中出现的顺序进行输出，并且排在前面的部分的长度应该大于或等于后面的长度。返回一个符合上述规则的链表的列表。举例：1->2->3->4,k=5//5结果[[1],[2],[3],[4],null]示例1：输入:
深入解析React Server Components：服务端组件技术革新
深入解析ReactServerComponents：服务端组件技术革新前言React团队提出的ServerComponents（服务端组件）是一项突破性的技术演进，它重新定义了React应用的架构模式。本文将全面剖析这一技术，帮助开发者理解其核心价值和应用场景。什么是ServerComponents？ServerComponents是React的一种新型组件，它们只在服务端执行，具有以下关键特性：
JAVA JVM对象的实现 virtuoso_liu JVM jvm java 开发语言
jvm分配内存给对象的方式1.内存分配的总体流程对象内存分配的主要步骤：类加载检查：确认类已加载、解析和初始化。内存分配：根据对象大小，从堆中划分内存空间。内存初始化：将分配的内存空间初始化为零值（不包括对象头）。设置对象头：填充对象头信息（如哈希码、GC分代年龄、类型指针等）。执行init方法：调用对象的构造函数，初始化成员变量。2.内存分配的具体方式（1）指针碰撞（BumpthePointer
2022-05-06 羊羊得逸
中原焦点团队徐晓霞网络中级28期坚持分享第（332）约练（125）（2022-5-6）不管来访者怎么讲，咨询师要把握大的方向，咨询才不容易跑偏。来访者说的比较多，比较散的时候，咨询师的对咨询脉络的把控很重要，如果单纯跟着来访者，看似贴着，问的比较散，容易跑偏。目标一定清晰，但不要着急去帮忙解决问题，先让来访者把心里情绪宣泄出来，中间可以多次进行目标的确认。
萌贝树母婴TCP/UDP 骗子协议整理概要 qiekesh
一、概要运输层协议为运行在不同主机上的应用进程之间提供了逻辑通信（logiccommunica-tion）功能。运输层是在端系统中而不是在路由器中实现的。在发送端，运输层将从发送应用程序进程接收到的报文转换成运输层分组，称为报文段（segment）。实现的方法（可能）是将应用报文划分为较小的块，并为每块加上一个运输层首部以生成运输层报文段。运输层将报文段传递给网络层，网络层再将其封装成网络层分组（
React Query 优化数据获取与缓存策略大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 vim 编辑器 linux 算法机器学习
引言随着前端应用规模与复杂度的不断提升，如何高效地获取、缓存以及同步服务端数据，成为提升用户体验和系统性能的关键课题。ReactQuery（现更名为TanStackQuery）凭借其轻量、灵活、可扩展的设计，已成为React社区管理服务端状态的事实标准库。本文将深入探讨ReactQuery在数据获取与缓存策略上的原理与实践，结合HTTP缓存理论、分布式系统一致性以及响应式编程等多学科知识，呈现一套
AI实战(三)：AI写的剧本VS姜文风演技指导，有送彩蛋蓝图初音不在家人工智能大数据自然语言处理深度学习
@[TOC]一、前情回顾大家好，这是我用AI打造“爆款短剧引擎”系列的最后一篇文章。在前两篇文章中，我们已经：通过“逆向工程”的方法，创造了一个名为**“多巴胺生成器”**的AI虚拟人格。分析了它生成的第一份作品——《千亿后妈不好惹》的剧本大纲，见识了其背后冷酷而精准的商业逻辑。今天，我们将迎来最终的交付物。我们来看看，当AI把那些冰冷的逻辑，转化为热气腾腾、有具体人物和对话的剧本时，效果究竟如何
前端构建工具 Webpack 5 的优化策略与高级配置码力无边-OEC 前端 webpack web
前端构建工具Webpack5的优化策略与高级配置当你的项目启动需要一分钟，或者每次热更新都像在“编译整个宇宙”时，你可能已经意识到了一个问题：前端构建性能，正成为开发效率的瓶颈。Webpack作为现代前端开发的基石，其配置的优劣直接决定了项目的开发体验和最终产物的质量。奇怪的是，很多开发者满足于脚手架生成的默认配置，却忽略了Webpack5带来的巨大优化潜力。本文将深入Webpack5的核心，带你
React 实现人员列表多选、全选与取消全选功能 JiaLin_Denny react.js 前端人员列表选择人员选择人员多选全选通讯录人员选择
如图要实现的功能要求为：点击选择按钮，页面弹出抽屉的方式显示人员信息。人员信息选中时候，将人员信息显示在人员列表中。人员信息取消选中时候，人员信息不可显示在人员列表中。人员信息全部选中时，表头中的人员姓名前面的checkbox显示为选中状态，并将人员信息显示在人员列表中。人员信息全部取消选中时，表头中的人员姓名前面的checkbox显示为取消选中状态，并将人员信息不显示在人员列表中。点击翻页，加载
ONNX模型使用指南：从零开始掌握跨领域模型部署
ONNX模型使用指南：从零开始掌握跨领域模型部署ONNX模型作为一种开放式的神经网络交换格式，已成为AI模型部署的行业标准。当您获得一个没有使用说明的ONNX模型时，可以通过系统化的分析和部署流程，使其在不同领域发挥作用。本文将详细阐述如何分析模型结构、配置运行环境、准备特定领域输入数据、执行推理并处理结果，同时提供图像分类、自然语言处理、医疗影像分析、金融风控和自动驾驶等领域的具体应用示例，帮助
面对微软AD的安全隐患，宁盾身份域管如何设计安全性宁盾Nington 安全
微软AD域安全漏洞带来的痛点部分企业客户选择宁盾身份域管的重要动因之一，正是微软AD域及WindowsServer长期存在的安全隐患。在微软AD域信创整改项目中，“宁盾如何保障加域计算机终端安全”是被高频问及的关键问题。微软AD域作为企业组织身份验证与权限管理的核心系统，一旦遭受攻击，可能引发全域性安全风险，其典型渗透路径可归纳为以下四类：特权提升攻击：攻击者利用漏洞从普通用户提升到域管理员等特权
微服务网站开发学习路线与RuoYi-Cloud实战指南你喜欢喝可乐吗？ ruoyi-cloud microservices java web 微服务学习运维
微服务网站开发学习路线与RuoYi-Cloud实战指南微服务架构已成为现代网站开发的主流选择，它通过将大型应用拆分为小型自治服务，实现了系统的高内聚、低耦合、独立部署和扩展。掌握微服务开发技能需要系统性学习，从基础概念到技术栈再到实战应用。本文将为您提供从零开始学习微服务的完整路线图，并结合RuoYi-Cloud开源框架进行详细举例，帮助您快速上手微服务网站开发。一、微服务基础概念与架构特点微服务
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

何恺明团队推出Mask^X R-CNN，将实例分割扩展到3000类

你可能感兴趣的:(何恺明团队推出Mask^X R-CNN，将实例分割扩展到3000类)