墨理学AI

Personalize Segment Anything Model with One Shot【论文翻译】

论文基础信息如下

https://arxiv.org/pdf/2305.03048.pdf
https://github.com/ZrrSkywalker/Personalize-SAM

Abstract

通过大数据预训练驱动，分段任意模型（Segment Anything Model，SAM）已被证明是一个强大且可提示的框架，革新了分割模型。尽管其具有普遍性，但在没有人力提示的情况下，定制SAM以适应特定的视觉概念仍未得到充分探索，例如自动在不同的图像中分割您的宠物狗。在本文中，我们提出了一种无需训练的个性化方法，称为PerSAM，用于SAM。只给定一张带有参考掩码的单张图像，PerSAM首先通过位置先验定位目标概念，并通过三种技术在其他图像或视频中对其进行分割：目标引导的注意力、目标语义提示和级联后处理。通过这种方式，我们有效地适应了SAM的个人使用，而无需进行任何训练。为了进一步减轻掩码的歧义性，我们提出了一种高效的单次微调变体PerSAM-F。冻结整个SAM，我们引入了两个可学习的权重用于多尺度掩码，仅在10秒内训练2个参数以提高性能。为了证明我们的有效性，我们构建了一个新的分割数据集PerSeg，用于个性化评估，并在具有竞争性能的视频对象分割上测试了我们的方法。此外，我们的方法还可以增强DreamBooth，以个性化稳定扩散用于文本到图像生成，从而消除背景干扰以获得更好的目标外观学习。代码已在 https://github.com/ZrrSkywalker/Personalize-SAM 上发布。

1. Introduction

基于视觉[11, 30, 51, 63]、语言[4, 10, 43, 50]和多模态[21, 31, 41]的基础模型在预训练数据和计算资源的大量可用性的支持下，获得了前所未有的普及。它们展示了在零-shot场景下的非凡泛化能力，并融入了人类反馈的多功能互动性。受大型语言模型的成就启发，Segment Anything（SAM）[27]开发了一个精细的数据引擎，用于收集1100万个图像-掩膜数据，并随后训练了一个强大的分割基础模型，称为SAM。它首先定义了一种新颖的可提示的分割范式，即以手工设计的提示为输入，并返回期望的掩膜。SAM的可接受提示足够通用，包括点、框、掩膜和自由形式的文本，这允许在视觉环境中对任何内容进行分割。

然而，SAM本质上失去了分割特定视觉概念的能力。想象一下，你想从相册中裁剪出你可爱的宠物狗，或者从你卧室的照片中找到丢失的时钟。使用普通的SAM模型既费力又耗时。对于每张图像，你需要在不同的姿势或环境中定位目标对象，然后使用精确的提示激活SAM进行分割。因此，我们提出了一个问题：我们能否个性化SAM以简单高效地自动分割独特的视觉概念？

为此，我们提出了PerSAM，一种对Segment Anything Model（SAM）进行个性化改进的无需训练的方法。如图1所示，我们的方法仅使用一次性数据（即用户提供的图像和粗糙的掩码，用于指定个人概念），就能高效地定制SAM。具体来说，我们首先利用SAM的图像编码器和给定的掩码来编码参考图像中目标对象的嵌入。然后，在新的测试图像上计算目标对象与所有像素之间的特征相似性。在此基础上，我们选择两个点作为正负对，将其编码为提示符令牌，并作为SAM的位置先验进行使用。在处理测试图像的SAM解码器中，我们引入了三种技术来释放其个性化潜力，而无需进行参数调整。

面向目标的注意力。我们通过计算的特征相似度来引导SAM解码器中的每个令牌-图像交叉注意力层。这迫使提示令牌主要集中在前景目标区域上，以实现有效的特征交互。
目标语义提示。为了更好地提供SAM高级目标语义，我们将原始的低级提示令牌与目标对象的嵌入进行融合，为解码器提供更充足的视觉线索，以实现个性化分割。
级联后细化。为了获得更精细的分割结果，我们采用了两步后细化策略。我们利用SAM逐步改进其生成的掩码。这个过程只需要额外100毫秒的时间。

通过上述设计，PerSAM在各种姿势或情境下为独特的主体提供了良好的个性化分割性能，如图2所示。然而，偶尔会出现失败的情况，其中主体由层次结构组成，例如一个帽子放在一只泰迪熊上面，一个机器人玩具的头部，或者一个罐子的顶部。这种模糊性对于PerSAM来说构成了一个挑战，它需要确定适当的掩模尺度作为分割输出，因为从像素级别来看，局部部分和整体形状都可以被SAM视为有效的掩模。

为了减轻这个问题，我们进一步引入了我们方法的微调变体PerSAM-F。我们冻结整个SAM以保留其预训练的知识，并且仅在10秒内微调2个参数。具体而言，我们使SAM能够产生具有不同掩模尺度的多个分割结果。为了自适应地选择不同对象的最佳尺度，我们为每个尺度使用可学习的相对权重，并进行加权求和作为最终的掩模输出。通过这种高效的一次训练，PerSAM-T在分割准确性方面展现出更好的表现，如图2（右侧）所示。与使用prompt tuning [29]或适配器 [19]不同，模糊性问题可以通过有效地加权多尺度掩模来有效地抑制。

此外，我们观察到我们的方法还可以帮助DreamBooth [45]更好地微调Stable Diffusion [44]，用于个性化文本到图像生成，如图3所示。给定一些包含特定视觉概念的图像，例如你的宠物猫，DreamBooth及其其他作品[28]将这些图像转换为一个在词嵌入空间中的标识符[V]，然后利用该标识符来表示句子中的目标对象。然而，该标识符同时包含给定图像中的背景视觉信息，例如楼梯。这不仅会覆盖生成图像中的新背景，还会干扰目标对象的表示学习。因此，我们建议利用我们的PerSAM高效地分割目标对象，并且仅通过少量图像中的前景区域来监督Stable Diffusion，以实现更多样化和更高保真度的合成。

我们将本文的贡献总结如下：

1.个性化分割任务。我们从一个新的角度出发，研究如何以最小的开销将分割基础模型定制为个性化场景，即从通用到私人目的。

SAM的高效适应。我们首次研究了将SAM适应到下游应用中，只通过微调2个参数，并提出了两种轻量级的解决方案：PerSAM和PerSAM-F。
个性化评估。我们标注了一个新的分割数据集PerSeg，其中包含不同背景下的各种类别。我们还在视频对象分割上进行了测试，并取得了有竞争力的结果。 • 更好的稳定扩散个性化。通过在少样本图像中对目标对象进行分割，我们减轻了背景的干扰，提高了DreamBooth的个性化生成效果。

2. Related Work

图像分割。 是计算机视觉中的一项基本任务，它要求对给定图像进行像素级理解。已经探索了多种与分割相关的任务，例如语义分割，它将每个像素分类到预定义的类别集合中；实例分割，专注于识别每个物体实例；全景分割，通过同时分配类别标签和实例标识来结合语义和实例分割任务；以及交互式分割，涉及在分割过程中进行人工干预以进行细化。最近，Segment Anything Model (SAM)设计了一个可提示的分割任务，并在许多图像分布上实现了强大的零样本泛化。同时，SegGPT和SEEM也提出了通用的框架，适用于各种分割场景。在这项研究中，我们引入了一项新任务，称为个性化分割，旨在分割用户提供的任意未见姿势或场景中的对象。我们提出了两种方法，PerSAM和PerSAM-F，以有效地定制SAM进行个性化分割。

基础模型。 具有强大的泛化能力，预训练的基础模型能够适应各种下游任务，并具有良好的性能。在自然语言处理领域，BERT [10, 38]，GPT系列 [4, 39, 42, 43]，和LLaMA [58]展现了出色的上下文学习能力。这些模型可以在新的语言任务中进行迁移，无需训练，仅需在推理过程中提供几个任务特定的提示。类似地，CLIP [41]和ALIGN [21]通过对比损失在大规模图像-文本对上训练，展现了在零样本视觉学习任务中出色的性能。Painter [51]引入了一个视觉模型，通过统一架构和提示来自动完成多样化的视觉任务，无需特定的任务头。CaFo [59]串联不同的基础模型并协作利用它们的预训练知识进行零样本图像分类。SAM [27]提出了第一个用于图像分割的基础模型，它在10亿个掩码上进行了预训练，并在各种输入提示（如点、边界框、掩码和文本）的条件下进行了预训练。从另一个角度来看，我们提出了将基础分割模型（即SAM）个性化为特定视觉概念的方法，这将一个通才转化为只需一次试验的专家。我们的方法还可以协助个性化文本到图像的基础模型，即Stable Diffusion [44]和Imagen [46]，通过将目标对象从背景区域分割出来来提高生成质量。

参数高效的微调。 直接在下游任务上微调整个基础模型可能会消耗大量计算资源和内存，给资源有限的应用带来挑战。为了解决这个问题，最近的研究聚焦于开发参数高效的方法来冻结基础模型的权重，并附加小规模模块进行微调。Prompt Tuning提议在冻结模型的同时使用可学习的软提示来执行特定的下游任务，相比于全模型微调，其在规模和鲁棒领域转移方面能够实现更有竞争力的性能。Low-Rank Adaption (LoRA)则在每个预训练权重同时注入可训练的秩分解矩阵，大幅减少了下游任务所需的可学习参数数量。而Adapters则设计为插入在原始Transformer的层之间，引入轻量级的多层感知机进行微调。LLaMAAdapter则提出了一种零初始化注意力的方法，逐步将新知识融入基础模型，稳定了早期的训练。与现有方法不同，我们采用了一种更高效的适应方法来进行SAM，可以通过无需训练的PerSAM或者仅微调2个参数的PerSAM-F来实现。这有效地避免了在一次性数据上的过拟合，并获得了令人满意的性能。

3. Method

在第3.1节中，我们首先回顾了Segment Anything Model（SAM）[27]，并介绍了个性化分割的任务定义。然后，在第3.2节和第3.3节中，我们分别介绍了我们训练免费的PerSAM和其微调变体PerSAM-F的方法论。最后，在第3.4节中，我们利用我们的方法来帮助DreamBooth [45]更好地个性化Stable Diffusion [44]用于文本到图像生成。

3.1. Preliminary

重新审视Segment Anything。 SAM定义了一个新的可提示的分割任务，其目标是为任何给定的提示返回一个分割蒙版。使用具有模型在环注释的数据引擎，SAM在1100万个图像上通过10亿个蒙版进行了完全的预训练，具有强大的泛化能力。SAM由三个主要组件组成，即提示编码器，图像编码器和轻量级蒙版解码器，分别表示为EncP，EncI和DecM。作为一个可提示的框架，SAM将图像I和一组提示P作为输入，例如前景或背景点，边界框或待精化的粗糙蒙版。SAM首先利用EncI获得输入图像特征，并使用EncP将人工给定的提示编码为c维度的标记，如下所示：

其中FI ∈ Rh×w×c和TP ∈ Rk×c，h，w表示图像特征的分辨率，k表示提示长度。之后，编码的图像和提示被输入到解码器DecM进行基于注意力的特征交互。SAM通过将几个可学习的标记TM作为前缀连接到提示标记之前来构建解码器的输入标记。这些蒙版标记负责生成最终的蒙版输出。我们将解码过程定义为：

其中M表示SAM的零-shot蒙版预测。

个性化分割任务。 尽管SAM可以通用地对用户提出的任何内容进行分割，但它缺乏对特定主体实例的分割能力。为了达到这个目的，我们定义了一个新的个性化分割任务。用户只需要提供一张参考图像，以及一个指示目标视觉概念的掩码。给定的掩码可以是准确的分割，也可以是用户在线绘制的简略草图。我们的目标是定制SAM以在新的图像或视频中对指定的主体进行分割，而无需人工提示。为了对模型进行评估，我们为个性化分割创建了一个新的数据集，名为PerSeg。原始图像来源于主体驱动扩散模型的作品[12, 28, 45]，包含不同姿势或场景的各种视觉概念。在本文中，我们提出了两种高效的解决方案，PerSAM和PerSAM-F，具体如下所示。

3.2. Training-free PerSAM

正负位置先验。 图4展示了我们的无需训练的PerSAM的整体流程。首先，根据用户提供的图像IR和掩码MR，PerSAM使用SAM在新的测试图像I上获取目标对象的位置先验。具体地说，如图5所示，我们将SAM的预训练图像编码器应用于提取I和IR的视觉特征，即

在这段文本中，FI和FR是属于实数集R的变量。h、w、c分别表示高度、宽度和通道数。接下来，我们使用参考掩码MR（属于实数集R的变量）从FR中获取目标视觉概念内像素的特征，并采用平均池化来聚合其全局视觉嵌入TR（属于实数集R的变量），如下所示：

其中◦表示空间乘法。通过目标嵌入TR，我们可以通过计算测试图像特征FI与TR之间的余弦相似度S来获得位置置信度图：

在这之后，为了为测试图像提供SAM的位置先验信息，FI和TR会进行像素智能L2归一化处理。我们从S中选择两个相似度最高和最低的像素坐标，分别记为Ph和Pl。前者表示目标对象最可能处于的前景位置，而后者则相反地表示背景。然后，它们被视为正负点对，并作为提示编码器的输入，表示为

其中，TP ∈ R 2×c 作为SAM解码器的提示标记。以这种方式，SAM倾向于分割正样本点周围的连续区域，同时舍弃测试图像上的负样本点。

目标导向的注意力。 尽管已经使用了正负优先级，但我们进一步提出了对SAM解码器中的交叉注意机制进行更明确的指导，以在前景目标区域内集中特征聚合。如图6所示，方程5中计算得到的相似度图S可以清楚地指示测试图像上目标视觉概念的像素。因此，我们利用S来调节每个令牌到图像交叉注意层中的注意力图。我们将经过Softmax函数的注意力图表示为A ∈ R h×w，并通过以下方式引导其分布：

α表示平衡因子。通过注意偏向，令令牌被迫捕捉与目标主体相关的更多视觉语义，而不是不重要的背景。这有助于在注意力层中实现更有效的特征交互，并以一种无需训练的方式提高PerSAM的最终分割准确率。

目标语义提示。 普通的SAM仅接收携带低级位置信息的提示，例如点或框的坐标。为了融入更多个性化线索，我们提议额外利用目标概念的视觉嵌入TR作为PerSAM的高级语义提示。具体而言，在将其输入到图6所示的每个解码器块之前，我们将目标嵌入与方程式2中的所有输入令牌逐元素相加，表示为

在Repeat操作沿着令牌维度执行。借助简单的令牌合并，PerSAM不仅受到低级位置先验的推动，还通过辅助视觉线索得到高级目标语义的启发。

级联后处理。 通过以上技术，我们从SAM的解码器获得测试图像上的初始分割掩膜，然而，该掩膜可能在背景中包含一些粗糙的边缘和孤立的噪声。为了进一步改进，我们将掩膜迭代地反馈到SAM的解码器进行两步后处理。在第一步中，我们使用初始掩膜和先前的正负位置先验来提示SAM的解码器。然后，在第二步中，我们根据第一步的掩膜计算一个边界框，并额外使用这个框来提示解码器以获得更准确的物体定位。由于我们只需要进行轻量级解码器进行迭代改进而不需要大规模图像编码器，因此后处理效率高，只需要额外100毫秒的时间。

3.3. Fine-tuning of PerSAM-F

遮罩尺度的模糊性。 无需训练的PerSAM可以处理大多数情况，并具有令人满意的分割准确性。然而，一些目标对象包含层次结构，这导致需要分割不同尺度的多个遮罩。如图7所示，位于平台顶部的茶壶由两部分组成：盖子和身体。如果正先验（用绿色星号表示）位于身体上，而负先验（用红色星号表示）没有排除类似颜色的平台，则PerSAM在分割时会产生模糊性。这个问题也在SAM [27]中讨论过，它提出了一个替代方案，可以同时生成三个尺度的多个遮罩，分别对应于一个对象的整体、部分和子部分。然后，用户需要手动从三个遮罩中选择一个，这是有效的，但会耗费额外的人力。相比之下，我们的个性化任务旨在为SAM定制自动对象分割，而无需人工提示。这促使我们开发了一种针对尺度感知个性化的SAM方法，可以通过高效地微调仅有的几个参数来实现。

可学习的比例权重。 为了实现适应性分割，我们引入了一种微调变体PerSAM-F，并采用适当的掩膜比例。与只生成一个掩膜的无需训练的模型不同，PerSAM-F首先参考SAM的解决方案输出三个比例的掩膜，分别表示为M1、M2和M3。此外，我们采用两个可学习的掩膜权重w1和w2，并通过加权求和计算最终的掩膜输出：

w1、w2都被初始化为1/3。为了学习最佳权重，我们对参考图像进行一次性的微调，并将给定的掩码视为真实结果。需要注意的是，我们保留整个SAM模型以保留其预训练的知识，并且只在10秒内微调w1、w2的2个参数。我们不采用任何可学习的提示或适配器模块，以避免对一次性数据进行过拟合。通过这种方式，我们的PerSAM-F可以高效地学习不同视觉概念的最佳掩码比例，并展现出比无训练的PerSAM更强的分割性能。

3.4. Better Personalization of Stable Diffusion

DreamBooth是一种重新思考的方法。 类似于个性化分割，文本反转[12]、DreamBooth[45]和后续研究[28]对预训练的文本-图像模型进行微调，例如Stable Diffusion[44]和Imagen[46]，以合成用户指定的特定视觉概念的图像。举个例子，给定3到5张猫的真实照片，DreamBooth进行少样本训练，并学习通过以文本提示“a [V] cat”作为输入生成该猫。其中，[V]作为唯一标识符在词嵌入空间中表示特定的猫。训练后，个性化的DreamBooth能够在不同场景中合成新的猫的版本，例如“a [V] cat on a beach.”或“a [V] cat in the Grand Canyon.”然而，DreamBooth计算整个重建图像与真实照片之间的L2损失。正如图3所示，这将使得少样本图像中多余的背景信息注入到标识符[V]中，覆盖了新生成的背景，并干扰了目标对象的表示学习。

PerSAM辅助的DreamBooth。 在图8中，我们介绍了一种减轻DreamBooth背景干扰的策略。如果用户还提供了少样本图像的对象掩码，我们可以利用我们的PerSAM或PerSAM-F将所有前景目标进行分割，并丢弃背景区域内像素的梯度反传。然后，仅对稳定扩散进行微调，以记忆目标物体的视觉外观，并且不对背景施加任何监督来保持其多样性。在此之后，PerSAM辅助的DreamBooth不仅能够更好地合成具有视觉对应性的主体实例，还能够增加根据文本提示引导的新上下文的多样性。

4. Experiment

首先，我们在第4.1节中评估了我们个性化分割的方法，并在第4.2节中报告了视频对象分割的结果。然后，在第4.3节中，我们展示了借助我们的背景掩码改进的DreamBooth [45]的文本到图像生成。最后，在第4.4节中，我们进行了消融研究，以调查我们的每个组件的有效性。

4.1. Personalized Evaluation

PerSeg数据集。 为了测试个性化容量，我们构建了一个新的分割数据集，称为PerSeg。原始图像收集自主题驱动扩散模型DreamBooth [45]、Textual Inversion [12]和Custom Diffusion [28]的训练数据。PerSeg总共包含了40个不同类别的物体，包括日常用品、动物和建筑物。每个物体在不同的姿势或场景中被标注了5-7张图像和我们的注释掩膜。默认情况下，我们将第一张图像视为用户提供的一次性数据，并通过平均交并比（mIoU）评估模型。

实验细节。 我们使用预训练的SAM [27]和ViT-H [11]图像编码器作为分割基础模型。对于PerSAM，我们将目标引导注意力和目标语义提示应用于SAM解码器中的所有三个Transformer块，即两个常规块和一个最终块。方程式7中的平衡因子α被设置为1。对于PerSAM-F，我们进行了一次性训练，共进行了1000个epochs，批量大小为1。我们将初始学习率设置为10−3，并使用带余弦调度器的AdamW [37]优化器。值得注意的是，我们在PerSAM-F中不应用目标引导注意力和目标语义提示，以更好地显示微调的有效性。在训练过程中没有使用数据增强技术。

绩效。 在表1中，我们报告了我们的方法和其他现有方法在PerSeg数据集上的分割结果。如图所示，经过微调的PerSAM-F取得了最佳绩效，并通过总体平均交并比（mIoU）提高了PerSAM的大部分视觉概念的+6.01%。Visual Prompting [2]、Painter [51]和SegGPT [53]是基于上下文的学习器，根据给定的提示图像对任意对象进行分割。与SAM类似，最近的SEEM [63]是一个具有更强交互性和组合性的大规模基于提示的模型。它们也可以通过将一次性数据视为提示来用于个性化分割。我们无需训练的PerSAM可以以显著的优势胜过Painter、Visual Prompting和SEEM。虽然SegGPT的结果与PerSAM-F相当，但它包含大量参数，并且是经过广泛数据训练的，具备个性化能力。相比之下，PerSAM-F仅微调了2个可学习权重，以高效地定制现成的SAM进行私人使用。更多可视化结果请参见图11。

4.2. Video Object Segmentation

实验细节。 除了仅有一个物体的图像外，PerSAM和PerSAM-F也可以扩展到对视频帧中的多个物体进行分割。给定第一帧及其物体掩码，我们的方法可以个性化地同时分割和跟踪视频中的多个物体。我们选择了流行的DAVIS 2017 [40]数据集进行评估，并采用官方的J和F分数作为评价指标。对于 PerSAM，我们将相似度最高的两个点视为正面的位置先验，并额外利用上一帧的边界框及其中心点来提示解码器。这为物体跟踪和分割提供了更充分的时间线索。对于 PerSAM-F，我们对第一帧进行了单次微调，共进行了800个时期，学习速率为4-4。对于其他配置，我们遵循个性化实验的方法。

性能表现。 在DAVIS 2017验证集上，视频分割结果如表2所示。与没有视频数据的方法相比，无需训练的PerSAM在J＆F分数上大幅超过Painter [51] +25.7％，而PerSAMF在没有集成策略的情况下比SegGPT [53]的性能提高了+1.9％。值得注意的是，我们的微调方法甚至可以在J＆F分数上胜过AGSS [33]和AGAME [25]，分别比它们高出4.5%和1.9%。这两个模型都是通过大量视频数据进行完全训练的。这些结果充分说明了我们对多个视觉概念的时间视频数据具有强大的泛化能力。我们在图9中展示了PerSAM-F在三个视频帧上的分割结果，我们的方法在多目标跟踪和分割方面表现出了良好的性能。

4.3. PerSAM-assisted DreamBooth

实验细节。 我们使用预训练的稳定扩散[44]作为基础文本到图像模型。我们遵循DreamBooth[45]中的大多数模型超参数和训练配置，包括10^-6的学习率、批大小为1和一个包含200个图像的正则化数据集。我们在单个NVIDIA A100 GPU上对DreamBooth进行了1,000次迭代的微调，耗时5分钟。为了获得更好的准确性，我们采用了PerSAM-F来分割目标对象，它通过给定的图像-掩码对进行一次性微调。需要注意的是，无需训练的PerSAM也可以达到类似的结果，我们之所以称之为“PerSAM辅助”，只是为了简单起见。

性能。 除了图3之外，我们还在图10中展示了PerSAM辅助的DreamBooth的更多结果。对于躺在灰色沙发上的狗，DreamBooth生成的“丛林”和“雪地”仍然是带有绿色和白色装饰的沙发。在 PerSAM-F 的协助下，新生成的背景与沙发完全解耦，并且与文本提示相吻合。对于其他两个主体，PerSAM-F 也减轻了谷仓后面的山脉背景干扰以及桌子旁边的沙发干扰。DreamBooth 在最后一行出现的“橙色桌子”错误也表明，PerSAM-F 可以提高目标的视觉外观学习，从而更好地个性化文本到图像模型。

4.4. Ablation Study

在表3中，我们对PerSAM和PerSAM-F在PerSeg数据集上的提出的组件的有效性进行了研究。如图所示，我们首先从一个基准模型开始，该模型的mIoU为69.11%，其中仅利用了正位置先验来自动提示SAM。然后，我们分别添加了负位置先验和级联后校正，分别将分割精度提高了+3.63%和+11.44%。这构建了一个具有83.91%的竞争模型，已经比预训练良好的Painter [51]和SEEM [63]更强大。除此之外，我们还将目标对象的高层语义引入SAM的解码器中，以指导交叉注意力和提示机制。+1.91%和+3.50%的mIoU改善完全表明了我们设计的重要性。最后，通过高效的一次性微调，PerSAM-F将分数提升了+6.01%，达到了95.33%的mIoU，展示了卓越的个性化能力。

5. Discussion

SegGPT和PerSAM之间的区别是什么？
Painter [51]和随后的SegGPT [53]都采用了上下文学习框架，将传统的分割任务重新定义为图像着色问题。
在给定的一次性提示下，它们也可以实现类似于PerSAM的个性化分割，如表1所示进行比较。然而，它们包含了3.54亿个可学习的参数，并统一了各种分割数据进行大规模训练。相比之下，我们的方法要么是免费训练，要么是在10秒钟内仅微调2个参数。我们的目标是以最低成本将现成的基础模型（即SAM）定制为私人使用的更高效方式。

PerSAM能处理多目标场景吗？ 可以。如图9所示，表2中的视频对象分割任务需要在帧之间分割和跟踪多个对象，例如一个人和他的自行车。对于多个视觉概念，我们分别编码和存储它们的目标嵌入在第一帧中。然后，对于后续的帧，我们只运行图像编码器一次来提取视觉特征，并独立地为不同的对象提示掩码解码器。通过这种方式，我们的PerSAM和PerSAM-F可以高效地个性化地分割用户指定的多个视觉概念。

针对一次性遮罩质量的稳健性？ 为了更稳健地与人类进行互动，我们研究了在给定低质量的一次性遮罩的情况下，PerSAM和PerSAM-F的表现如何。在表4中，我们分别缩小和扩大参考遮罩的区域，并在PerSeg数据集上比较分割结果。当遮罩小于目标对象的尺寸（缩小）时，经过微调的PerSAM-F在与SegGPT和PerSAM进行比较时表现出更强的稳健性。这是因为围绕物体中心的内部点无法全面地代表其所有的视觉特征，这会损害得到的目标嵌入，削弱目标引导的注意力和目标语义提示的有效性。当掩模大于物体时（放大），不准确的掩模大小会误导PerSAM-F的一次性训练。相反，尽管存在一些背景噪声，目标嵌入可以包含物体的完整视觉外观，这对于PerSAM中的无训练技术几乎没有影响。总体而言，我们的PerSAM-F对于给定掩模的质量具有更好的鲁棒性，优于SegGPT。

6. Conclusion

在本文中，我们提出了一种只使用一次数据对特定视觉概念进行个性化的Segment Anything Model（SAM）。首先，我们引入了一种无需训练的方法，PerSAM，它在测试图像上计算位置先验，并采用了三种个性化技术：目标引导的注意力、目标语义提示和级联后期优化。在此基础上，我们进一步提出了一种10秒微调变体，PerSAM-F。通过仅使用2个可学习参数，PerSAM-F有效地减轻了遮罩尺度的歧义，并在我们的注释PerSeg数据集上取得了领先的性能。此外，我们还在视频对象分割上评估了我们的方法，并验证了它在辅助DreamBooth细调文本到图像扩散模型方面的有效性。我们希望我们的工作可以激励未来通过参数高效的方法个性化分割基础模型的研究工作。

预祝各位前途似锦、可摘星辰

作为全网 AI 领域干货最多的博主之一，❤️ 不负光阴不负卿 ❤️

❤️ 过去的每一天、想必你也都有努力、祝你披荆斩棘、未来可期

深度学习模型训练推理——基础环境搭建推荐博文查阅顺序【基础安装—认真帮大家整理了】
计算机视觉：硕博士，交流、敬请查阅
点赞收藏 ⭐留言都是博主坚持写作、更新高质量博文的最大动力！

你可能感兴趣的:(顶会论文翻译,计算机视觉,图像分割)

004-VTK用户指南--第一部分--第1章-欢迎 darlingfresher VTK系统学习 c++
欢迎来到《VTK用户指南》。VTK是一个开源的、面向对象的、用于计算机图形学、可视化和图像处理的软件系统。尽管VTK庞大且复杂，但只要你了解它的基本面向对象的设计和实现法，你就会发现我们的设计会使它易于使用。这份用户指南的目的是：帮助你学习这种设计和实现方法，并使你熟悉各种各样的、重要的VTK类。如果您阅读过这本指南的过往版本，您会注意到我们现在根据用户指南文档本身的版本号，而不是VTK的版本号来
spring boot应用程序接口调优记录 weixin_50825389 spring boot 服务器 java
一、接口功能本次目标接口为新契约的投保单导入，主要功能包括投保单创建、投核保规则校验、应收保费创建、投保单签发处理,实现外部合作方承保的投保单一步导入保司功能。一般来说，外部合作方会采用批处理的方式进行导入，所以在性能上会有一定要求。二、预期目标本次预期目标为在一个标准的配置上(4C8G)服务器上，实现RT600内，TPS80以上。三、性能优化过程1.首次压测结果从上面的压测数据我们看到，当前核保
echarts设置标题样式,echarts设置主标题和副标题样式 weixin_39620684 echarts设置标题样式
1.标题想将文字为标题，只需要在文字前面加上#，再在#后加一个空格即可。可分为一、二、三、四、五、六级标题，只需要增加#，每增加一个#，标题字号相应降低一级。代码如下：效果如下：…2021/3/130:37:16栈是一种操作受限的线性表，只允许从栈顶插入和删除数据，所以每次删除的元素都是最后进栈的元素，故栈也被称为后进先出（LIFO）表。栈主要包含两个操作，入栈（也叫做压栈）和出栈…2021/3/
性能测试中的IO风险诊断有哪些？ Feng.Lee 漫谈测试 php 服务器前端
应用系统离不开IO（数据读写），IO的读写性能直接影响系统性能，而磁盘IO系统的短板。CPU处理频率较磁盘的物理操作更快几个数量级，CPU从磁盘读取数据和从内存中读取数据的差别是秒到毫秒的区别。IO比较繁忙时，如果IO得不到满足会导致应用的阻塞（也叫IO等待或非空闲等待）。针对IO场景的模型，我们要考虑的有IO的TPS，平均IO数据，平均队列长度，平均服务时间，平均等待时间，IO利用率（磁盘Bus
AI大模型基于LLM的Agent架构图解 AI产品经理人工智能深度学习语言模型学习
Agent定义Agent是什么？Agent是一种能够自主决策、采取行动以达到某种目标的实体。AIAgent的确定义：基于人工智能（尤其是大模型）技术，能够感知和理解环境，并采取行动以完成目标的智能实体。Agent能干什么？AIAgent主要依托LLM模型和具体的业务场景来调用相应的工具来完成任务目标，智能化程度和行业贴合度会更明显。典型案例有什么？智能核保应用，如果解决方案搭载AIAgent能力，
Python 包管理工具 pip - pip 镜像源（临时使用镜像源、查看当前镜像源、设置当前镜像源）我命由我12345 Python 进阶开发 python pip 开发语言 python3.11 pycharm 后端后端开发
pip1，pip是Python的包管理工具，全称为PipInstallsPackagespip管理ython的包，包括，安装包、升级包、卸载包、查看已安装的包等如果使用的是Python3.4及以上版本，pip通常已经默认安装在命令行中执行指令pip--version，如果已安装，系统会显示pip的版本信息pip镜像源1、基本介绍在使用pip安装Python包时，默认的源服务器可能因网络问题导致下载
python input函数的应用(接收用户的输入)_python中使用input()函数获取用户输入值方式... weixin_39550258 python
python中使用input()函数获取用户输入值方式我们编写程序最终目的还是来解决实际问题，所以必然会遇到输入输出的交互问题，python中提供了input函数用来获取用户的输入，我们可以用以下程序演示。user_gender=input("Pleaseenteryourgender(F/M):")print(f'Yourgenderis{user_gender}')要注意的是在sublime编
yolo是什么，有什么优缺点以及YOLO的应用场景？ cesske YOLO
目录前言一、yolo是什么？二、YOLO的优点三、YOLO的缺点四、YOLO的应用场景总结前言这里我们来讲一下yolo是什么，有什么优缺点？一、yolo是什么？“YOLO”在计算机视觉和深度学习领域是一个特定的算法框架，全称是“YouOnlyLookOnce”。这个算法最初由JosephRedmon、SantoshDivvala、RossGirshick和AliFarhadi在2015年提出，旨在
人机交互：面部识别_14.面部识别在虚拟现实和增强现实中的应用 zhubeibei168 机器人及导航人机交互 vr ar 开发语言机器人导航与定位
14.面部识别在虚拟现实和增强现实中的应用14.1虚拟现实中的面部识别在虚拟现实（VR）环境中，面部识别技术可以显著提升用户体验，使其更加沉浸和自然。通过识别用户的面部表情，VR系统可以实时调整虚拟角色的行为，增强用户与虚拟世界的互动。14.1.1面部表情识别面部表情识别是虚拟现实中最常见的应用之一。通过摄像头捕捉用户的面部图像，使用计算机视觉算法识别出用户的表情，如微笑、惊讶、愤怒等，虚拟角色可
Huffman编码的Python的实现 childish_tree python 算法霍夫曼树数据压缩
Huffman编码的Python的实现基本原理及步骤Huffman编码是一种贪心算法，用于无损数据压缩。它基于字符在数据中出现的频率来构建编码，频率高的字符使用较短的编码，而频率低的字符使用较长的编码。这种方式的目的是减少数据的大小，因为最常见的字符使用最短的编码，从而在整体上减少了所需的位数。实现Huffman编码的原理如下：频率统计：如果输入数据是一个字符串，代码会遍历这个字符串，统计每个字符
springAop使用的动态代理是jdk还是cglib weixin_45287472 java 开发语言
springAop使用的动态代理是jdk还是cglibSpringAOP使用的动态代理可以是JDK动态代理或CGLIB动态代理，具体选择哪种代理方式取决于被代理的目标对象的类型和配置。当被代理的目标对象实现了至少一个接口时，SpringAOP会默认使用JDK动态代理。JDK动态代理基于接口生成代理类，通过反射机制调用目标对象的方法。而当被代理的目标对象没有实现任何接口时，SpringAOP会选择使
C语言：函数递归南玖yy c语言开发语言
一，基本概念函数递归指的是在一个函数的定义中使用该函数自身的编程技巧。也就是说，一个函数会直接或间接地调用自己。递归通常包含两个关键部分：递归基（终止条件）：这是递归结束的条件。如果没有终止条件，函数会一直调用自己，最终导致栈溢出错误。终止条件用于确保递归能够在满足特定条件时停止，返回一个确定的结果。递归步骤：函数通过调用自身来解决规模更小的子问题，逐步向终止条件靠近。递归的工作原理当一个函数调用
如何选择Spring AOP的动态代理？JDK与CGLIB的适用场景码农技术栈 spring boot spring cloud spring 微服务后端
SpringAOP在默认情况下使用的动态代理方式，可以比作是餐厅里的“智能服务员助手”。SpringAOP默认提供了两种动态代理方式：JDK动态代理和CGLIB代理。其选择取决于被代理的对象是否实现了接口，以及配置的代理模式。默认情况下，Spring会优先使用JDK动态代理。如果目标类没有实现任何接口，Spring才会使用CGLIB代理。智能服务员助手（JDK动态代理）：•这位助手专门服务于那些已
RabbitMQ消息持久化 jackwade666 rabbitmq 分布式
消息持久化如何保障RabbitMQ服务停掉以后消息生产者发送过来的消息不丢失。默认情况下RabbitMQ退出或由于某种原因崩溃时，会忽视队列和消息，除非告知它不要这样做。确保消息不会丢失需要做两件事：需要将队列和消息都标记为持久化。一、队列持久化创建的队列如果是非持久化的，如果rabbitmq重启队列就会被删除。如果需要持久化只要把durable设置为true就可以把队列持久化了。Queue.De
单点登录SSO：概述与示例百宝门-SSO顾问单点登录(SSO)单点登录 sso 身份管理百宝门 oracle esso
原文是一个系列：http://www.cnblogs.com/baibaomen/p/sso.html，曾上博客园推荐榜首。建议看原文，此处排版全乱了。转载需注明原文链接。单点登录SSO概述本系列将由浅入深的，带大家掌握最新单点登录SSO方案选型，以及架构开发实战。系列将结合示例、源码以及演示视频，让大家能够直观、深入学习。文末附5个满足不同单点登录场景的gif动画演示。本系列后继文章会深入它们的
pyqt5多线程优化_PyQt5多线程防卡死和多窗口用法的实现 Barrrrrry pyqt5多线程优化
心得：写着写着找到了自己的感觉，还是需要大量的代码和项目来加深对代码的理解一、PyQt5多线程防卡死在界面中，通常用会有一些按钮，点击后触发事件，比如去下载一个文件或者做一些操作，这些操作会耗时，如果不能及时结束，主线程将会阻塞，这样界面就会出现未响应的状态，因此必须使用多线程来解决这个问题。#-*-coding:UTF-8-*-""""==============================
pyqt5 多线程遇到的问题总结来一打雪碧 python pyqt5 多线程 thread
前言在使用pyqt5时，程序运行时间过长可能会造成界面假死的情况，为了解决这个问题，可以采用多线程。将程序放到子线程中运行。这里pyqt5多线程用的方法是继承QThread类，然后重写run()函数实现。#多线程的实现classMyThread(QThread):_signal=pyqtSignal(object)#自定义信号，用于传递数据等def__init__(self):su
深度学习——线性代数取个名字真难啊啊深度学习深度学习线性代数
文章目录1.基本数学概念2.线性相关和生成子空间3.范式4.特殊类型的矩阵和向量5.特征分解6.奇异值分解1.基本数学概念标量(scalar):一个标量就是一个单独的数，它不同于线性代数中研究的其他大部分对象(通常是多个数的数组)。我们用斜体表示标量。标量通常被赋予小写的变量名称。当我们介绍标量时，会明确它们是哪种类型的数。比如，在定义实数标量时，我们可能会说“令s∈R表示一条线的斜率”;在定义自
深度学习的应用场景及常用技术 eso1983 深度学习
深度学习作为机器学习的一个重要分支，在众多领域都有广泛的应用，以下是一些主要的应用场景及常用技术。1.应用场景1.计算机视觉图像分类描述：对图像中的内容进行分类，识别出图像中物体所属的类别。例如，在安防领域，通过对监控摄像头拍摄的图像进行分类，判断是否有可疑人员或物品出现；在电商领域，对商品图片进行分类，方便用户搜索和筛选商品。示例：识别图片中的动物是猫还是狗，或者判断一张图片是风景照还是人物照。
spring cloud netflix笔记精神病院丶吴院长个人笔记 spring cloud spring
Ribbon可以通过配置文件制定负载均衡的规则默认使用轮训算法来实现负载均衡根据响应时间做权重两个自动装配类RibbonAutoConfiguration和LoadBalancerAutoConfiguration装配类会让加了LoadBalanced注解的RestTemplate加上一个拦截器LoadBalancerInterceptor关键类LoadBalancerInterceptorRib
QT学习——控件篇流光拾贝 c++qt
QT学习——控件篇QPushButton的属性//今日领悟信号与槽：信号在发射过程中不能将函数在成员中定义，但是信号函数中的参数会自动与槽函数进行关联//故在槽函数中可以采用lambda（匿名函数）的参数列表进行对应的参数传递，也可以自定义另外的成员槽函数，用地址进行绑定。connect(ui->chcekbtn,&QPushButton::toggled,this,[=](boolbl){QSt
用docker启动mysql步骤 m0_74823131 面试学习路线阿里巴巴 docker mysql 容器
以下是在Docker中启动MySQL的详细步骤：**一、拉取MySQL镜像**1.打开终端，确保Docker服务正在运行。可以使用以下命令检查Docker服务状态：```sudosystemctlstatusdocker```2.使用以下命令拉取MySQL官方镜像：```dockerpullmysql```该命令会从DockerHub下载最新版本的MySQL镜像到本地。等待下载完成，这个过程可能需
Kafka 之详解(Detailed Explanation of Kafka） Linux运维老纪奋力拼搏让企业网站更好 kafka 分布式
一、Kafka简介ApacheKafka是一款分布式发布-订阅消息系统，由LinkedIn公司在2010年贡献给Apache基金会，并成为顶级开源项目。它有着独特的定位与特点，是一种快速、可扩展，且内在设计就是分布式、分区的以及可复制的提交日志服务。需要注意的是，Kafka并未遵循JMS规范，仅提供发布和订阅这一通讯方式。其官方中文网站为http://kafka.apachecn.org/quic
python list列表删除指定元素的四种方法 whale fall python进阶 python
在Python中，要删除列表中的某个元素，可以使用几种不同的方法，具体取决于你希望如何删除该元素。以下是一些常见的方法：1.使用remove()方法remove()方法会删除列表中第一次出现的指定元素。如果该元素不存在，会引发ValueError错误。my_list=[1,2,3,4,5]#删除值为3的元素my_list.remove(3)print(my_list)输出：[1,2,4,5]2.使
socket服务器断开消息,详解JS WebSocket断开原因和心跳机制反海 socket服务器断开消息
1、断开原因WebSocket断开的原因有很多，最好在WebSocket断开时，将错误打印出来。ws.onclose=function(e){console.log('websocket断开:'+e.code+''+e.reason+''+e.wasClean)console.log(e)}错误状态码：WebSocket断开时，会触发CloseEvent,CloseEvent会在连接关闭时发送给使
小米盒子显示服务器断开,小米盒子故障原因排查及检修方法未登录导小米盒子显示服务器断开
小米盒子无法开机怎么办?小米盒子没有关机功能，通电即会自动开机;无法开机的原因可能与供电不足或者系统数据异常有关。1.检查电源插座是否正常工作。检查插座指示灯，或者连接其它插座验证。(小米盒子mini没有指示灯)2.若可以显示系统启动界面，但无法正常进入系统桌面的，参考如下2个方面排查：①将盒子断开电源，再重新通电。设备会重新尝试加载系统。②从关机状态进入“系统恢复”模式，清除数据再尝试开机。小米
自定义Bean Validation异常处理器实现与应用 t0_54program python 开发语言个人开发
在Java的JAX-RS框架中，BeanValidation是一个非常强大的功能，它可以用于验证输入数据是否符合预期的规则。然而，默认情况下，当验证失败时，Jersey会抛出ConstraintViolationException，并返回一个“BadRequest”（400）错误。虽然这已经足够用于基本的验证，但有时候我们可能需要更详细的错误信息来帮助用户理解问题所在。本文将通过一个完整的示例，展
2501,编写dll fqbqrr 窗口 windows 窗口
DLL的优点简单的说,dll有以下几个优点:1)节省内存.同一个软件模块,若是源码重用,则会在不同可执行程序中编译,同时运行这些exe时,会在内存中重复加载这些模块的二进制码.如果使用dll,则只在内存中加载一次,所有使用该dll的进程会共享此块内存(当然,每个进程会复制一份的dll中的全局变量).2)不需编译的软件系统升级,若一个软件系统使用了dll,则改变该dll(函数名不变)时,系统升级只需
Spring Boot拦截器：掌握Web请求的“守门员” 码农技术栈架构微服务后端 spring boot
在SpringBoot中，拦截器（Interceptor）就像是一个门卫，能够在请求到达控制器之前或之后进行一些检查或操作。使用拦截器通常包含以下几个步骤：1.定义拦截器首先，你需要创建一个拦截器类，这个类要实现HandlerInterceptor接口。这个接口中有三个方法：•preHandle()：在请求到达控制器之前执行。你可以在这个方法中进行权限验证、日志记录等操作。如果返回true，请求会
[C++]DirectX 12 3D游戏开发实战—第12章学习笔记01 2019.5.7 卡酷酷 DirectX12 C++
个人学习用，请勿转载第十二章几何着色器词汇曲面细分：tenssellation几何着色器：geometryshader三角形列表：trainglelist内容如果不启用曲面细分这一环节，几何着色器这个可选阶段会位于顶点着色器与像素着色器之间。顶点着色器以顶点作为输入数据，而几何着色器的输入数据则是完整的图元。如果要绘制三角形列表，那么几何着色器程序实际将对列表中的每个三角形T执行下列操作：for(
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户