Joney Feng

三十四章：Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation ——弱监督语义分割中的类别重新激活图

0.摘要

提取类别激活图（CAM）可以说是生成弱监督语义分割（WSSS）伪掩码的最常用步骤。然而，我们发现导致伪掩码不理想的关键在于广泛使用的二元交叉熵损失（BCE）在CAM中的应用。具体而言，由于BCE的类别求和池化特性，CAM中的每个像素可能对同一感受野中出现的多个类别都有响应。结果就是，对于给定的类别，其热点CAM像素可能错误地侵占了属于其他类别的区域，或者非热点像素实际上可能是该类别的一部分。为此，我们引入了一种令人尴尬地简单但效果惊人的方法：通过使用softmax交叉熵损失（SCE）对已收敛的CAM进行重新激活，称为ReCAM。给定一张图像，我们使用CAM提取每个单独类别的特征像素，并将它们与类别标签一起使用，通过SCE学习另一个全连接层（在骨干网络之后）。一旦收敛，我们可以像在CAM中一样提取ReCAM。由于SCE的对比性质，像素响应被分解为不同的类别，因此预期的掩码模糊度较低。在PASCAL VOC和MS COCO上的评估结果显示，ReCAM不仅生成高质量的掩码，而且在任何带有很小额外开销的CAM变体中支持即插即用。我们的代码公开在https://github.com/zhaozhengChen/ReCAM。

1.引言

弱监督语义分割（WSSS）旨在通过使用“弱”标签（如涂鸦、边界框和图像级别的类别标签）而不是“强”像素级别的标签来降低注释“强”像素级别掩码的高成本。其中，图像级别的类别标签是最经济但也最具挑战性的预算，因此是我们本文的重点。该流程通常包括三个步骤：

1）使用图像级别的类别标签训练多标签分类模型；

2）提取每个类别的类别激活图（CAM），生成0-1的掩码，并进行一些细化操作，如腐蚀和膨胀；

3）将所有类别的掩码作为伪标签，以标准的全监督方式学习分割模型。

这个流程中有很多因素会影响最终分割模型的性能，但第一步中的分类模型是关键。我们经常观察到两个常见的缺陷：在对象类别A的CAM中，有

1）虚假阳性像素，它们被激活为类别A，但实际标签是类别B，其中B通常是类别A的混淆类别，而不是语义分割中的背景类别；

2）虚假阴性像素，它们属于类别A，但被错误地标记为背景。

研究结果：我们指出，在使用具有sigmoid激活函数的二元交叉熵（BCE）损失进行模型训练时，这些缺陷尤为明显。具体而言，sigmoid函数的公式为f(x) = 1 / (1 + e^(-x))，其中x表示任何单个类别的预测逻辑。输出被输入到BCE函数中计算损失值。该损失值表示对于x的错误分类的惩罚强度。因此，BCE损失不是类别互斥的，对于一个类别的错误分类并不会对其他类别的激活进行惩罚。这对于训练多标签分类器是必不可少的。然而，当通过这些分类器提取CAM时，我们观察到以下缺点：不同类别之间存在非独占性激活（导致CAM中的虚假阳性像素）；而且总类别上的激活受限（导致虚假阴性像素），因为部分激活是共享的。

动机：我们进行了一些玩具实验，以实证地展示在使用BCE时CAM的质量较差。我们从MS COCO 2014数据集中选择了单标签的训练图像（约占训练集的20%），分别用于训练5类和80类分类器。对于5类，我们选择了5个有困惑激活问题的有蹄动物类别（例如马和牛）。我们分别使用两种损失进行模型训练：BCE损失和softmax交叉熵（SCE）损失，后者是分类任务中最常用的损失函数。我们使用验证集中的单标签图像来评估模型的分类性能，如图1 (a)所示，并使用训练集和验证集中的单标签图像来检查模型对对象上正确区域的激活能力，即CAM的质量，如图1 (b)所示。

我们对此感到好奇，

1）对于80类模型，BCE和SCE产生了相同质量的分类器，但CAM明显不同，

2）SCE模型的CAM具有更高的mIoU，并且在验证图像中这种优势几乎被保持。

一个小但关键的观察是，对于5个有蹄动物类别，BCE显示出较弱的分类能力。我们指出，这是因为BCE的sigmoid激活函数没有强制进行类别排他性学习，导致模型在相似类别之间产生混淆。然而，SCE不同。它的softmax激活函数是exp(x) / (exp(x) + Σexp(y))，其中y表示任何负类的预测，在分母中使用指数项明确地强制类别排他性。SCE鼓励改进真实类别的逻辑值并同时惩罚其他类别。这对于CAM有两个效果：

1）减少虚假阳性像素，减少不同类别之间的混淆；

2）鼓励模型探索类别特定的特征，减少虚假阴性像素。

我们在图1 (b)中展示了实证证据，SCE相对于BCE的mIoU改进在5个有蹄动物类别中尤为显著。请注意，BCE和SCE的函数是不同的。为了更具体地比较它们，我们在第4.2节中从理论和实证的角度详细比较了它们产生的梯度。

我们的解决方案：我们的解决方案是使用SCE损失函数来训练CAM模型。然而，直接将BCE替换为SCE在多标签分类任务中是没有意义的，因为不同类别的概率不是独立的。相反，我们使用SCE作为额外的损失函数来重新激活模型并生成ReCAM。具体来说，当模型使用BCE收敛时，对于图像中标记的每个单独类别，我们提取以归一化的软掩码形式的CAM，即没有硬阈值。我们分别将所有掩码应用于特征（即由主干网络输出的特征图块），每个掩码“突出显示”对于特定类别的分类有贡献的特征像素。通过这种方式，我们将多标签特征分支成一组单标签特征。我们可以使用这些特征（和标签）来训练一个带有SCE的多类分类器，例如，在主干网络之后插入另一个全连接层。SCE损失惩罚由于特征不良或掩码不良而导致的任何错误分类。然后，反向传播其梯度改进两者。一旦收敛，我们以与CAM相同的方式提取ReCAM。

实证评估。为了评估ReCAM，在语义分割的两个流行基准数据集PASCAL VOC 2012和MS COCO 2014上进行了大量的WSSS实验。WSSS的标准流程是使用CAM作为种子，然后使用改进方法（如AdvCAM或IRN）扩展种子为伪掩码 - 用于训练分割模型的标签。我们设计了以下比较来展示ReCAM的普适性和优越性。

1）ReCAM作为种子。我们提取ReCAM并在之后使用改进方法，显示在强化步骤之后仍然保持对CAM的优越性。

2）ReCAM作为另一种改进方法。我们将ReCAM与现有的改进方法进行比较，考虑生成的掩码的质量以及对基准CAM增加的计算开销。在学习语义分割模型的阶段，我们使用基于ResNet的DeepLabV2，DeepLabV3+和基于Transformer的UperNet。

本文的贡献有两个方面。

1）一种简单而有效的方法ReCAM用于生成WSSS的伪掩码。

2）对两个流行的WSSS基准数据集上的ReCAM进行了广泛的评估，包括是否结合先进的改进方法。

图1。我们分别使用二元交叉熵（BCE）和softmax交叉熵（SCE）损失训练了两个模型。我们的训练集和验证集仅包含MS COCO的单标签图像。“80-class”模型使用完整的标签集。“5-hoofed”模型仅在5种有蹄动物的样本上进行训练，每种动物都会导致对另一种动物的误报缺陷，例如，牛和马之间的误报。

2.相关工作

在WSSS的研究中，多标签分类和语义分割模型的训练几乎是一致的。以下，我们仅介绍种子生成和掩码细化的变体。

种子生成。Vanilla CAM [51]首先通过使用为每个单独类学习的FC权重来缩放特征图（例如，由最后一个残差块输出）。然后，通过通道平均、空间归一化和硬阈值化的方式生成种子掩码（详见第3节）。基于这个CAM，有一些改进的方法。GAIN [25]将CAM应用于原始图像上生成掩蔽图像，并在这些图像上最小化模型的预测分数，强制模型捕捉其他区域（不在当前CAM内）的特征。擦除法方法[14,20,39,49]中也使用了类似的思想。不同之处在于，擦除法直接扰动（擦除）了CAM内的区域，并将扰动后的图像输入模型生成下一轮的CAM，以期望捕捉新的区域。Score-CAM [37]是一种不同的CAM方法。它将在vanilla CAM中使用的FC权重替换为从通过通道级（而不是特定类别）激活图生成的新一组分数。EDAM [40]是一项最近使用基于CAM的扰动来优化额外分类器的工作。我们可以认为我们的ReCAM与EDAM类似。我们强调两个区别。

1）EDAM使用额外的层来生成类别特定的软掩码，而我们的软掩码仅来自CAM的副产品，无需任何参数。

2）EDAM仍然使用BCE损失进行扰动输入的训练，而我们检查了BCE的局限性，并提出了一种通过利用SCE的不同训练方法（详见第4.2节）。

掩码生成。由CAM或其变种生成的种子掩码可以经过细化步骤。一类细化方法[1,2,4,42]将种子中的对象区域传播到邻域中语义相似的像素。这是通过随机游走[33]在一个转移矩阵上实现的，其中每个元素是一个相似度分数。相关的方法对这个矩阵有不同的设计。PSA [2]是一个AffinityNet，用于预测相邻像素之间的语义相似度。IRN [1]是一个像素间关系网络，用于估计基于此计算相似度的类别边界图。另一种方法是BES [4]，它通过使用CAM作为伪标签来学习预测边界图。所有这些方法都引入了额外的网络模块来改进vanilla CAM。另一类细化方法[15,17,22,26,44,48]利用显著性图[13,50]。EPS [24]提出了一种联合训练策略，将CAM和显著性图结合起来。EDAM [40]引入了一种后处理方法，将显著性图中的置信区域集成到CAM中。在实验中，我们将ReCAM插入其中，以评估其在使用额外显著性数据时的性能。一种更近期的方法利用迭代后处理来改进CAM。OOA [16]集成了多个训练迭代中生成的CAM。CONTA [45]通过整个WSSS过程进行迭代，包括一系列模型训练和推断。vCAM [23]使用相对于输入图像的梯度来扰动图像，并迭代地找到新激活的像素。总体而言，这些细化方法都是基于CAM [51]生成的种子。我们的ReCAM是一种利用SCE重新激活CAM中更多像素的方法，因此方便将其整合进去。我们在第5节进行了广泛的插入实验。

改进CAM的其他方法包括ICD [10]，它在特征流形上学习了类内边界；SC CAM [3]，它学习了细粒度分类模型（使用伪细粒度标签）；以及SEAM [38]，它强制了从图像的不同变换中提取的CAM的一致性。最近的一项工作RIB [21]根据信息瓶颈理论进行了仔细的分析，并提出了在不使用最后一个激活函数的情况下重新训练多标签分类模型。我们的ReCAM没有删除任何激活函数，而是添加了基于softmax激活的损失函数（SCE），如图3所示。另一个区别在于推理阶段。RIB需要对每个测试图像进行10次前向和后向传递，而ReCAM只需要一次前向传递。例如，在PASCAL VOC 2012 [9]数据集上，RIB的推理时间为8小时（训练时间与vanilla CAM相同），而我们相对于vanilla CAM的总计算时间只有0.6小时。

3.前提条件

CAM的第一步是使用全局平均池化（GAP）和预测层（例如，ResNet [12]的FC层）训练一个多标签分类模型。每个训练样本的预测损失通过以下公式中的BCE函数计算：

其中，z[k]表示第k类的预测logit，σ(·)是sigmoid函数，K是前景对象类别的总数（在数据集中）。y[k]∈{0,1}是第k类的图像级标签，其中1表示图像中存在该类别，0表示不存在。一旦模型收敛，我们将图像x输入模型中，提取出图像x中出现的第k类的CAM：

其中，wk表示与第k类对应的分类权重（例如，ResNet的FC层），f(x)表示在GAP之前的x的特征图。

请注意，为了简化起见，我们假设模型的分类头始终是一个单独的FC层，并在以下内容中使用w来表示其权重。

伪掩码。有几种方法可以从CAM生成伪掩码：

1）将CAM阈值化为0-1掩码；

2）使用IRN [1]进行细化——一种广泛使用的细化方法；

3）通过分类模型迭代地细化CAM，例如使用AdvCAM [23]；

4）级联选项3和2。

在图2中，我们使用我们的ReCAM展示了这些选项。我们将在第4.1节详细介绍这些方法。

语义分割。这是WSSS的最后一步。我们使用伪掩码以全监督的方式训练语义分割模型。目标函数如下：

其中，yi;j和zi;j分别表示像素(i;j)处的标签和预测logit。yi;j[k]和zi;j[k]分别表示yi;j和zi;j的第k个元素。H和W分别是图像的高度和宽度，K是类别的总数，K+1表示包括背景类别。在实现上，我们使用了ResNet-101 [12]的DeepLab变体[5,6]，遵循相关的工作[1,21,23,45]。此外，我们还使用了最近的模型UperNet [41]，它采用了更强大的骨干网络——Swin Transformer [31]。

图2.使用ReCAM生成WSSS的伪掩码的流程。该流程包括两个步骤：种子生成和掩码生成。我们的ReCAM被作为一个模块插入到种子生成步骤中。掩码生成有几个选项：

1）直接使用ReCAM作为伪掩码；

2）使用最常见的细化方法IRN [1]对ReCAM进行细化；

3）通过ReCAM模型迭代地推断出更好的掩码；

4）级联选项3和2。

学习ReCAM模型的详细信息在图3中显示。表2显示了这些选项的整体比较结果。

4.类别重新激活图（ReCAM)

在第4.1节中，我们详细介绍了重新激活分类模型并从中提取ReCAM的方法。请注意，我们还使用“ReCAM”来命名我们的方法。在第4.2节中，通过理论和实证比较SCE和BCE的梯度，我们证明了在ReCAM中进行类别独占学习的优势。

4.1.ReCAM流程

骨干网络和多标签特征。我们使用标准的ResNet-50 [12]作为我们的骨干网络（即特征编码器）来提取特征，遵循相关的工作[1,21,23,45]。

给定输入图像x和其多热类标签y ∈ {0,1}^K，我们将特征编码器的输出表示为f(x) ∈ R^W×H×C。C表示通道的数量，H和W分别表示高度和宽度，K是数据集中前景类别的总数。请注意，在图3：

1）为简洁起见省略了特征提取过程；

2）特征f(x)在上方块中写为f，并且通常代表多个对象。

FC层-1和BCE损失：在传统的CAM模型中，特征f(x)首先通过一个GAP层，然后结果被馈送到一个FC层进行预测[51]。因此，预测的logits可以表示为：

然后，使用z和图像级别标签y来计算BCE损失。其元素级的计算公式如式（1）所示。

提取CAM。给定特征f(x)和FC层对应的权重wk，我们根据公式（2）提取每个单独类别k的CAM。为简洁起见，我们将CAMk(x)表示为Mk ∈ R^W×H。

单标签特征。如图3所示，我们使用Mk作为软掩码，应用在f(x)上提取类别特定的特征fk(x)。我们计算Mk和f(x)的每个通道之间的逐元素乘法如下所示：

其中，fc(x)和fkc(x)表示乘法（使用Mk）之前和之后的单通道（c从1到C，C是特征图的数量，即通道数）。特征图块fk(x)（每个包含C个通道）对应于图3中的示例f1，f2，f3。

FC层-2和SCE损失。每个fk(x)都有一个单一的目标标签（即一个独热标签，其中第k个位置为1）。然后，我们将其输入到FC层-2（见图3）中，以学习多类分类器，因此我们对x有新的预测logits，如下所示：

其中，FC2具有与FC1相同的架构。通过这种方式，我们成功地将基于BCE的多标签图像模型转换为基于单标签特征的SCE模型。SCE损失的形式如下所示：

其中，y[k]和zk0[k]分别表示y和z0的第k个元素。我们使用Lsce的梯度来更新包括主干在内的模型。因此，我们重新激活BCE模型的总体目标函数如下所示：

其中，λ是平衡BCE和SCE之间的权重。请注意，由于我们需要在学习过程中使用FC1来生成更新的软掩码Mk，所以重新优化FC1与Lbce也被包括在内。

在重新激活之后，我们将图像x输入到其中，以提取每个类别k的ReCAM，如下所示：

其中，w00k00k表示与第k个类别对应的分类权重。由于我们有两个FC层，我们的实现可以选择w00作为：1）w，2）w0，3）w ⊕ w0或4）w ⊗ w0，其中⊕和⊗分别表示逐元素加法和乘法。我们在第5.2节中展示了这些选项的性能。

优化ReCAM（可选）。如第3节介绍的那样，有几种方法可以优化ReCAM：1）AdvCAM [23]通过对图像x进行对抗攀爬来迭代地优化ReCAM

其中，t ∈ [1;T]是对抗步骤的索引，xt是第t步的扰动图像。k和j分别表示正类和负类。ξ和µ是超参数（与[23]中相同）。M =1 ReCAMk xt−1 >0.5是用于正则化的ReCAM的限制性掩码。最终经过精炼的激活图Mk0 =PT t=0 ReCAMk(xt) / PT t=0 ReCAMk(xt)max PT t=0 ReCAMk(xt)，注意这里我们遵循AdvCAM [23]，在公式（9）中使用未经过最大归一化的ReCAM。2）IRN [1]将ReCAM作为输入，并训练一个像素间关系网络（IR Net）来估计类别边界图B。为简洁起见，我们省略了IRNet的训练细节。然后，它使用B和转移概率矩阵T对ReCAM进行随机游走来进行精炼。

其中，t表示迭代次数，vec(·)表示向量化。最后，我们使用fMk0g作为图像的像素级标签，其中k表示图像中的每个正类，来训练语义分割模型。

图3. ReCAM的训练框架。在上方的块中，是使用二元交叉熵（BCE）进行传统的多标签分类器训练。为了简洁起见，我们省略了通过主干网络提取特征。我们提取每个类别的CAM，然后将其应用于特征图f上（作为归一化的软掩码），以获得特定类别的特征fk。在下方的块中，我们使用fk及其单一标签，通过SCE损失学习多类别分类器。这个损失的梯度通过整个网络，包括主干网络，进行反向传播。

4.2.论据：二元交叉熵（BCE）与 softmax 交叉熵（CE）的比较

在本节中，我们将证明在ReCAM中引入SCE损失的优势。我们在理论和实证上比较了SCE和BCE在优化分类模型方面的效果。对于任何输入图像，令z表示预测的logits，y表示one-hot标签。基于导数链规则，可以推导出对于logits的BCE和SCE2损失的梯度：

其中，σsig表示sigmoid函数，σsof表示softmax函数。

从理论上讲，为了方便分析，我们考虑二分类（K=2）的情况，其中有一个正类p和一个负类q。公式（12）可以进一步推导为：

然后，我们考虑不同情况下zp和zq的情况，比较正类p（‹和fi）和负类q（›和fl）的梯度项的大小。 a) zp < zq：负类的logit远大于正类的logit。这种情况非常罕见，大多是由于错误标注导致的。在这种情况下，k‹k和k›k都小于0.5，但kfik和kflk趋近于1——SCE收敛更快。 b) zp > zq：这种情况出现在模型收敛时。所有四个梯度项都接近于0，无法区分任何差异。

接下来，我们考虑最后一种最令人困惑的情况：

c) zp ≈ zq。我们将其分为两个子情况：

c1) zp和zq都很大，例如约为10（我们在MS COCO的“5 hoofed”实验中观察到）。我们可以发现SCE损失梯度（即kfik和kflk）的大小都接近0.5，而k‹k≈0和k›k≈0.5。

c2) zp和zq都很小，例如约为-10。kfik和kflk保持不变（为0.5），但k‹k≈0.5和k›k≈0。我们可以发现，在这两种令人困惑的情况下，SCE损失产生的梯度既鼓励预测正类，又惩罚预测负类。原因是softmax函数的分母中的指数项明确地涉及了两个类别。

基于这一点，SCE可以保证类别排他性学习——在面对困惑时同时提高正类和抑制负类的预测。相比之下，BCE每种情况都专注于正类或负类之一。它不能保证在惩罚负类时不降低正类的预测，或在鼓励正类时不提升负类的预测，导致学习效率低下，特别是对于令人困惑的类别。

经验上来看，有人可能会认为梯度的大小并不直接导致更强的优化，因为常见的优化器（如Adam [18]）使用自适应学习率。为了验证SCE在实践中的有效性，我们监测了运行真实模型时的梯度。具体来说，我们回顾了“5 hoofed animals”的玩具实验，这些模型是使用Adam优化器训练的。我们计算了BCE和SCE损失的梯度（通过两个独立的模型产生），并与每个预测logit相关联。如图4所示，我们分别展示了对目标类别（即唯一的正类p）和混淆类别（即具有最高logit值的负类q）的logit的梯度。我们可以看到，SCE损失的梯度对于正类和负类的变化更加迅速，表明其模型学习更加积极和高效。

图4. 目标类别（即唯一的正类p）和混淆类别（即具有最高logit值的负类q）的logit的梯度。BCE和SCE模型都是在MS COCO训练集的“5 hoofed animal”类别上进行训练的。这些梯度是在验证集上计算的。

5.实验

5.1.数据集和设置

数据集包括常用的PASCAL VOC 2012 [9]和MS COCO 2014 [30]。VOC包含20个前景目标类别和1个背景类别。在训练集、验证集和测试集中分别有1,464、1,449和1,456个样本。参照相关工作[1,23,45]，我们使用了由Hariharen等人提供的扩大的训练集，其中包含10,582个训练图像。MS COCO包含80个目标类别和1个背景类别。在其训练集和验证集中分别有80,000和40,000个样本。在这两个数据集上，我们在训练过程中仅使用它们的图像级别标签，这是WSSS中最具挑战性的设置。

评估指标。我们主要有两个评估步骤。

Mask生成。我们为训练集中的图像生成伪造的掩码，并使用它们对应的真实掩码来计算mIoU（平均交并比）。
语义分割。我们训练分割模型，使用该模型对验证集或测试集中的图像进行掩码预测，并基于它们的真实掩码计算mIoU。我们还在附录中提供了F1和像素准确度的结果。

网络架构。对于掩码生成，我们遵循[1,23,45]的方法，使用ResNet-50作为主干网络，其生成的特征图大小为32×32×2048。对于语义分割，我们采用了ResNet-101（按照[1,23,45]的做法）和Swin Transformer [31]（在WSSS领域首次使用）。这两个网络都是在ImageNet [8]上预训练的。我们将ResNet-101集成到DeepLabV2 [5]和DeepLabV3+ [6]中，后者的结果在附录中展示（由于空间限制）。我们将Swin集成到UperNet [41]中。

实现细节。对于掩码生成，我们使用与[1]相同的设置来训练FC Layer-1。我们通过以下方式训练FC Layer-2：在VOC数据集上将λ设置为1，在MS COCO数据集上将λ设置为0.1；在两个数据集上使用初始学习率为5e-4和多项式学习率衰减的设置进行4个epochs的训练。我们遵循IRN [1]的做法，在数据增强和权重衰减策略上保持一致。方程（10）和方程（11）中的所有超参数遵循原始的AdvCAM [23]和IRN [1]论文。对于语义分割中的DeepLabV2，我们使用与[1,21,23]相同的训练设置。具体细节请参考附录。对于UperNet，输入图像首先被统一调整为2,048×512的大小，纵横比范围从0.5到2.0，然后在馈送模型之前随机裁剪为512×512的大小。数据增强包括水平翻转和颜色抖动。我们在VOC和MS COCO数据集上分别进行了40,000和80,000次迭代的训练，批量大小为16。我们使用AdamW [32]求解器，初始学习率为6e-5，权重衰减为0.01。学习率按照多项式衰减的方式，以1.0的幂进行衰减。

5.2.结果和分析

对于FC Layer-1（FC1）或Layer-2（FC2）上的SCE。人们可能会认为，在额外的分类器FC2上应用SCE是不必要的。我们进行了在FC1上使用SCE的实验（即不使用FC2），并在表1的上半部分展示了结果。“Lbce only”是仅使用BCE损失的基准，“Lsce only”是仅在FC1上使用SCE，并将原始的多热标签修改为归一化的形式（总和为1）。例如，[1;1;0;1;0]被修改为[1/3;1/3;0;1/3;0]。“Lsce for single only”是在学习多标签图像时应用BCE，但在单标签图像（即包含一个对象类别的训练图像子集）上应用SCE。结果显示，“Lsce only”表现最差。这是因为SCE在多标签分类任务中没有意义，不同类别的概率不是独立的[47]。“Lsce for single only”将两种损失结合起来处理不同的图像，增加了方法的复杂性。此外，在实际应用中，它并没有获得很大的提升，特别是对于MS COCO数据集来说，其中单标签图像数量较少，并且是一个更一般的分割场景。

在方程（9）中使用FC1和FC2的权重。由于我们有两个FC层，我们在w00的实现中有几个选项：1）w，2）w0，3）w ⊕ w0，或4）w ⊗ w0，其中⊕和⊗分别是逐元素相加和相乘。我们在表1的下半部分展示了结果。我们可以看到，所有选项的结果都优于基准（即没有FC2的“Lbce only”）。在VOC上，使用w ⊗ w0的ReCAM获得了最佳性能。原因是逐元素相乘可以增强代表性特征图并抑制混淆的特征图。有趣的是，在MS COCO上，使用w的ReCAM比w ⊗ w0获得更好的性能。这可能是因为在这个困难的数据集上，输入到FC2的特征fk(x)较差，并且FC2训练不充分。基于这些结果，我们在VOC的所有实验中使用w ⊗ w0，在MS COCO上使用w。

值得强调的是，ReCAM的有效性在两个数据集上得到了验证。如果将第二个块中的任何一行与表1中的第一行进行比较，使用ReCAM的任何选项都会产生比基准更好的掩码。

不同λ值的影响。方程（8）中的λ控制了BCE和SCE之间的平衡。我们通过在VOC上遍历λ的值来研究ReCAM的伪掩码质量（mIoU），如图6（a）所示。我们可以观察到λ的最佳值为1，但在使用其他值时差异并不显著，即ReCAM对λ不敏感。请参考补充材料以获取更多的敏感性分析，例如学习率的分析。

ReCAM的普适性。我们以ReCAM为种子，并通过以下方式评估其普适性：

1）将其与经典的CAM进行比较-这是最常用的种子生成方法；

2）在它之后应用不同的改进方法。

从表2和表3的结果中，我们可以发现ReCAM在VOC和MS COCO上都显示出与CAM相比的一致优势。具体来说，在表2的第一行中，ReCAM在VOC上的性能比CAM高出6%。当将ReCAM作为伪掩码用于学习语义分割模型时，这个差距几乎保持不变，如表3的第一行所示。值得一提的是，在更强的分割模型UperNet-Swin上，这个差距更大，例如，在VOC验证集上，与DeepLabV2相比，使用ReCAM的差距为6.1%，而使用DeepLabV2的差距为4.7%。

关于对ReCAM的改进，我们有两个观察结果：

1）计算成本显著增加（表2），例如，通过IRN导致的增加约为4.5倍，通过AdvCAM导致的增加约为160倍（相对于基准的ResNet-50上的ReCAM）；

2）在表3中有下划线数字所示，始终通过IRN的帮助获得WSSS的最佳性能。

图6（b）显示，ReCAM为单标签和多标签图像生成了更好的掩码。在添加IRN时，ReCAM的改进效果得以保持。图5展示了4个示例，在这些示例中，ReCAM缓解了我们在第1节中提到的两个问题：假阴性像素和假阳性像素。图5中最右侧的块显示了一个失败的案例：无论是CAM还是ReCAM都无法捕捉到具有遮挡或与周围环境颜色相似的对象部分，例如“dog”和“human hands”之间的区域。

ReCAM的优势。我们可以将ReCAM作为一种改进方法，并将其与相关方法（如IRN和AdvCAM）进行比较。在表2中，与AdvCAM（55.6%）相比，ReCAM在VOC上实现了可比较的结果（54.8%），但更高效-比AdvCAM快160倍（1.9秒对316.3秒）。通过添加IRN级联，ReCAM超过AdvCAM 1%（70.9%对69.9%），并且ReCAM更高效（只需8.2秒）。此外，从表4中我们可以看到，ReCAM支持不同的CAM变体，包括基于显著性的方法，实现即插即用的功能。

图5. 在VOC数据集上使用CAM和ReCAM生成的0-1掩码的可视化结果（在训练语义分割模型之前）。左侧的两个块（每个块有四列）展示了第1节中介绍的两个问题：假阴性像素和假阳性像素。红色虚线框标志着ReCAM改进的区域。最后一个块展示了一个失败案例。

表1. 上方块显示了使用不同损失函数（BCE、SCE及其混合）训练传统的多标签分类模型的mIoU结果（%）。下方块显示了使用不同权重提取ReCAM的结果：FC层1或FC层2的权重，或它们的混合变体（逐元素相加或相乘）。"rp."表示我们用于报告最终结果的选项（包括掩码改进和语义分割的mIoU）。请注意，使用其他选项（例如用于VOC的w0）的结果在补充材料中。

表2. 在VOC和MS COCO数据集上，通过伪掩码mIoU（%）和消耗时间将ReCAM与基准方法进行比较。"Time"表示从训练模型（使用预训练的ImageNet骨干网络）到生成所有训练图像的0-1掩码的总计算时间。单位时间（ut）在VOC上为0.7小时[9]，在MS COCO上为5.4小时[30]。∗表示结果来自我们的重新实现（原始论文中没有MS COCO的结果）。下划线标记了我们的最佳结果。

表3. 在两个基准测试上，使用不同的分割模型进行WSSS（弱监督语义分割）的mIoU结果（%）。种子掩码可以通过CAM或ReCAM生成，掩码改进方法为行标题。我们在补充材料中提供了DeepLabV3+的结果。

图6. (a) 在VOC上，ReCAM对方程（8）中λ值的敏感性。(b) 将表2中前两行的mIoU结果分解为单标签图像（"Single"）和多标签图像（"Multi"）的结果。

表4. 使用DeepLabV2在VOC上进行mIoU结果（%），带有或不带有显著性检测模型。在左侧，如果论文中报告了与IRN的组合，默认情况下方法包括IRN。在右侧，我们分别将ReCAM插入到EPS*(-E*)和EDAM*(-M*)中，或者等效地将它们的显著性编码模块分别添加到我们的框架中，其中*表示DeepLabV2在MS COCO上进行了预训练。

6.总结

我们从传统CAM的两个常见缺点开始。我们指出问题的关键在于广泛使用的BCE损失，并在理论上和实践中证明了SCE损失的优越性。我们提出了一种简单但有效的方法，名为ReCAM，通过将SCE插入基于BCE的模型中来重新激活模型。我们通过广泛的实验证明了它的普适性和优越性，并在两个流行的WSSS基准测试中进行了各种案例研究。

补充材料

A.关于玩具实验的更多结果

在MS COCO数据集中，有五个有蹄动物类别，包括马、羊、牛、大象和熊。我们选择只包含这些类别之一的图像，并忽略图像中出现的其他MS COCO类别（例如，包含人和马的图像将被选中，但标签为单热编码的马）。在MS COCO的训练集和验证集中，分别有6,340张和3,001张这样的图像。然后，我们使用BCE或SCE损失函数在6,430张训练图像上训练了这五类分类模型，并在3,001张验证图像上对模型进行评估（请注意，我们在主要论文中还展示了训练图像的类别激活结果（mIoU））。

B.更多WSSS结果（DeepLabV3+）

表S1呈现了在利用DeepLabV3+模型时，WSSS的mIoU（%）结果。它是对主要论文中表格3的补充。

表S1：使用DeepLabV3+进行语义分割的结果（mIoU%），在VOC和MS COCO数据集上。种子掩膜是通过CAM或ReCAM生成的，然后输入到掩膜细化算法中（列标题列出）。经过细化的掩膜被用作伪标签来训练语义分割模型。最后，在验证集上评估该模型。

表S2：使用DeepLabV2在VOC和MS COCO数据集上进行语义分割的结果（mIoU%）。它用于展示使用不同的FC权重来计算ReCAM时的差异。伪蒙版（用于训练模型）可以是第一个块中的ReCAM，也可以是第二个块中使用IRN细化的ReCAM的细化蒙版。

C.ReCAM的不同权重

表S2展示了WSSS（使用DeepLabV2）应用不同的FC权重提取ReCAM时的mIoU结果（%）。我们展示了两个WSSS结果块：一个是使用ReCAM生成种子（并直接使用种子掩膜来训练WSSS模型），另一个是使用IRN进一步细化种子掩膜（然后使用细化掩膜来训练WSSS模型）。

D.两个缺陷的统计数据

在表S3中，我们展示了主要论文中分析的两个缺陷的详细统计数据。我们还提供了TP和FP（bg）的数量作为额外的参考。值得注意的是，在将CAM阈值设置为0-1掩膜时，FP和FN之间存在权衡关系-较高的阈值会导致较少的FP和较多的FN。请注意，我们遵循AdvCAM [23]的做法，对阈值的值进行细粒度的网格搜索。表S3呈现了在VOC数据集上使用两个不同阈值的结果（主要论文中使用了阈值0.21）。我们可以看到，当将ReCAM（0.21）与CAM进行比较时，FN像素显著减少，但FP像素略微增加（包括obj和bg）。当将阈值增加到0.26时，FN和FP像素都减少了。然而，与CAM相比，整体改进有所下降（阈值0.21的mIoU为54.8％，而阈值0.26的mIoU为53.8％）。我们很高兴看到，当ReCAM在更具挑战性的数据集MS COCO上取得最佳性能时，它明显减少了FP和FN。

表S3：种子掩膜中不同像素的像素数量和百分比（%）。"TP"表示真正例。"FP (obj)"表示实际标签为其他对象类别的假正例。"FP (bg)"表示实际标签为背景的假正例。"FN"表示被错误分类为背景的假负例。每列中"TP"、"FN"和"FP (bg)"的百分比之和为100%。

E.在MS COCO数据集上的λ值

超参数λ平衡了损失函数中BCE和SCE项的影响（见主要论文中的方程（8））。我们在图S1中展示了在MS COCO上遍历λ值对结果的影响。这是对主要论文中图6（a）的补充。在MS COCO上，λ的最佳值为0.1，当使用较大的λ值（例如2）时，模型性能会大幅下降。我们在第5.2节的段落中解释了原因，该段落标题为“在方程（9）中使用FC1和FC2的权重”。

图S1：ReCAM对于MS COCO上λ值的敏感性。

F.对学习的敏感性

图S2：在不同学习率（LR）下运行实验的结果。我们通过在论文中使用的默认LR值上应用不同的缩放因子（在图S2中称为学习率比率）来实现这一点。请注意，我们对基线CAM的LR设置完全遵循了IRN [1]的设置。从图S2中可以看出，较大的LR值会使CAM的训练不稳定，并以NaN损失结束。相反，我们的ReCAM不太敏感。我们认为这是因为ReCAM中的两个FC层不是从头开始训练，而是从预训练的基线BCE模型的权重开始训练（这就是为什么我们称之为“重新激活CAM”）。我们在第5.2节的段落中强调了这个原因，该段落的标题是“在方程（9）中使用FC1和FC2的权重”。

图S2：在VOC上使用不同学习率训练的CAM和ReCAM的mIoU结果。学习率比率表示应用在论文中使用的默认学习率上的标量。

G.1.BCE

G.2.CE

H.算法

ReCAM 的训练流程在算法1中，如下所示：

I.DeepLabV2的训练细节

我们在 DeepLabV2 的训练过程中补充了一些细节。参考文献 [21,23]，我们将每个训练图像裁剪为大小为321×321。在 VOC 数据集和 MS COCO 数据集上分别进行了20k和100k次迭代的模型训练，批量大小分别为5和10。学习率设置为2.5e-4，权重衰减设置为5e-4。为了进行数据增强，我们使用了水平翻转和随机裁剪的方法。

J.更多定性结果

图S3展示了在VOC训练集上由CAM和ReCAM生成的热图和0-1掩码的更多定性结果。这是对主文中图5的补充。图S4展示了在VOC和MS COCO训练集上使用IRN [1]进行细化的掩码。图S5展示了在VOC和MS COCO验证集上使用语义分割（使用DeepLabV2）生成的结果掩码。

你可能感兴趣的:(transformer,深度学习,人工智能,网络,架构)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
计算机木马详细编写思路小熊同学哦 php 开发语言木马木马思路
导语：计算机木马（ComputerTrojan）是一种恶意软件，通过欺骗用户从而获取系统控制权限，给黑客打开系统后门的一种手段。虽然木马的存在给用户和系统带来严重的安全风险，但是了解它的工作原理与编写思路，对于我们提高防范意识、构建更健壮的网络安全体系具有重要意义。本篇博客将深入剖析计算机木马的详细编写思路，以及如何复杂化挑战，以期提高读者对计算机木马的认识和对抗能力。计算机木马的基本原理计算机木
【ARM Cortex-M 系列 2.3 -- Cortex-M7 Debug event 详细介绍】主公讲 ARM #ARM 系列 arm开发 debug event
请阅读【嵌入式开发学习必备专栏】文章目录Cortex-M7DebugeventDebugeventsCortex-M7Debugevent在ARMCortex-M7架构中，调试事件（DebugEvent）是由于调试原因而触发的事件。一个调试事件会导致以下几种情况之一发生：进入调试状态：如果启用了停滞调试（HaltingDebug），一个调试事件会使处理器在调试状态下停滞。通过将DHCSR.C_DE
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio