越溪

深度学习（9）——无监督语义分割之全卷积域适应网络（译文）

无监督语义分割之全卷积域适应网络

Fully Convolutional Adaptation Networks for Semantic Segmentation

摘要

深度神经网络的最新进展令人信服地证明了在大型数据集上学习视觉模型的高能力。然而，收集专家标记的数据集尤其是像素级注释是一个非常昂贵的过程。一个吸引人的选择是渲染合成数据（例如，计算机游戏）并自动生成基础事实。然而，简单地应用在合成图像上学习的模型可能由于域移位（domain shift,合成图像和真实图像的数据分布存在巨大的偏差）而导致真实图像上的高泛化误差。在本文中，我们从appearance-level和representation-level域适应的角度来促进这个问题。前者使源域图像（source-domain）看起来好像是从目标域（target domain）中的“样式”中绘制出来的，而后者则试图学习域不变（domain-invariant）表示特征。具体来说，我们提出了全卷积自适应网络（FCAN），这是一种用于语义分割的新型深层体系结构，它结合了图像域适应网络（AAN,Appearence Adaptation）和特征自适应网络（RAN,Representation Adaptation）。 AAN在像素空间中学习从一个域到另一个域的变换，并且以对抗性学习方式优化RAN以最大限度地利用学习的源域和目标域表示来欺骗域鉴别器。从GTA5（游戏视频）到城市景观（城市街景）的语义分割转移进行了广泛的实验，与最先进的无监督自适应技术相比，我们的方案取得了优异的成果。更值得注意的是，我们获得了一项新的记录：在无监督的环境中,BDDS（drivecam视频）的mIoU为47.5％。

1、引言

深度神经网络已成功证明在大规模数据集上学习视觉模型非常有效。迄今为止，在文献中，有各种数据集（例如，ImageNet [26]和COCO [14]），其中包括可用于开发深度模型以进行各种视觉任务的注释良好的图像，例如识别[8,27,29] ]，检测[6,24]，字幕[34]和语义分割[1,16]。然而，给定一个新的数据集，尽管付出了昂贵的努力和耗时的过程，但典型的解决方案仍然是执行密集的手动标记。另一种方法是利用大部分可从计算机游戏中获得的合成数据[25]，并且可以自动生成 ground truth。然而，许多先前的经验也表明，重复应用在合成数据上学习的模型可能会损害实际数据中的性能，这是由于称为“域移位（domain shift）”的现象[35]。以图1（a）中的真实街景视频中的一帧的分割结果为例，对来自视频游戏的合成数据进行训练的模型无法将场景正确地分割为语义类别，例如道路，人和车。结果，在解决该挑战时需要无监督的域自适应，其旨在利用来自源域的标记示例和目标域中的大量未标记示例来减少目标数据上的预测误差。

图1.街景视频中一个示例帧的语义分段：（a）直接应用在视频游戏中训练的FCN和（b）FCAN在这项工作中的域适应。

无监督域自适应的一般做法是通过最小化domain shift度量来建立跨域的不变性，例如相关距离[28]或最大均值差异[32]。我们从appearance-level和representation-level不变性的角度考虑问题。appearance-level不变性的目标是将一个域中的图像内容与来自另一个域的“style”重新组合。因此，两个域中的图像看起来好像是从同一域中绘制的。换句话说，视觉外观往往是域不变的。representation-level不变性的灵感来自域适应的对抗性学习的进步，即通过关于域鉴别器的对抗性目标来模拟域分布。背后的核心来自生成性对抗性学习[7]，它通过将它们相互对抗来训练两个模型，即生成模型和判别模型。在域适应的背景下，这种对抗性原则等同于指导两个域中的表示学习，使源域和目标域表示分布之间的差异通过域鉴别器无法区分。我们遵循这个准则，并利用对抗机制来学习跨域不变的图像表示。在这项工作中，我们特别研究了语义分割任务中的域自适应问题，该任务依赖于可能最准确的像素级注释。

通过将appearance-level和representation-level不变性的概念合并到无监督域自适应中以增强语义分割，我们提出了一种新颖的全卷积自适应网络（FCAN）架构，如图2所示。整个框架由图像域适应网络（ AAN）和特征自适应网络（RAN）。理想地，AAN将构建捕获源图像中的高级内容和目标域的低级像素信息的图像。具体地，AAN以白噪声图像开始并通过使用梯度下降来调整输出图像以最小化输出图像的特征图与源图像的特征图之间的欧几里德距离或目标域中的图像的平均特征图。在RAN中，首先使用共享全卷积网络（FCN）在每个域中产生图像表示，然后进行双线性插值以对输出进行上采样以进行像素级分类，同时使用域鉴别器来区分源域和目标域。特别设计了一种Atrous空间金字塔池（ASPP）策略，以扩大特征映射中的滤波器的视野，并赋予域鉴别器更多的功率。通过优化两个损失来训练RAN，即，分类损失以测量像素级语义和对抗性损失，以最大限度地利用学习的源和目标表示来欺骗域鉴别器。通过appearance-level和representation-level的调整，我们的FCAN可以更好地构建跨域的不变性，从而在图1（b）中获得令人鼓舞的分割结果。

这项工作的主要贡献是全卷积自适应网络的提议，用于解决域适应背景下的语义分割问题。该解决方案还为跨域应该建立什么样的不变性以及如何在深度学习框架中建模域不变性提供了特殊的角度，特别是对于语义分割的任务，这些是文献中尚未完全理解的问题。

2、相关工作

我们简要地将相关工作分为两类：语义分割和深度域适应。

语义分割是计算机视觉中最具挑战性的任务之一，其试图预测给定图像或视频帧的像素级语义标签。受全卷积网络（FCN）[16]的最新进展的启发，已有多种技术，包括多尺度特征集合（例如，扩张卷积[36]，RefineNet [13]，DeepLab [1]和HAZNet [ [33]）提出了背景信息保存（例如，ParseNet [15]，PSPNet [37]和DST-FCN [23]）。通过利用一些后处理技术（例如，条件随机场[38]），也可以改进原始的FCN公式。此外，由于大多数语义分割方法依赖于需要代价极大的标记工作的像素级注释，研究人员还努力利用弱监督（例如，实例级边界框[3]，图像级标签[22]）用于语义分割任务。为了实现这一目标，在文献中利用了诸如多实例学习[20]，EM算法[18]和约束CNN [19]等技术。 [10]中的替代方案利用来自辅助类别的像素级注释来将语义分割概括为仅有图像级标签可用的类别。这项工作的目标是研究可自由访问的合成数据的探索，注释和大部分未标记的实际数据，用于在像素级别上注释真实图像，这是一个新兴的研究领域。

深度域适应旨在将在标记源域中学习的模型转移到深度学习框架中的目标域。该主题的研究沿着三个不同的维度进行：无监督自适应，监督自适应和半监督自适应。无监督域自适应是指标记的目标数据不可用时的设置。深度相关对齐（CORAL）[28]利用最大均值差异（MMD）来匹配源和目标分布的均值和协方差。对抗性判别域适应（ADDA）[31]通过对抗性训练优化适应模型。相反，当标记的目标数据可用时，我们将该问题称为监督域适应。 Tzeng等。 [30]利用二元域分类器并设计域混淆损失以鼓励预测的域标签均匀分布。 Deep Domain Confusion（DDC）[32]应用MMD以及源上的常规分类丢失来学习既有区别又有域不变的表示。此外，还提出了半监督域适应方法，其利用标记和未标记的目标数据。深度适应网络（DAN）[17]将所有任务特定层嵌入到再生内核Hilbert空间中。考虑半监督和无监督设置。

总之，我们在本文中的工作主要集中在语义分割任务的无监督自适应，这很少被研究。最密切相关的工作是FCNWild [9]，它通过仅利用对域适应的全卷积对抗训练来解决跨域分割问题。我们的方法与[9]的不同之处在于，我们从appearance-level和representation-level域适应的角度解决了domain shift，这以更有原则的方式弥合了域间隙。

3、用于语义分割的全卷积自适应网络（FCAN）

图2.完全卷积自适应网络（FCAN）架构的概述。它由两个主要部分组成：左侧的图像域适应网络（AAN）和右侧的特征适应网络（RAN）。 AAN将图像从一个域转移到另一个域，因此视觉外观往往是域不变的。 RAN通过最大限度地利用学习的源和目标表示来欺骗域鉴别器，以对抗方式学习域不变表示。特别设计了扩展的Atrous空间金字塔池（ASPP）层，以利用不同尺度的区域来增强辨别能力。 RAN通过源图像上的监督分割Loss和对抗Loss进行联合优化。

在本节中，我们提出了我们提出的用于语义分割的完全卷积自适应网络（FCAN）。图2说明了我们框架的概述。它由两个主要部分组成：图像域适应网络（AAN）和特征适应网络（RAN）。给定来自两个域的输入图像，首先利用AAN从visual appearance的角度将图像从一个域转移到另一个域。通过重新组合一个域中的图像内容
从另一个“style”来看，visual appearance往往是域不变的。我们将从源到目标的转换作为本节中的示例，其他选项将在我们的实验中详细说明。另一方面，RAN以对抗方式学习域不变表示，并且设计域判别器以对与特征映射中的每个空间单元的感受域对应的图像区域来自哪个域进行分类。 RAN的目标是指导两个域中的表示学习，使源和目标表示通过域判别器无法区分。因此，我们的FCAN从appearance-level和representation-level域不变性的角度解决了域适应问题，并且可能更有效地消除域移位的影响。

3.1、图像域适应网络（AAN）

AAN的目标是使来自不同域的图像在视觉上相似。换句话说，AAN尝试使源图像适应，就好像从目标域中绘制一样。为了实现这一点，目标域中所有图像的低级特征应该被分离并被视为目标域的“style”，因为这些特征编码图像的低级形式，例如纹理，光照和阴影。相反，应该提取源图像中的对象及其关系方面的高级内容，并将其与目标域的“style”重新组合以产生自适应图像。

图3.外观适应网络（AAN）的体系结构。给定目标图像集 $X_t$ 和一个源图像 $x_s$ ，我们从白噪声图像开始并将其调整为自适应图像 $x_o$ ，其看起来好像是从目标域绘制但在源图像中包含语义内容。预训练的CNN用于提取特征图。通过最小化 $x_s$ 和 $x_o$ 的特征映射之间的距离来保留 $x_s$ 的高级图像内容，而通过最小化 $x_o$ 和 $X_t$ 的特征相关之间的距离来保持目标域的样式。

图3说明了AAN的体系结构。给定目标域中的一组图像 ${\Bbb X}_t = \left\{ x^i_t \mid i = 1，\dots ，m \right\}$ 和来自源域 $x_s$ 的一个图像，我们从白噪声图像开始并使用 $x_s$ 的语义内容加上 ${\Bbb X}_t$ 的“风格”迭代地渲染该图像产生自适应图像 $x_o$ 。具体地，利用预训练的CNN来提取每个图像的特征图。假设CNN中的每个卷积层 $l$ 具有 $N_l$ 个特征图，其中 $N_l$ 是信道的数量，并且每个特征图的大小是 $H_l × W_l$ ，其中 $H_l$ 和 $W_l$ 分别表示图的高度和宽度。这样， $l$ 层中的特征图可以表示为 $M^l \in {\Bbb R}^{N_l×H_l×W_l}$ 。基本上，不同卷积层中的激活表示不同语义级别的图像内容，其中较深层表示较高级别语义。为了更好地管理源图像 $x_s$ 中的语义内容，将不同的权重分配给不同的层以反映每个层的贡献。然后将目标函数表示为
$\min_{x_o} \sum_{l \in L} w^l_s Dist(M^l_o , M^l_s)$
其中 $L$ 是要考虑用于测量的一组层。 $w^l_s$ 是图层的权重， $M^l_o , M^l_s$ 是 $x_o$ 和 $x_s$ 上 $l$ 层的特征图。通过最小化方程（1）中的欧几里德距离，期望 $x_s$ 中的图像内容保留在自适应图像 $x_o$ 中。

接下来，一个图像的“风格”通常被视为一种统计测量或模式，它与空间信息无关[4]。在CNN中，这种统计测量之一是不同特征图之间的相关性。因此，可以通过计算 $l$ 层上的图像 $G^l$ 的“样式”
$G^{l,ij} = M^{l,i} \bigodot M^{l,j}$
$G^{l,ij}$ 是 $M^l$ 的矢量化第 $i$ 和第 $j$ 个特征图之间的内积。在我们的例子中，我们通过对目标域中的所有图像求平均值，将一个图像的“style”扩展到一个域（目标域的 ${\overline G}^l_t$ ）的“style”。为了将目标域的“style”合成为 $x_o$ ，我们将每个层中的目标表示为
$\min_{x_o} \sum_{l\in L}w^l_t Dist(G^l_o , {\overline G}^l_t)$
$w^l_t$ 是 $l$ 层的权重。最后，要最小化的整体损失函数 ${\Bbb L}_{AAN}$ 是
${\Bbb L}_{AAN}(x_o) = \sum_{l\in L}w^l_o Dist(M^l_o , M^l_s) + \alpha \sum_{l\in L}w^l_t Dist(G^l_o , {\overline G}^l_t)$
其中 $\alpha$ 是平衡源图像中的语义内容和目标域的样式的权重。在训练中，类似于[5]，AAN通过反向传播从等式4导出的梯度来调整输出图像到 $x_o$ , 导致域不变的外观。

3.2、特征适应网络（RAN）

使用特征适应网络，来自不同域的图像似乎来自同一个域。为了进一步减少域转移的影响，我们尝试学习域不变特征。因此，特征适应网络（RAN）旨在适应跨域的表示特征，这是从对抗性学习的概念中得出的[7]。我们的RAN中的对抗原则等同于通过使用学习的源和目标表示特征来欺骗域判别器 $D$ 来指导两个域中的表示特征的学习。具体而言，RAN首先利用共享的完全卷积网络（FCN）从两个域通过AAN提取图像或自适应图像的表示特征。此FCN模型的 $F$ 旨在学习跨两个域的无法区分的图像表示特征。此外，判别器D试图区分源域表示特征和目标域表示特征，其输出是对应于最终特征映射中的空间单元的每个图像区域的域预测。形式上，给定源域中的训练集 ${\Bbb X}_s = \left\{ x^i_s \mid i = 1，\dots ，n \right\}$ 和目标域中的 ${\Bbb X}_t = \left\{ x^i_t \mid i = 1，\dots ，m \right\}$ ，对抗性损失 ${\Bbb L}_{adv}$ 是所有空间单位的平均分类损失，其表示为
${\Bbb L}_{adv}({\Bbb X}_s,{\Bbb X}_t) = -E_{x_t \sim {\Bbb X}_t}[\frac{1}{Z}\sum^Z_{i=1}\log (D_i(F(x_t)))] -E_{x_s \sim {\Bbb X}_s}[\frac{1}{Z}\sum^Z_{i=1}\log (1 - D_i(F(x_s)))]$
其中 $Z$ 是 $D$ 输出中空间单位的数量。与标准GANs类似，我们的RAN的对抗训练是优化以下最小极大函数
$\max_F \min_D {\Bbb L}_{adv}({\Bbb X}_s , {\Bbb X}_t)$
鉴于实际数据中存在许多不同大小的不同对象，我们进一步考虑利用多尺度表示来增强对抗性学习。一种传统的多尺度策略是使用多种分辨率调整图像大小，这确实提高了性能但是以大量计算为代价。在这项工作中，我们扩展了Atrous空间金字塔池（ASPP）[1]来实现这一点，如图2所示。具体而言，并行利用具有不同采样率的k个扩张卷积层，以独立地在FCN的输出上产生k个特征表示，每个具有c个特征信道。然后将所有特征通道堆叠起来以形成具有 $c k$ 通道的新特征图，接着是 $1 \times 1$ 卷积层加上sigmoid层以生成最终得分图。分数图中的每个空间单元呈现属于目标域的对应图像区域的概率。此外，我们同时优化标准像素级分类损失 ${\Bbb L}_{seg}$ ，用于来自源域的图像的监督分割，其中标签可用。因此，RAN的总体目标是将 ${\Bbb L}_{seg}$ 和 ${\Bbb L}_{adv}$ 整合为
$\max_F \min_D \left\{ {\Bbb L}_{adv}({\Bbb X}_s , {\Bbb X}_t) - \lambda {\Bbb L}_{seg} ({\Bbb X}_s \right\}$
其中 $\lambda$ 是权衡参数。通过使用源和目标表示来欺骗域鉴别器，我们的RAN能够产生域不变表示。在测试阶段，将目标域中的图像馈送到学习的FCN中以产生用于像素级分类的表示.

4、实施

4.1 图像适应

我们采用预先训练的ResNet-50 [8]架构作为基本CNN。特别是，我们只在该组中包括五个卷积层，即$ L = {conv1，res2c，res3d，res4f，res5c} $，因为这些层的表示通常在每个比例中具有最高的能力。源域和目标域中的图像的层的权重通常根据自适应图像的视觉外观来确定。另外，在优化公式 (4) 时，一个常见的问题是需要设置权衡参数 α 来平衡内容和 “ s t y l e ” 。由于最终目标是语义地分割图像中的每个像素，因此需要精确地保留语义内容。结果， “ s t y l e ” 的影响被认为仅仅是调整外观的 “ d e l t a ” 函数，并且为此目的我们凭经验设定了$ α= 10^{-14}$的小权重。最大迭代次数 $I$ 固定为 $1 k$ 。在每次迭代 $i$ 中，图像 $x_o$ 由更 $x^{i-1}_o - w^{i-1}\frac{g^{i-1}}{\mid\mid g^{i-1} \mid\mid_1}$ 新，其中 $g^{i-1} = \frac{\partial {\Bbb L}_{app}(x^{i-1}_o)}{\partial x^{i-1}_o} , w^{i-1} = \beta \frac{I-i}{I} , and \quad \beta = 10$ 。

4.2、特征适应

在我们的实现中，我们使用源自ResNet-101 [8]的扩张完全卷积网络[1]作为我们的FCN，已经证明它可以有效地生成语义分割的强大表示。最后一个卷积层的特征图（即res5c）被送到分割和对抗分支。在监督分割分支中，我们还使用金字塔池[37]扩充FCN的输出，以将上下文先验集成到表示特征中。在对抗分支中，我们并行使用 $k = 4$ 个扩张的卷积层来产生多个特征图，每个特征图具有 $c = 128$ 个通道。不同扩张卷积核的采样率分别为 $1, 2, 3 和 4$ 。最后，在ASPP旁边使用sigmoid层来输出预测，其范围为 $[0, 1]$ 。

4.3、训练策略

我们的建议是在Caffe [12]框架上实现的，并且利用小批量随机梯度下降算法来优化模型。我们在源域上预先训练只有分割Loss的RAN。初始学习率为 $0.0025$ 。与[1]类似，我们使用功能固定为 $0.9$ 的“多边”学习率政策。动量和重量衰减分别设定为0.9和0.0005。 bitch大小为6。最大迭代次数为 $30 k$ 。然后，我们与分割Loss和对抗Loss一起微调RAN。权衡参数 $\lambda$ 设置为 $5$ 。初始学习率为 $0.0001$ 。 bitch大小为 $8$ ，最大迭代次数为 $10 k$ 。其余的超参数与训练前的参数相同。

5、实验

5.1、数据集

我们对来自GTA5 [25] (游戏视频)数据集到城市景观(城市街景)数据集[2]的域适应性FCAN进行了全面评估。

GTA5数据集包含来自游戏侠盗猎车手V(GTA5)的24,966个图像(视频帧)，并且还创建了每个图像的像素级ground truth。在游戏中，图像被捕获在洛桑桑托斯的虚拟城市，该城市起源于洛杉矶市。每个图像的分辨率为1914×1052。有19个类,与室外场景(例如，城市景观)的其他分割数据集兼容并且在评估中使用。 Cityscapes数据集是城市街景的语义理解的一个流行基准，其中包含从50个不同城市的街景中收集的5,000个图像(帧)的高质量像素级注释。图像分辨率为2048×1024。遵循分割任务中的标准协议(例如，[2])，使用19个语义标签(汽车，道路，人，建筑物等)进行评估。在两者之间，训练，验证和测试集分别包含2,975,500和1,525帧。按照[9,21]中的设置，仅使用验证集(500帧)来验证我们实验中的无监督语义分段。

此外，我们还将伯克利深度驾驶分段(BDDS)数据集[9]作为另一个目标领域，用于验证我们的FCAN的优点。 BDDS数据集由数千个带有像素级注释的dashcam视频帧组成，它们与Cityscapes共享兼容的标签空间。图像分辨率为1280×720。按照[9,21]中的设置，使用1,500帧进行评估。

在所有实验中，我们采用每个类别的联合交叉(IoU)，并将所有类别的IoU表示为性能指标。

5.2、评估AAN

我们首先从两个方面检验AAN对语义分割的有效性：1）AAN调整域的图像，2）仅通过执行AAN或加RAN进行自适应。源自适应（Src Ada）这里是使用目标域的“style”渲染源图像，反之亦然，用于目标自适应（Tar Ada）。

FCN是指通过直接利用源域上学习的FCN对目标图像进行预测来设置语义分段。相比之下，RAN进一步通过我们的RAN执行representation-level适配。

表1.使用AAN的不同方式之间的mIoU性能比较。

Train	Validation	FCN	RAN
Src	Tar	29.15	44.81
Src	Tar Ada	34.68	45.03
Src Ada	Tar	31.71	46.21
Src Ada	Tar Ada	36.25	45.59
Late Fusion	Late Fusion	37.61	46.60

表1总结了不同利用AAN的方式之间的mIoU性能。总体而言，通过AAN + RAN在源域中调整图像的最高mIoU为46.21％。将AAN应用于源或目标或两个域中的图像的结果始终表现出比在不使用AAN（第一行）时直接在分段中使用FCN的设置更好的性能。结果基本上表明了探索appearance-level域适应的优势。 RAN进一步改善了每个环境中的表现，表明appearance-level和representation-level适应是相互补充的。另一个观察结果是，当在源图像上执行AAN时，RAN的性能增益趋于变大。然而，当通过AAN调整目标图像时，增益降低。我们推测这可能是AAN将一些噪声合成到适应的目标图像中的结果，特别是在物体的边界处，这反过来影响了分割的稳定性。此外，当融合通过四种设置预测的分割的分数图时，mIoU性能可以提升至46.6％。除非另有说明，否则我们在以下评估中将此融合版本称为AAN。

图4.通过AAN进行外观级别调整的示例。

图4分别显示了源域和目标域中图像的appearance-level传输的四个示例。如图所示，原始图像中的语义内容都在自适应图像中得到很好的保存。当使用Cityscapes的“style”在GTA5中渲染图像时，图像的整体颜色变得暗淡并且颜色饱和度趋于低。相反，当反转传输方向时，Cityscapes中的图像颜色变得更亮，并且具有高饱和度。结果表明两者之间具有良好的appearance-level转移。

5.3、FCAN的消融研究

接下来，我们将研究FCAN中的每个设计如何影响整体性能。自适应批量归一化（ABN）简单地将源域中学习的FCN中的BN层的均值和方差替换为在目标域中的图像上计算的BN层的均值和方差。对抗域适应（ADA）利用对抗性训练的思想来学习域不变表示，域判别器在图像级别上判断域。当扩展域判别器以对每个图像区域进行分类时，该设计被命名为Conv。 ASPP进一步扩大了过滤器的视野，以增强对抗性学习。 AAN是我们的appearance-level改编。

图5. Cityscapes中语义分割结果的示例。给出了FCAN不同阶段的原始图像，基本事实和比较分割结果。

表2. FCAN中每个设计的性能贡献。

Method	ABN	ADA	Conv	ASPP	AAN	mIoU
FCN						29.15
+ABN	√					35.51
+ADA	√	√				41.29
+Conv	√	√	√			43.17
+ASPP	√	√	√	√		44.81
FCAN	√	√	√	√	√	46.60

表2通过考虑FCAN中每个阶段的域适应的另一个因素来详细说明mIoU的改进。无论域适应框架如何，ABN都是减轻域移位的一般方法。在我们的案例中，ABN成功地将mIoU表现从29.15％提高到35.51％。这表明ABN是一种非常有效和实用的选择。 ADA，Conv和ASPP是我们RAN中的三种特定设计，每种设备的性能增益分别为5.78％，1.88％和1.64％。换句话说，我们的RAN导致总体性能提升了9.3％。结果验证了representation-level适应的思想。 AAN进一步增加了mIoU 1.79％，FCAN的mIoU性能最终达到46.6％。图5展示了我们FCAN不同阶段的四个语义分段结果示例。如图所示，随着包括更多适应设计，分割结果变得越来越准确。例如，在早期阶段，诸如道路和天空等大多数类别都不能很好地分割。相反，在后面的步骤中，即使是自行车和卡车等少数类别也能很好地进行细分。

5.4、与最先进的技术进行比较

表3.与Cityscapes上最先进的无监督域自适应方法的性能比较。

Method	mIoU
DC [30]	37.64
ADDA [31]	38.30
FCNWild [9]	42.04
FCAN	46.60
FCAN(MS)	47.75

我们与几种最先进的技术进行比较。域混淆[30] (DC)通过域混淆丢失来对齐域，域混淆丢失被优化以学习跨不同域的统一分布。 Adversarial Discrimtivetive Domain Adaptation [31] (ADDA)结合了解开的权重分享和对抗性学习，用于歧视性特征学习。 FCNWild [9]采用完全卷积对抗训练来进行语义分割领域的自适应。为了公平比较，所有方法中使用的基本FCN源自ResNet-101。性能比较总结在表3中。与DC和ADDA相比，其中域判别器都是在图像级别（image level）上设计的，FCNWild和FCAN在区域级别（region level）上执行域对抗性学习表现出更好的性能。此外，FCAN通过额外纳入ASPP策略和AAN的强化，导致了对FCNWild的明显改进。多尺度(MS)方案将mIoU性能提升至47.75％。图6详细介绍了不同类别的性能。我们的FCAN在19个类别中的17个中实现了最佳性能，这在经验上验证了我们的模型在类别级别上的有效性。

图6.不同方法的每类IoU性能和所有19个类别的平均mIoU性能。

图7.语义分割结果和域判别器的预测图的示例，其中亮度指示属于目标域的区域的高概率。

为了检查在FCAN中学习的域鉴别器，图7示出了四个图像示例，包括原始图像，它们的ground truth，FCAN的分割结果和域判别器的预测图。亮度表示该区域具有高概率属于目标域。让我们回想一下，对抗性学习是最大限度地欺骗域判别器。这意味着理想情况下目标域中图像的预测图应该是暗的。例如，域判别器错误地预测前两个图像中红色边界框中的区域，这表明这些区域上的表示倾向于难以区分。因此，这些区域(天空)由FCAN精确分割。相反，域判别器正确地预测最后两个图像中的区域，表明区域表示仍然依赖于域。因此，对这些区域(自行车)的分割结果并不那么好。

5.5、半监督适应

表4.城市景观的半监督适应结果。

# of images	FCN (On Cityscapes)	FCAN (Semi-supervised)
0	-	46.60
50	47.57	56.50
100	54.41	59.95
200	59.53	63.82
400	62.53	66.80
600	65.39	67.58
800	67.01	68.42
1000	68.05	69.17

实践中的另一个常见情况是目标域中存在少量标记的训练示例。因此，我们将FCAN扩展为半监督版本，将城市景观的训练集作为标记数据Xtl。从技术上讲，进一步考虑了目标域中图像的像素级分类损失，然后方程（7）中的总体目标变为 $\max_F \min_D \left\{ {\Bbb L}_adv({\Bbb X}_s , {\Bbb X}_t) - \lambda_s{\Bbb L}_{seg}({\Bbb X}_s) - \lambda_t{\Bbb L}_{seg}({\Bbb X}^l_t) \right\}$ 。表4显示了mIoU表现随着来自目标域的标记训练数据的增加。值得注意的是，FCN直接在目标域中的标记数据上学习，FCAN指的是我们的半监督版本。正如预期的那样，如果在训练中仅包含目标域中的几百个图像，则FCAN的性能增益往往很大。当增加Cityscapes的图像数量时，增益会逐渐降低。即使数量达到1k，我们的半监督FCAN仍然略好于受监督的FCN。

5.6、BDDS的结果

图8. BDDS中语义分段结果的示例。

表5.对BDDS的不同无监督域适应方法的比较。

Method	mIoU
FCNWild [9]	39.37
FCAN	43.35
FCAN(MS)	45.47
FCAN(MS+EN)	47.53

除Cityscapes数据集外，我们还将BDDS作为目标域来评估我们的FCAN的无监督设置。表5总结了性能比较。特别是，FCAN的mIoU性能达到43.35％，比FCNWild提高了3.98％。多尺度设置，即FCAN（MS），将性能提高到45.47％。最后，通过融合来自ResNet-101，ResNet-152和SENet [11]的模型，集合版本FCAN（MS + EN）可以将mIoU提高到47.53％。图8显示了BDDS中的三个语义分段示例，它们分别由FCN和FCAN输出。显然，FCAN获得了更有希望的分割结果。即使在天空中的反射（第二行）或云（第三行）的补丁的情况下，我们的FCAN也可以很好地分割天空。

6、结论

我们提出了完全卷积自适应网络（FCAN）架构，该架构探索了语义分割的域自适应。特别是，我们从appearance-level和representation-level适应的角度研究问题。为了验证我们的结论，我们已经在我们的FCAN中分别为每个目的设计了图像适应网络（AAN）和特征适应网络（RAN）。 AAN是在一个域中使用来自另一个域的“style”域渲染图像，从而导致跨两个域的外观不变。 RAN旨在以域对抗的方式指导表示特征学习，理想情况下输出域不变表示。从游戏视频（GTA5）转移到城市街景场景（Cityscapes）的实验验证了我们的建议和分析。更值得注意的是，我们在将游戏视频传输到驱动器 - 凸轮视频（BDDS）时实现了最先进的性能。我们未来可能的工作包括两个方向。首先，将在AAN中研究使用另一种统计模式渲染图像的语义内容的更高级技术。其次，我们将进一步将我们的FCAN扩展到其他特定的分割场景，例如室内场景分割或纵向分割，其中可以容易地生成合成数据。

你可能感兴趣的:(深度学习)

国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【深度学习】DeepSeek模型介绍与部署 Nerous_ 深度学习深度学习人工智能
原文链接：DeepSeek-V31.介绍DeepSeek-V3，一个强大的混合专家(MoE)语言模型，拥有671B总参数，其中每个token激活37B参数。为了实现高效推理和成本效益的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。此外，DeepSeek-V3首次提出了无辅助损失的负载平衡策略，并设置了多to
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option