零尾

论文笔记8 --（ReID）Camera Style Adaptation for Person Re-identification

《Camera Style Adaptation for Person Re-identification》
论文：https://arxiv.org/abs/1711.10295v1

Abstract

作为一项跨相机检索任务，由于摄像机的不同，person re-id会收到图像风格变化的影响。在以往的方法中，网络去潜在的学习不受相机风格影响的特征，而本文提出一个camera style (CamStyle) adaptation方法来解决这个问题。CamStyle可以作为一种数据增强方法来平滑相机风格的差异。利用CycleGAN，标注的训练图像可以被转换成每个相机的风格，并与原始训练样本一起形成增强训练集。这种方法提高了数据多样性以防拟合，但也会产生相当大的噪声。为了减轻噪声的影响，作者提出了label smooth regularization (LSR)的方法来缓解。

1. Introduction

Person re-id[37]是一项跨摄像头检索任务。给定一个感兴趣的查询人员，它的目标是从从多个摄像头收集的数据库中检索同一个人。在这个任务中，一个人的形象在外观和背景上经常发生比较大的变化。通过不同的相机拍摄图像是造成这种变化的主要原因（图1）。通常，摄像头在分辨率、环境光照等方面会彼此不同。

在解决相机变化的挑战时，以前的论文选择了一种隐含策略。即就是学习在不同相机下具有不变性的稳定特征表示。传统方法中的例子有：KISSME [13]，XQDA [17]，DNS [34]等。深度表示学习方法的例子有IDE [37]，SVDNet [24]，TripletNet [8]等。

与以往的方法相比，本文从相机风格适应的角度出发，提出了一种明确的策略。在基于深度学习的person re-id中，我们主要是受到大数据量需求的推动。为了学习对相机变化具有鲁棒性的能力，标注大型数据集是非常有用的，但却很昂贵。不过，如果我们可以向训练集中添加更多的样本，以了解摄像头之间的样式差异，我们就能够1）解决person re-id中的数据稀缺问题，2）学习不同摄像头之间的不变特性。最好是这个过程不用再花费任何人工标注，从而保持低预算。

基于以上讨论，我们提出了一种camera style (CamStyle) adaptation方法来规范person re-id的CNN训练，在vanilla版本中，我们使用CycleGAN[41]学习每个相机对的image-image translation模型。利用学习好的CycleGAN模型，对于某个相机拍摄的训练图像，我们可以生成其他相机风格的新训练样本。通过这种方式，训练集是原始训练图像和风格转换图像的组合。风格转换的图像可以直接从原始训练图像借用标注信息。在训练中，我们按照[37]中的baseline model，使用新的训练集进行训练。Vanilla方法有助于减少过拟合并学到相机的不变性，但它也会给系统带来噪声（图2）。在全相机系统（full-camera systems）下，噪声问题盖过了它所带来的收益。为了缓解这一问题，在改进版本中，进一步对风格转换样本应用LSR[25]，以便在训练中对其标签进行培训期间对其labels进行柔和分布（softly distributed）。

本文提出的相机风格自适应方法CamStyle有三个优点：
首先，它可以被视为一个数据增强方案，以平滑相机风格的差异。它减少了CNN过度拟合的影响。
第二，通过整合相机信息，它有助于学习具有相机不变性的行人特征。
最后，它是无监督的，由CycleGAN保证，有很好的应用潜力。
综上所述，本文有以下贡献：

用于re-id数据增强的普通相机风格转换模型。在少数相机系统中，提升可达到17.1%；
在re-id训练中，对风格转换后的样本进一步应用LSR。在全相机系统中，观察到一致的提升。

2. Related Work

Deep learning person re-identification.
很多深度学习方法[33，30，29，3，20]已经在person re-id中被提出。在[33]中，输入图像对分别被分成三个重叠的水平部分，并通过一个siamese CNN模型使用余弦距离来学习它们的相似性。后来，Wu等人[30]通过使用较小的卷积核来增加网络的深度，以获得鲁棒性特征。此外，Varior等人[29]将long short-term memory (LSTM)模型合并到一个可以连续处理图像部分的连体网络中，以便记忆空间信息，以提高深层特征的识别能力。

另一个有效的策略是分类模型，它充分利用了re-id labels[37、31、24、15、23]。Zheng等人[37]提出ID-discriminative embedding (IDE) 训练re-id模型作为图像分类，其从ImageNet[14]预训练模型进行微调。Wu等人[31]通过将手工制作的特征合并到CNN特征中，提出特征融合网络Feature Fusion Net (FFN)。最近，Sun等人[24]使用奇异向量分解迭代地优化FC特征并生成正交权重。

当CNN模型与训练样本数量相比过于复杂时，可能会发生过拟合。针对这一问题，提出了几种数据增强和正则化方法。在[19]中，Niall等人利用背景和线性变换生成各种样本，提高网络的泛化程度。最近，Zhong等人[39]随机擦除输入图像中的矩形区域，这防止模型的过拟合并使模型对遮挡具有鲁棒性。Zhu等人[40]从独立的数据集中随机选择假阳性样本（PseudoPositive samples）作为额外的训练样本来训练re-id CNN，以降低过拟合的风险。更多与此工作相关的，Zheng等人[38]使用DCGAN[21]生成未标记的样本，并为它们分配统一的标签分布以规范网络。与[38]相比，本文工作中的风格转换样式样本是从具有相对可靠标签的真实数据生成的。

Generative Adversarial Networks.
生成对抗网络Generative Adversarial Networks（GANs）[6]近年来取得了令人瞩目的成功，特别是在图像生成方面[21]。最近，GANs还被应用于图像到图像的转换image-to-image translation[10，41，18]，风格转换style transfer[5，11]和跨域图像生成cross domain image generation[2，26]。Isola等人[10]应用条件GANs来学习从输入到输出图像的映射，以便图像到图像的转换应用。[10]的主要缺点是它需要成对的相应图像作为训练数据。为了解决这一问题，Liu和Tuzel[18]提出了一种耦合生成对抗网络（CoGAN），通过使用权重共享网络来学习跨域的联合分布。最近，CycleGAN[41]在[10]中引入了基于“pix2pix”框架的循环一致性，以学习没有成对样本的两个不同域之间的图像转换。风格转换和跨域图像生成也可以看作是图像到图像的转换，其中输入图像的风格（或域）在保留原始图像内容的同时被转换到另一个风格（或域）。在[5]中，通过对图像的内容和风格进行分离和重组，引入了一种风格转换方法。Bousmalis等人[2]引入无监督的GAN框架，将图像从源域转换到目标域中的模拟图像。相似性，在[26]中，Domain Transfer Network (DTN)是在保留原始身份的同时，通过合并多类GAN loss来生成unseen domain的图像。与以前主要考虑生成样本质量的方法不同，本工作的目的是使用风格转换样本来提高re-ID的性能。

3. The Proposed Method

在本节中，我们首先简要回顾3.1节中的CycleGAN[41]。然后，我们将在第3.2节中使用CycleGAN描述camera-aware数据生成过程。LSR的baseline和训练策略分别在第3.3节和第3.4节中描述。总体框架如图3所示。

3.1. CycleGAN Review
给定两个来自两个不同域的数据集A和B， $x_{i}\in A$ ， $y_{i}\in B$

CycleGAN的目标是学习映射函数，G:A→B使得G(A)的图像分布和B的图像分布是难以区分的。CycleGAN包含两个映射函数G:A→B和F:B→A，同样，F:B→A使得F(B)与A的分布类似。 $D_{A}$ 和 $D_{B}$ 是对抗判别器。CycleGAN应用GAN框架来共同训练生成和判别模型。整个CycleGAN损失函数为：

其中， $V_{GAN}$ 映射函数和判别器的损失函数， $V_{cyc}(G,F)$ 是循环一致性损失，使得F(G(x))约等于x和G(F(y))约等于y,也就是说每个图片经过循环映射能够得到恢复。λ是 $V_{GAN}$ 和 $V_{cyc}$ 之间重要性的惩罚项。更多关于CycleGAN的细节见[41]。

3.2. Camera-aware Image-Image Translation
本文使用CycleGAN生成新的训练样本：不同相机风格的图片被认为是不同的域domains。通过CycleGAN，本文对每对相机学习一个图像到图像的模型。为了保持输入输出图片颜色的一致性，在公式（1）中加入了identity mapping loss[41]，使得生成器在使用目标域的真实图片作为输入时，能够近似于identity mapping。identity mapping loss可以表示为：

具体的，对于训练图片，使用CycleGAN对每对相机生成camera-aware风格转换模型。按照[41]中的训练策略，所有图片被resize到256×256。我们使用与CycleGAN相同的架构来实现camera-aware风格转换网络。包含9个残差块和4个卷积，判别器discriminator为70×70PatchGANs[10]。

使用学习的CycleGAN模型，对于每个相机下的训练图片，我们生成L-1个新的训练图片，其风格和对应相机相似（如图2所示），并将生成的图像称为style-transferred image或fake image。通过这种方式，训练集被增强为原始图像和风格转换图像的组合。由于每个风格转换的图像保留了原始图像的内容，因此新样本与原图像是相同的标签。

Discussions
如图4所示，所提出的数据增强方法的工作机制主要包括：

real images和fake (style-transferred) images之间的相似数据分布；
保留fake images的ID标签。一方面，fake填补了real数据点之间的空白，并在特征空间中略微扩展了类边界。这保证了在嵌入学习期间，增强的数据集通常支持更好地描述类分布。另一方面，支持使用监督学习supervised learning[37]，这是一种不同于[38]的机制，它利用未标记的GAN图像进行正则化。

3.3. Baseline Deep Re-ID Model
将real images和fake images作为输入，使用ID-discriminative embedding (IDE)[37]训练模型。使用Softmax loss，IDE将re-ID训练视为图像分类任务。网络如图3所示。所有输入图像resize为256×128。使用ResNet-50[7]作为主干，并遵循[37]中的训练策略对ImageNet预训练模型进行微调。丢弃了最后的1000维分类层并添加了两个全连接层。第一个FC层“FC-1024”输出1024维，然后是bn[9]、relu和dropout[22]。添加“FC-1024”遵循[24]中的做法，从而提高了精度。第二个FC层的输出是C维的，其中C是训练集中的类数。

3.4. Training with CamStyle
本节讨论了使用CamStyle的训练策略。当我们同等看待real和fake时，方法叫vanilla version。另一方面，考虑fake带来的噪声问题，加入label smooth regularization (LSR)[25]，叫作full version。

Vanilla version
在vanilla版本中，新训练集中（real+fake）所有样本被同等看待，即每一个样本仅属于单个id。在训练中，在每个mini-batch中随机选取M个real images和N个fake images。损失函数为：

其中， $L_{R}$ ， $L_{F}$ 表示交叉熵损失cross-entropy loss，其可表示为：

其中，C是类的数量。p(c)是属于label c的输入的预测概率，p(c)由softmax归一化得到，

q(c)表示gt分布。因为每个人在新的训练集中只属于一个id。所以 q(c) 可被定义为：

因此交叉熵可以写为：

因为real和fake数据在分布上的相似性，在few cameras情况下，vanilla version能够提升baseline IDE正确率。

Full version
style-transferred images能够增加样本量，但也引入了噪声。在少数相机系统下，由于缺乏数据，所以vanilla version能够缓解过拟合。但在更多的相机下，数据足够多时，过拟合问题不再是主要问题了，风格转换带来的噪音问题开始出现。

转换噪声主要来源于：

CycleGAN并不是一个完美的转换模型，因此在图片生成过程中会发生错误；
由于本身的遮挡和检测错误，在real数据中存在噪音样本，转化这些噪音样本可能产生更多的噪音样本。

图4是real和fake数据在二维空间上的深层特征可视化的一些示例。大多数生成的样本分布在原始图像周围，当转换错误发生时（图4©、(d)），fake样本将是一个噪声样本并且远离真实分布。当real image是噪声样本时（图4(b)、(d)），它远离具有相同标签的图像，因此生成的样本也会产生噪声。

为了缓解这个问题，提出LSR[25]方法，对于生成了图片的label，加入一个平滑因子 $\varepsilon$ ，最终label为：

此时的交叉熵可以写为：

对于real images，不使用LSR，因为它们的标签本身能够正确匹配。同时实验也证明了full-camera系统下，在real images上添加LSR并不能提升表现（见4.4小节）。所以仅在style-transferred images上使用LSR，设置 $\epsilon=0.1$ ，loss为： $L_{F}=L_{LSR}(\epsilon=0.1)$

PS：其实就是加一个平滑因子 $\epsilon$ ，使得生成图像和原型图像是相同ID的概率接近于1但又不等于1。

Discussions
最近，Zheng等人[38]建议使用label smoothing regularization for outliers (LSRO)通过DCGAN[21]生成未标记样本。在[38]中，由于生成的图像没有标签，因此将均匀的标签分布分配给生成的样本，即 $L_{LSR}(\epsilon=1)$ 。与LSRO相比，本文系统有两个不同之处：

根据相机风格生成fake images。CycleGAN的使用确保了生成的图像仍然是人的主要特征（图5提供了一些可视化比较）。
本文系统中的标签更可靠。使用LSR来处理一小部分不可靠数据，而LSRO则用于没有标签可用的情况。

PS：图1（b）可以看到CycleGAN转化的结果，可以看到样本的Camera Style被迁移过去了。原来绿衣服的人迁移过去变成蓝色，但他们是同一个人，属于同一个id，外观不一样是因为相机所处的光线环境不一致。很显然，这种bias对Re-ID影响是很大的，而通过CycleGAN可以减小这种bias。

4. Experiment

4.1. Datasets
数据使用的是Market-1501[36]和DukeMTMC-reID[38]。

4.2. Experiment Settings
Camera-aware style transfer model
根据第3.2小节，分别为Market-1501和DukeMTMC-reID训练 $C^{2}_{6}=15$ 和 $C^{2}_{8}=28$ 的CycleGAN模型。在训练期间，将所有输入图像的大小resize为256×256，并使用Adam优化器[12]从头开始训练模型，λ=10。设置batch size=1，Generator的学习率learning rate=0.0002，Discriminator在前30个epoch学习率为learning rate=0.0001，其余20个epoch的学习率线性降为零。在camera-aware风格转换步骤中，每个训练图像生成L−1（Market-1501：5，DukeMTMC-reID：7）个fake训练图像。

Baseline CNN model for re-ID
遵循[37]中的训练策略来训练baseline。将所有图像resize为256×128。在训练过程中，对输入图像进行随机裁剪和水平翻转。dropout设为p=0.5。使用ResNet-50[7]作为主干backbone，其中第二个全连接层分别具有751和702个单元用于Market-1501和DukeMTMC-reID。batch size=128。对于resnet-50基础层，学习率从0.01开始，对于两个新添加的全连接层，学习率从0.1开始。学习率在40个epoch后除以10，总共训练了50个epoch。使用SGD来训练re-ID模型。在测试时，提取pool5层的输出作为图像描述符（2048-dim），并使用Euclidean计算图像之间的相似性。

Training CNN with CamStyle
training mini-batch中，随机选择样本比例设置为M:N=3:1，因为fake images的数量比real images多，因此在每个epoch中，我们使用所有的real images 并随机选取 $\frac{N}{M}×\frac{1}{L-1}$ 比例的fake images。

4.3. Parameter Analysis
CamStyle的参数 $\frac{M}{N}$ 对结果的影响如下图：

当在每个mini-batch中使用比real（M:N <1）更多的fake时，rank-1略微提高了1％。当M:N> 1时，rank-1有超过2％的提升。当M:N=3:1时，实现最佳性能。

4.4. Variant Evaluation
Baseline evaluation
为了充分展示CamStyle的有效性，本文的baseline系统分别由2、3、4、5、6号Market-1501相机和2、3、4、5、8号DukeMTMC-reID相机组成。例如，在一个有3个相机的系统中，训练和测试集都有3个相机。在图8中，随着相机数量的增加，rank-1准确率增加。这是因为：

有更多的训练数据可用
当数据库中存在更多ground truths时，更容易找到一个rank-1真实匹配。

在full-camera (6 for Market-1501 and 8 for DukeMTMC-reID)baseline系统中，在Market-1501上的rank-1为85.6%，在DukeMTMC-reID上的rank-1为72.3%。

Vanilla CamStyle improves the accuracy of few-camera systems
首先在图8和表1中评估vanilla方法（无LSR）的有效性。有两个观察结果。

首先，在有2个相机的系统中，Vanilla CamStyle比baseline CNN有显著提升。在Market-1501的2个相机数据下，提升幅度达到了+17.1%（从43.2%提高到60.3%）。DukeMTMC-reID的2个相机数据下，rank-1从45.3%提高到54.8%。这表明，由于缺乏训练数据，少量相机系统容易过拟合，且本文方法表现出很好的性能提升。
其次，随着系统中相机数量的增加，vanilla CamStyle的提升幅度越来越小。例如，在Market-1501上的6摄像头系统中，rank-1的提高仅为+0.7%。这表明：1）在整个系统中，过拟合问题变得不那么严重；2）CycleGAN带来的噪声开始对系统精度产生负面影响。

LSR is effective for CamStyle
如前文所述，当在具有3个相机的系统中进行测试时，Vanilla CamStyle相比2个相机系统实现的提升更少。图8和表1表明，在fake images上使用LSR loss实现了比交叉熵cross-entropy更高的性能。如表1所示，在Market-1501全相机系统下，使用风格转换数据的交叉熵将rank-1提高到86.31％。在fake数据上用LSR替换交叉熵将rank-1提高到了88.12％。
特别地，图8和表1显示仅在real data上使用LSR对full-camera系统没有太大帮助，甚至会降低性能。因此，具有LSR的CamStyle在baseline上的提升这一事实并不仅仅归因于LSR，而是LSR与fake images之间的相互作用。通过这个实现，证明了在fake images上使用LSR的必要性。

The impact of using different cameras for training camera-aware style transfer models
表2表明，使用更多的相机来训练camera-aware风格转换模型，rank-1从85.66%提高到了88.12%。特别是，即使只使用第1个和第2个相机来训练，本文方法也能获得rank-1 +1.54%的提升。此外，使用5个相机训练时，rank-1=87.85%，比使用6个低0.27%。这表明，即使使用一部分相机来训练camera-aware风格转换模型，本文方法也可以产生与所有相机大致相同的结果。

CamStyle is complementary to different data augmentation methods.
为了进一步验证CamStyle，将它与两种数据增强方法，随机翻转+随机裁剪（RF + RC）和随机擦除（RE）[39]进行比较。RF+RC是CNN训练中[14]的常用技术，用于提高图像翻转和目标转换的鲁棒性。RE旨在实现遮挡的不变性。
如表3所示，当不使用数据增强时，rank-1=84.15%。当仅使用RF+RC、RE、或CamStyle是，rank-1分别为85.66%、86.83%和85.01%。此外，如果将CamStyle与RF+RC或RE结合使用，相比单独使用，各种组合下都得到了提升。三种方法一起使用时，可以实现最佳性能。因此，虽然3种截然不同的数据增强方法都集中在CNN不变性的不同方面，但实验结果表明，CamStyle与其它两种方法完全互补。

4.5. Comparison with the state-of-the-art methods
表4、5中本文方法分别与Market-1501和DukeMTMC-reID上的最新方法进行了比较。首先，使用本文的baseline训练策略，作者在两个数据集上获得了强大的baseline(IDE*)。具体，IDE在Market-1501和DukeMTMC-reID上的rank-1分别为85.66%和72.31%。与已发布的IDE实现[24, 38, 37]相比，IDE在Market-1501上是最佳的rank-1。

然后，当在IDE*上应用CamStyle时，在Market-1501上rank-1=88.12%，比PDF[23]，TriNet[8]和DJL[16]更高，在DukeMTMC-reID上rank-1=75.27%。另一方面，mAP在Market-1501上比TriNet[8]略低0.42%，在DukeMTMC-reID上低于SVDNet[24]3.32%。

进一步将CamStyle与随机擦除RE数据增强相结合[39]（RF + RC已经在基线中实现），最终rank-1在Market-1501上为89.49％，在DukeMTMC-reID上为78.32％。

5. Conclusion

本文提出了CamStyle，一种用于深度person re-id的相机风格自适应方法camera style adaptation。使用CycleGAN为每对相机学习camera-aware风格转换模型，这些模型用于从原始图像生成新的训练图像。real images和style-transferred images构成了新的训练集。此外，为了减轻CycleGAN引起的噪声增加，在生成的样本上应用label smooth regularization (LSR)。 Market-1501和DukeMTMC-reID数据集上的实验表明，本文方法可以有效地减少过拟合的影响，并且与LSR结合使用时，比baselines都有所提升。此外，本文方法还是对其它数据增强技术的补充。

你可能感兴趣的:(Deep,Learning,Person,Re-ID)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
C++深拷贝构造函数解决浅拷贝的堆区内存重复释放问题程序猿练习生 c++c++
1.简单介绍先简单介绍一下浅拷贝和深拷贝：浅拷贝->简单的赋值拷贝操作，默认的拷贝构造函数就是浅拷贝。深拷贝->在堆区重新申请空间，进行拷贝操作。2.问题展示下面用代码示例明了地展示默认拷贝构造函数浅拷贝带来地堆区内存重复释放问题：#includeusingnamespacestd;classPerson{public:intm_Age;int*m_Height;public:Person(){c
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
JavaScript创建Object对象的方法流落的小鬼 javascript 前端
JavaScript创建Object对象的方法1、使用new操作符后跟Object构造函数varobj=newObject()person.name='AAA'person.age=192、对象字面量varobj={name:'BBB',age:20}3、与newObject相同varobj={}person.name="CCC"person.age=21
方的ScalersTalk第四轮新概念朗读持续力训练Day203 20200301 daisy境界的彼方
练习材料：Weoftenreadinnovelshowaseeminglyrespectablepersonorfamilyhassometerriblesecretwhichhasbeenconcealedfromstrangersforyears.TheEnglishlanguagepossessesavividsayingtodescribethissortofsituation.Thete
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
c# json使用 wiseyao1219 c#json 前端
安装包用NuGet安装包：Newtonsoft.Json对象转为Json字符串publicclassPerson{publicstringName{get;set;}publicintAge{get;set;}}Personperson=newPerson{Name="JohnDoe",Age=30};stringjson2=JsonConvert.SerializeObject(person);
excel表格解析数据摸鱼的张三 excel java 前端
varpersons=[];functionexcelChange(e){varfiles=e.filesvarfileReader=newFileReader();fileReader.onload=function(ev){console.log(ev);vardata=ev.target.resultvarworkbook=XLSX.read(data,{type:'binary'})var
坚持自己，而不是被环境改变·115天（Youtube语言学习方法）左撇子槿希
图片发自App1.Pleaseremovetheblackpart/bit.黒い（くろい）ところは取り除（とりのぞ）いてください。2.I’mlookingoraplacetostay.泊まる（とまる）所（ところ）を探（さが）しています。3.Doyouknowwhoisthatperson?あの人は誰（だれ）か知っていますか。4.Whichrestaurantischeap?レストランはどこが安い（
【影视推荐】面对校园欺凌，你会作何选择颖视英文
Idon'tknowforsurewhetherornotpeoplewereborntobeequal.Maybeyes,maybeno.Butthere'sonethingforcertainthatwearenotofthesamestatuswhenwegrowup,withdefinitelydifferentandevendrasticallydiversepersonalities.
＜继承看这一篇就够了【彻底教会你理解JAVA中的继承（包括继承的内存讲解）】＞ Calebcode. java学习之路 java 开发语言
一、继承的概念（什么是继承）继承是面向对象三大特征之一。JAVA中提供了一个关键字----extends，extends表明正在构造的新类派生于一个已存在的类。用这个关键字，我们可以让一个类与另外一个类建立起继承关系。publicclassStudentextendxPerson{}publicclass子类extendx父类{}在这个案例中，Student被称为子类（派生类），person被称为
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
【Unity新闻】Unity将取消Runtime费用 tealcwu Unity新闻 unity 游戏引擎
兜兜转转又回来了，一大早就看到Unity发布新闻，将取消Runtime费用，但同时也将提高各级付费账号的年费。这是新任CEOMatt上任后的价格调整策略。非常不错的一点是：当Unity6在今年晚些时候发布时，使用UnityPersonal制作的游戏将可以选择是否显示“MadewithUnity”启动画面。这还是会给开发者升级提供动力的。具体公告内容如下：在与我们的社区、客户和合作伙伴深入沟通后，我
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Privacy Policy Green_Mage
The"CentripetalForceCalculator"apprespectsandprotectstheprivacyofalluserswhousetheservice.Inordertoprovideyouwithmoreaccurateandmorepersonalizedservices,the"CentripetalForceCalculator"appwilluseanddis
寄生组合式继承四季予你66 前端面试题 javascript 前端 vue.js
一、class核心语法1、公有属性2、构造函数3、公有方法classPerson{//1、公有属性name//2、构造函数constructor(name){this.name=name}//3、公有方法say(){console.log("say")console.log(this.name)}}constp=newPerson("jack")二、继承extends：继承super：调用父类构造
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。