volcano_Lin

行人重识别（Person Re-ID）【四】：论文笔记——Beyond Part Models: Person Retrieval with Refined Part Pooling

论文：Beyond Part Models: Person Retrieval with Refined Part Pooling

链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Yifan_Sun_Beyond_Part_Models_ECCV_2018_paper.pdf

代码：https://github.com/syfafterzy/PCB_RPP

前言：

这篇是ECCV2018关于行人重识别（Person Re-ID）的文章，由清华大学孙奕帆（SVDNet的作者）、郑良大神等人提出。

本文主要是提出一种既能精确划分部件信息（part-level features）而又不借助姿态估计的方法——PCB+RPP的网络框架。

PCB硬划分提取局部特征，然而简单粗暴的划分会使得对齐不够精确，于是作者考虑加入了软划分来辅助精修，但一般的软划分需要借助分割甚至是关键点和姿势估计，需要昂贵的标注成本，因此提出PCB+RPP。

这里做下补充，目前利用局部特征做 Re-ID 的方法大致分为下面两类：

1. 利用在其他数据集上训练好的姿势估计模型无监督迁移到 Re-ID 数据集上，得到局部特征的定位，根据这些提取到的关键点信息，利用图像处理（图像区域联结）的方法，得到各个部件（如头、上身，下身、手，脚等），然后基于这些分割开的部件，提取局部特征信息（part-level features），如下图CVPR2017的工作Spindle Net （http://openaccess.thecvf.com/content_cvpr_2017/papers/Zhao_Spindle_Net_Person_CVPR_2017_paper.pdf）就利用了14个人体关键点来提取局部特征，Spindle Net直接利用这些关键点来抠出ROI；

2.不使用额外的类似于姿势估计的模型，因此也就不需要单独对每个人体部件进行标注，而是用统一的分块方式，最常用的就是水平切块（stripe）（例如对一个行人均匀分割为固定数目的水平块）或者采用 attention 机制去locate等。

使用第一种方法虽然可以显式的定位这些人体的部件，但是也要忍受从姿势估计这个任务迁移到行人重识别任务过程中，由于 姿势估计的数据集和Re-ID的数据集之间肯定存在很大的数据偏差（datasets bias ），从而引入了新的误差，如果通过姿势估计定位带来的提升大于引入误差导致的性能降低，那么整体也是可以接受的；但是引入姿势估计一方面是模型训练的时间消耗较大，另一方面是标注的成本增加。

这篇文章第一部分PCB模型属于第二类方法，使用得是均匀水平切块（分成6块）。且对不同part用不同loss去训练（6块对应6个loss）。但是对于均匀分割来说，一个致命的问题就是：不同图像在同一part可能因为没有对齐而出现不同的语意信息（比如第一张图的从上到下的第一个水平块对应这个人的头部，但是由于第二张图顶部有很大的背景空余，导致同一个ID的人的头部出现在第四个水平块，这样会给模型的学习带来很大的干扰）。具体可以看下面这张图：

因此，有一些论文就针对分块提出了对齐的策略，如AlignedReID （https://arxiv.org/pdf/1711.08184.pdf）就提出了基于SP距离的自动对齐模型，在不需要额外信息的情况下来自动对齐局部特征。而采用的方法就是最短路径距离。

而本文作者提出了 RPP（Refined Part Pooling）对统一分割进行精修，这也是本文的一大亮点。（给我的感觉有那么一点像目标检测里two stages的Faster RCNN，第一步先得到proposals也就是比较粗略的信息，然后通过第二步进行回归精修得到准确的信息，只不过这边的第二步利用了局部信息，相当于在全局信息上增加了attention）

Abstract：

论文摘要部分首先提到，提取局部特征（part-level features）对于Re-ID这种细粒度程度很大的图像识别任务是十分重要的一步，不过先决条件是，一个行人图像的各part之间要能准确的 located 到，也就是能准确定位到行人的各part部件，不能只是严格的均匀的分割区域方式如前面提到水平切块（stripe），否则就会有很大的对齐问题需要解决，因此有时水平切块会被学界吐槽太过于“简单粗暴”，因为人体也不是方方正正的网格结构而是要考虑各part之间信息过渡的连续性。

作者没有引入姿势估计的模型，而是注重于让模型学习到有区分性的有益的部件信息，文章主要有以下2点贡献：

1.作者首先设计了新的更强的baseline网络-PCB（Part-based Convolutional Baseline），输入一张行人的图片，其能得到由几个part级别的特征得到的综合描述子用于Re-ID任务的行人匹配，PCB网络达到了state-of-the-art的程度，可以很好地作为Re-ID的baseline网络；

2.用于后续精修（refined）的池化部分RPP（Refined Part Pooling），统一的划分（PCB）不可避免地会在每一个part多多少少带来些误差，可能有些part明明更像下一部分，却因为强制划分被分在了上一部分去了，因此RPP重新指定和分配这些part到更接近真实part的那部分去，使得精修后每一part更具有代表性，也就是学习到更具有区分性的部件信息。实验证明，RPP加上PCB，可以达到很好的实验效果，例如在Market-1501数据街上，达到了 (77.4+4.2)% mAP 和 (92.3+1.5)%
rank-1 accuracy，＋号后面的数字代表加上RPP后提升的效果。

1 Introduction：

主要是介绍Re-ID是在一个大的数据库里，给你一个query，检索到和这个query身份一致的人，目前大部分都是用到深度学习的方法，而且当全局信息能够很好地荣誉局部信息，一般都能取得比较好的效果，最新的取得 state of the art 的方法基本都是借助了 part-informed deep features，如下图所示：

a-e是其他借助了局部信息的方法，f是本文提出的方法：本文的方法先依靠整体划分（PCB），然后对每一个小块进行精修（RPP）（Our method employs a uniform partition and then refines each stripe）

前面提到过，要想学习到有区分性的局部特征，一个很重要的先决条件是：各part之间要能准确的 located 到。近期的这些state of the art 的方法主要就是在行人划分partition的方法上做五花八门的改变，目前利用局部特征做 Re-ID 的方法主要分为两类，前面也提到了，这里就不再详细介绍了。

作者思考如何能够使得部件更好地对齐，考虑到如果引入语义分割肯定会得到比较好的指引信息，更好地学习到局部特征，但是同时也不可避免地引入了姿势估计的误差，因此本文就从另一个角度出发，强调each part的一致性，因此作者就想到了先得到一个粗略的划分，然后通过refined来得到更好的更一致性的局部信息（单从思想出发，真的好像目标检测里二阶段的方法啊！不知道其他同学有没有这样的想法？）

这里再补充一下PCB和RPP：

PCB不会准确地划分部件，整张行人图作为输入，经PCB后输出特征图，作为一个分类网络，PCB的结构也是很简洁的，只是在backbone network上进行稍微的修改得到，而且训练过程没有用很多花里花俏的技巧。效果提升也很明显：在Market-1501数据集上，rank-1 accuracy从 85.3% 提升到 92.3% (+7.0%) ， mAP从 68.5% 提升到 77.4% (+8.9%) 。

RPP是一个自适应的pooling方法，主要是改善PCB的粗划分效果，因为经PCB划分后，每一个part之间还是存在或多或少的对齐误差，即有些part的小部分信息靠近另一部分的part，这样就导致另一部分part内的部信息不一致（例如头的部分信息被划分到了上身，那就会影响上身的学习）。因此通过重新分配这些划分错误的部分到离真实信息更近的part，使得part内信息更近一致，可以有效提升效果，且在训练的时候不需要各个part的标签。具体做法：某part边缘部分的outliers重新划分到临近的parts上，这样就产生了一个part内连续性（连贯性），这使得应用part的model性能得到增强。效果：在Market-1501数据集上，RPP 在PCB上更进一步地提升了效果，达到了93.8% (+1.5%)的 rank-1 accuracy 和 81.6% (+4.2%) 的mAP。

2 Related works：

这部分就不详细介绍了，有需要的同学自己看看paper哈，主要就是介绍Re-ID以及利用局部特征做 Re-ID 的方法的相关工作。

3 Proposed Method：

这部分就是本文的主体啦，详细介绍PCB和RPP的实现和细节。

3.1 PCB: A Part-based Convolutional Baseline

1.Backbone network

本文的 Backbone network 主要用了 ResNet50，因为它的表现效果好，以及相对简洁的结构。

2.From backbone to PCB

从Backbone network到PCB只做了很小的修改，具体如下图所示：

在 全局平均池化GAP层（global average pooling）之前的结构和原始的Backbone模型也就是Resnet50完全一样，主要不同在于GAP层的改变，以及Resnet50 GAP后面的层都被移除了。

PCB的具体实现如下：

当输入一张行人图片H，经过图中的 convolutional layers from backbone network 后，得到一个激活后的三维 tensor变量T ，定义深度特征 tensor T 中每个channel axis为 column vectors，即图中的 f ；

接着将 tensor T 分成 p个 horizontal stripes（水平块），再分别对p个 horizontal stripes 做 average pooling 就得到了p个局部特征 g ；

然后再用 1x1 conv降低 g 的维度，使其降到256维，得到新的局部特征 h；

最后每一个 h 单独经过一个全连接层后，都会被单独送入一个分类器中，即用 p个n（训练集ID数目）分类的 softmax 作为分类器进行训练；

在训练阶段时，通过 最小化（minimizing）交叉熵损失函数的 sum （p个分类器p个loss）来优化PCB的训练；

在测试阶段时，分别串联向量g和h作为行人图像的特征表示。

PCB的重要参数和细节：

一些超参数如

输入图像的size（H和W）
深度特征 tensor T的空间size（图2中T的尺寸M和N）
池化后的 column vectors 的数量（p）

对PCB的效果影响很大，因此需要选择正确的超参数。

其中，深度特征 tensor T的空间size——M和N是由backbone模型的空间降采样的比例决定的。

同时还借鉴了目标检测中的 SSD 和 R-FCN算法思想——减少降采样（down-sampling）的比例可以有效地提高特征的细粒度，于是作者去掉了 Resnet50 的最后一次 down-sampling ，从而增大了 tensor T的 size ，这是PCB取得好的效果的原因之一，

这步操作在仅仅增加了很少的时间消耗，却取得了可观的准确率提升。

因此，通过实验对比，作者得出PCB的最优设置参数如下：

图像 resize 到 384x128 ，图像高宽比（H：W）为3:1
深度特征 tensor T的空间尺寸MxN 为 24x8
T最后被均等地划分为6个 horizontal stripes ，即 p 取6

3.2 Within-Part Inconsistency

这部分描述了part内部信息不一致的现象，揭示了这种强制划分存在的问题。

因此虽然这种强制均等划分简单有效，但同样是需要进的，因为它不可避免地由于划分的不精准带来的part与part之间的误差，必然会降低模型学习区分性特征的能力。

因此本文从一个新的视角去分析这种 partition errors ：从 the within-part inconsistency 方面，也就是part内部的不一致性。

作者认为 column vector f in a same part of T should be similar to each other and be dissimilar to column vectors in other parts，也就是同一个part内的column vector f应该彼此之间相似，而不同part之间应该有差异。（感觉有点像triplet loss，同个ID的人靠近，不同ID的人推开）

训练PCB到收敛后，通过比较每一个column vector f 和 g 的相似度，即测量它们之间的余弦距离，找到离每一个column vector f 距离最近的 part ，具体看下面图3 ，每一个 column vector 通过一个小矩形块来表示，而且根据距离其最近的part画上不同的颜色，这样就很容易进行观察。

我们可以看到存在很多前面说到的误差 outliers，比如Part 1 里面有一些其他颜色的小矩形，这就说明，有些column vectors更像另一个part的，所以这样的强制均匀划分是存在问题的，需要进一步改进。

3.3 Refined Part Pooling

这一部分就介绍重点的RPP啦，由于上面提到的存在很多误差 outliers ，所以作者提出了 refined part pooling (RPP) 来纠正这些part内的不一致现象，目标是通过 column vectors f 和其最相似的 part 来对齐所有的column vectors f ，让他们回到属于自己的那个part去，这些误差 outliers就能被重新定位，找到属于它自己的位置。

更具体是，在数值上测量 f 和每一个P（part）相似度S

然后 column vector f 根据计算得到的 S 值来重采样到最相似的那个 part 上，公式如下：

（其中，F是tensor T中所有 column vector f 的集合；{ }表示重采样操作，形成一个新的集合）

假定我们已经完成了上面公式1的重采样操作，并更新了每一个 part ，然后之前测过的相似度 S 就不起作用了，因为位置都发生变化了，所以就需要不断地重复 “相似度测量” ——> “重采样” 操作，直到收敛。

所以，RPP不再通过测量每一个 f 和 P之间的相似度，而是对每一个 f 用 6个 part classifier （假设共有6个parts）去预测的值（即 f 属于某一个P 的概率），文中是通过线性函数W加Softmax来实现，公式2如下：

（其中，p是设定的分成的part的数目，这里取6；W是提到的part classifier 分类器中可训练的权重矩阵）

因此RPP做的是一个“soft”的和自适应的划分操作，来精修前面PCB的“hard”和均匀划分，且由于均匀划分带来的误差 outliers 会被重新分配它们应该属于的位置，这些都是RPP带来的好处。

因此结合了RPP之后，PCB就进化成下图4这样：

RPP 和 part classifier 和后续的降采样操作，取代了原来的 average pooling 操作，而其他层跟图2是一样的，没有变化。

把每个part对应的 attention map 权值叠加回 tensor T 里（即上图的 GAP过程），得到各 part 的spatial 空间压缩后的 feature vector g ~ 后续步骤都和PCB一样~

权重矩阵W不需要各部件的label就可以训练，下面3.4节会介绍如何训练 part classifier .

3.4 Induced Training for Part Classifier

这一小节主要介绍如何训练RPP，因为没有part label 信息的辅助训练，所以使用已经学习到的PCB训练好的模型，来引导新加入的RPP的训练，RPP 只有一项参数 W，训练分如下几步：

tensor T均等划分，并训练 PCB 至收敛（这一步引导训练的重要性后面的4.5小节有讲到）；
将原来 tensor T 后面的 average pooling层替换为一个 p分类的 part classifier；
固定PCB的其它层的参数只训练 part classifier 的 W 参数至收敛；
放开全部参数，fine tune 以达到 overall optimization 。

在上面的训练过程中，第一步训练好的PCB模型会引导后续的 part classifier 的训练。第三步和第四步收敛得非常快，大约总共只需要10 多个 epochs 即可。

文中的训练流程图如下：

4 Experiments

4.1 Datasets and Settings

这一小节主要介绍实验数据集和配置。

Datasets：Market-1501，DuckMTMC-reID，CUHK03 (new training/testing protocol)
setting：single-query，without re-ranking（因为re-ranking会对mAP的提升效果显著）

4.2 Implementation details

这一小节主要介绍一些实验的细节部分。

进行IDE作为对比实验（IDE is a commonly used baseline in deep re-ID systems），且做了一些改进（same backbone network,i.e., ResNet50, and with several optimizations over the original one），最终作者实验出来的IDE模型效果稍好过原来的（On Market-1501, our implemented IDE achieves 85.3% rank-1 accuracy and 68.5% mAP, which is a bit higher than the implementation）。

然后是2种PCB的结构进行实验比较，用相同的 backbone network ，有不同的结构to learn part-level features ：

Variant 1：不再基于每个去进行单独的ID prediction，而是合并所有的成为一个，然后得到一个ID prediction 向量。测试时同样concat所有的g或h，因为concat了，所以只有一个loss；
Variant 2：和图2 一样的PCB结构，所有的 FC classifiers 的分支共享参数。

训练时，对训练集进行了水平翻转和normalization的增强操作，batch size 设置为64，以0.1的基础学习率训练模型60个epochs ，在40个epochs之后降低到 0.01 。backbone model 在 ImageNet 上进行预训练。

实验用2块NVIDIA TITAN XP GPUs ，框架使用Pytorch ，在 Market-1501 (12,936 training images)上训练一个 IDE model 和一个标准的 PCB大约分别需要 40 和 50分钟。PCB训练上消耗多的10多分钟主要是因为去掉了最后的降采样层，使得 tensor T 扩大了4倍。

4.3 Performance evaluation

最后实验的结果如下Table 1所示：

结论：

PCB是一个strong的baseline模型。相比 IDE，PCB 的 mAP 提升8.9-15.3%；
RPP可以有效改善PCB的效果，特别是mAP。RPP 对 PCB 的 rank-1 提升 1.5-3.1%，mAP 提升 3.1-4.2%，mAP提升效果更加明显，因为rank-1是描述找到最佳匹配的衡量标准，而mAP是描述找到所有匹配的衡量标准，因此就说明RPP对于找到more challenging的匹配是有效的；
使用p个losses的有效性。图2中，最后用到了p 个分支的损失，通过对比上一小节的Variant 1单loss，可以看到Variant 1的准确率没有PCB高，多损失比单损失提升明显，mAP 提升约 10-15%，这也就说明了对每个part 分别使用一个loss去约束，对学习到每个part的区分性特征十分有效；
p 个分类器（identity classifiers）不共享参数的有效性。通过对比本文的PCB（不共享参数），以及上一小节的Variant 2的共享参数，p 个分类器不共享参数相比共享参数提升 mAP 2.4-7.4%。

Table 2是Market-1501数据集上 state of the art 方法之间的对比：

分为3组

——Group 1:手工设计模型（hand-crafted methods）

——Group 2:利用全局特征的深度学习方法（deep learning methods employing global feature）

——Group 3:利用局部特征的深度学习方法（deep learning methods employing part features）

*号表示需要额外的辅助part labels

本文提出的方法在最下面，PCB以及PCB+RPP

只依靠统一均匀划分的PCB就超过了其他所有的方法，甚至包括那些需要额外的辅助part labels 来故意对齐part的方法。（可见PCB是个挺强大的baseline模型，因此作者也希望以后可以有更多人在Re-ID领域使用PCB作为baseline模型）

当PCB通过RPP精修后，每一项指标均达到最优！

Table 3是在DukeMTMC-reID and CUHK03数据集上的比较：

最终，本文的PCB+RPP方法对于Market-1501, Duke and CUHK03这三个最权威的Re-ID数据集：mAP = 81.6%, 69.2%, 57.5% 以及 Rank-1= 93.8%, 83.3% and 63.7% ,在三个数据集上均达到了 state of the art ！且没有用到re-ranking，当用了re-ranking之后，在Market-1501数据集上，mAP 和 Rank-1 提升到了 91.9% and 95.1%！

4.4 Parameters Analysis

这一小节是对一些重要的超参数如何设置进行试验分析，在Market-1501数据集上进行实验，但确定好参数后同样可以在其他数据集上使用（Once optimized, the same parameters are used for all the three datasets.）：

1.The size of images and tensor T

image size 在 192 × 64 到 576 × 192之间的范围, 并使用 96 × 32 作为不同组实验之间的间隔；而且还设置了2个不同的降采样率进行对比，蓝色曲线为原始的降采样率，红色为对半的降采样率。

结果：

大的图像尺寸有利于学习到局部特征（a larger image size benefits the learned part feature）；

小一些的 down-sampling rate （因为降采样率低了，所以 larger spatial size of tensor T）更有效，特别是对于输入的图片尺寸较小时，提升很明显。

因此，在（a）中，我们可以看到，使用384×128的图像尺寸并使用对半的down-sampling rate，与使用 576 × 192图像尺寸并使用原始的down-sampling rate达到几乎一样的表现效果。

2.The number of parts p

对比划分part数目p的效果进行实验探究

直观上看，p决定了part feature 的细粒度（即划分的p数量越多，细粒度程度越大），当p=1时，就退化成为了全局特征

结果：

由上图（b）可以看出：

当p增大时，一开始mAP和 Rank-1均提升，但不是一直提升下去，当 p = 8 或者 12 时, 准确率突然急剧下降，无论是否使用了RPP（红色曲线和蓝色曲线均呈现一致的下降趋势）

具体实验效果可以参考下图Fig6的可视化：

当p增大到 8（b）或者 12（c），一些refined parts会和其它refined parts之间有很大程度的相似性，有些又没有分配到

因此，不是说p越大越好，而要区分的几个part之间有明显的可比性（比如人的头，人的上半身，下半身，鞋子等等）

因此实际使用中，p=6是最好的。

4.5 Induction and Attention Mechanism

这一小节主要介绍PCB引导训练的重要性以及与另一篇基于 attention 机制方法的对比。

我们在前面3.4小节介绍RPP的训练时，提到使用已经学习到的PCB训练好的模型，来引导新加入的RPP的训练

原文提到：Without PCB pre-training,the network learns to partition T under no induction and becomes similar to methods driven by attention mechanism

也就是说如果没有PCB的预训练模型，网络在没有引导的情况下去学习T，来训练RPP，效果就跟基于 attention 机制方法差不多（网络自己去学）。文章做了实验，如下Table4：

无论PCB中用何种partition strategy，PCB效果总是优于基于attention的PAR方法（which learns to partition through attention mechanism）

如果没有引导，the network learns to focus on several parts through attention mechanism ，效果比加了引导的下降很多。（看图中只要RPP的那一行）

使用RPP通过预训练的PCB来引导，比通过attention mechanism来学习局部特征效果要好。

5 Conclusion：

总结

本文主要有2点贡献来解决Re-ID的问题：

1.设计了新的更强的baseline网络-PCB（Part-based Convolutional Baseline）来学习 part-informed features，目的是作为后续的RPP的引导信息，PCB采用的是强制统一均匀划分，PCB 达到了 state of the art 的水平，未来应该会是一个广泛应用于Re-ID任务的 strong baseline 模型；

2.不过PCB太过于暴力，因此还需要 refined 一下，于是作者又提出了用于后续精修（refined）的池化部分RPP（Refined Part Pooling），用来增强每一个 part 内部的信息一致性。Refinement 之后，相似的 column vectors 会被划分到相同的 part 内，使得每一个 part 内部信息更加趋于一致。RPP不需要 part labeling information ，并且能够很大程度改善PCB的效果。

你可能感兴趣的:(行人重识别,Deep,Learning)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
前端开发需要了解的算法知识史努比的大头算法前端
手写深拷贝functiondeepClone(obj){//处理基础数据类型和函数if(obj===null||typeofobj!=='object'){returnobj;}//处理数组if(Array.isArray(obj)){returnobj.map(item=>deepClone(item));}//处理对象constclonedObj={};for(constkeyinobj){i
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
【python】【Ray的概述】资源存储库 python 开发语言
Overview概述Rayisanopen-sourceunifiedframeworkforscalingAIandPythonapplicationslikemachinelearning.Itprovidesthecomputelayerforparallelprocessingsothatyoudon’tneedtobeadistributedsystemsexpert.Rayminimi
什么是监督学习（Supervised Learning）救救孩子把 AI AI 学习
一、监督学习概述监督学习（SupervisedLearning）是一种极具威力的机器学习方法，能够训练算法以识别数据中的模式，并据此进行精准的预测或分类。借助已有的标记数据，监督学习模型学会了从输入到输出的映射关系，进而在各类实际问题中实现自动化决策。无论是医疗诊断、金融市场分析、客户行为预测，还是提升生产效率以及个性化推荐系统等领域，监督学习都彰显出巨大的潜力与价值。随着技术的持续进步，监督学习
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南汀、人工智能 LLM工业级落地实践人工智能自然语言处理 prompt Swifi DeepSpeed 通义千问 Qwen
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南阿里云于2023年8月3日开源通义千问70亿参数模型，包括通用模型Qwen-7B以及对话模型Qwen-7B-Chat，这也是国内首个开源自家大模型的大厂。在诸多权威大模型能力测评基准上，如MMLU、C-Eval、GSM8K、HumanEval、WMT22，通义千问7B均取得了同参数级别开源模型中的最好表现，
使用3DUNet训练自己的数据集（pytorch）— 医疗影像分割编程日记✧ 智能医疗 pytorch 人工智能 python 计算机视觉图像处理深度学习健康医疗
代码：lee-zq/3DUNet-Pytorch:3DUNetimplementedwithpytorch(github.com)文章<cicek16miccai.pdf(uni-freiburg.de)3DU-Net:LearningDenseVolumetricSegmentation
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p