别致的SmallSix

FastReID: A Pytorch Toolbox for General Instance Re-identification（论文笔记）（2020CVPR）

论文链接：《FastReID: A Pytorch Toolbox for General Instance Re-identification》

代码链接：https://github.com/JDAI-CV/fast-reid

什么是目标重识别（ReID）？

简单理解就是对于一个特定的目标（可能是行人、车辆、人脸或者其他特定物体），在候选图像集中检索到它，或称图像中目标的实例级检索。如在视频监控领域，行人重识别是各大厂商重点研发的技术。

Abstract

本文介绍了FastReID作为一个在JD AI研究中广泛应用的通用实例再识别(re-id)软件系统，已应用于视频分析如人的re-id、车辆的re-id和图像检索。在FastReID中，高模块化和可扩展性的设计使得研究者可以很容易地实现新的研究思路。友好的可管理的系统配置和工程部署功能允许从业者快速地将模型部署到产品中。

我们已经实施了一些最先进的项目，包括人员识别、部分识别、跨领域识别和车辆识别，并计划在多个基准数据集上发布这些预训练的模型。FastReID是目前为止最通用和高性能的工具箱，支持单个和多个GPU服务器，你可以非常容易地复制我们的项目结果，非常欢迎使用它，代码和模型可在https: https://github.com/JDAI-CV/fast-reid。

1. Introduction

一般实例再识别(reid)是一种实例中心AI技术，目的是在大量视频中找到特定的人/车/感兴趣的物体。它为各种需要痛苦和无聊的视频观看的应用提供了便利，包括搜索视频镜头与电视剧中的男主角有关，与摄像机中的购物中心走失的孩子有关，与城市监控系统中的可疑车辆有关。许多研究者实现了一个基于开放源代码的任务，可扩展性和可重用性的修改使得很难重现结果。此外，学术研究与模型部署往往存在差距，使得学术研究模型难以快速转化为产品。

为了加快包括学术界和工业界的研究人员和实践者在内的普通实例重新识别社区的进展，我们现在发布了一个名为 FastRelD的统一实例重新识别库。我们引入了一种更强大的模块化、可扩展设计，使研究人员和从业者可以轻松地将他们的oven设计的模块插入reid系统，而无需重复编写代码基，从而进一步快速地将研究思路转换为生产模型。可管理的系统配置使其更加灵活和可扩
展，易于扩展到一系列任务，如一般的图像检索和人脸识别等。在 FastRelD的基础上，我们提供了许多先进的预训练模型，用于人识别、跨领域人识别、部分人识别和车辆识别等多种任务，未来我们还将发布人脸识别和物体检索模型。此外，我们希望库可以提供一个公平的比较不同的方法。

最近， FastRelD已经成为JDA研究中广泛使用的开源库之一。我们将不断完善它，并向其添加新特性。我们热忱欢迎个人、实验室使用我们的开源库，期待与您携手加速人工智能研究，实现技术突破。

2. Higlight of FastReID

FastRelD为培训、评估、调整和模型部署提供了一个完整的工具包。此外，Fas-tReD提供强大的基线，能够在多个任务上实现最先进的性能。

模块化和灵活的设计。在 FastRelD中，我们引入了一种模块化设计，允许用户将定制设计的模块插入到重新识别系统的几乎任何部分。帮助用户快速验证新思路，而不需要重写数十万行代码。

易于管理的系统配置。在PyTorch中实现的 FastRelD，能够在多GPU服务器上提供快速培训。模型结构、培训和测试可以用YAML文件方便定义，FastReID支持许多可选组件，如主干（backbone）、头聚合层（head aggregation layer）和损失函数（loss function），和训练策略（training strategy）。

丰富的评估系统。目前，许多研究者仅提供了单一的CMC评价指标。为满足实际场景中模型部署的需求， FastRelD提供了更为丰富的评价指标（不仅实现了CMC评价指标），如ROC和mINP，能够更好地反映模型的性能。

易于工程部署。太深的模型很难部署在边缘计算硬件和人工智能芯片中，因为耗时的推理和无法实现的层。FastRelD不仅实现了知识蒸馏模块，以获得更精确、高效的轻量级模型。FastRelD还提供了一个转换工具，如 PyTorch-Caffe和 PyTorch-TensorRT实现快速的模型部署。
众多的最先进的pre-trained模型。FastRelD提供了最先进的推理模型，包括人员重识别、部分可见的人员重识别、跨域人员重识别和车辆重识别。我们计划发布这些预先训练好的模型FastRelD很容易扩展到一般的对象检索和人脸识别。我们希望一个共同的软件能把先进的新思想应用到应用中去。

3. Architecture of FastReID

在本节中，我们将详细介绍 FastRelD的管道，如图1所示。整个流水线由图像预处理、主干、聚合和head四个组成，我们将逐一详细介绍。

图1. FastReID库的管道（上下分别为训练和推理）

3.1. Image Pe-processing

预处理Pre-processing，其实就是各种数据增广方法，如 Resize,Flipping,Random erasing,Auto-augment,Random patch,Cutout等；

收集到的图像大小不同，我们首先将图像调整为固定大小的图像。图像可以批量打包，然后输入到网络中。为了获得更健壮的模型，翻转（flipping）作为一种数据增强方法，通过镜像源图像使数据更加多样化。随机擦除（Random erasing）、随机 patch（Random patch）、随机 patch［1］和 Cutout［2］也是在图像中随机选取一个矩形区域，用随机值、另一个图像 patch和零值擦除其像素点的增强方法，使模型有效降低过拟合风险，对遮挡具有鲁棒性。自动增强（Auto-augment）是基于自动技术来实现有效的数据增强，以提高特征表示的鲁棒性。该算法采用自动搜索算法来寻找平移、旋转和剪切等图像处理函数的融合策略。

图2. 图像预处理

3.2. Backbone

骨干网（Backbone），包括主干网的选择（如ResNet,ResNest,ResNeXt等）和可以增强主干网表达能力的特殊模块（如non-local、instance batch normalization (IBN)模块等）；

骨干网络是推断图像特征图的网络，如没有最后average pooling layer的 ResNet。 FastRelD实现了三个不同的主干，包括 ResNet［3］、ResNext［4］和 ResNeSt［5］。我们还将注意力类non-local［6］模块和instance batch normalization（IBN）［7］模块添加到主干中，以学习更健壮的特性。

3.3. Aggregation

聚合模块（Aggregation），用于将骨干网生成的特征聚合成一个全局特征，如max pooling, average pooling, GeM pooling ， attention pooling等方法；

聚合层旨在将主干生成的特征图聚合为一个全局特征。我们将介绍四种聚合方法：max pooling、average pooling、GeM pooling和attention pooling。pooling层取输入，生成一个向量作为 pooling过程的输出，其中W，H，C分别表示 feature map的宽度，高度和通道。在最大池的情况下全局向量，平均池化，GeM池化和注意池化分别由下面给出。

其中，是控制系数且是softmax注意力权重。

3.4. Head

Head 模块，用于对生成的全局特征进行归一化、纬度约减等。

Head是对聚合模块生成的全局向量进行处理的部分，包括批归一化（BN）Head（batch normalization head）、线性Head（Linear head）和简化Head（Reduction head）。三种类型的头如图3所示，线性头只包含一个decision层，BN头包含一个BN层和一个decision层，简化头包含conv+BN+relu+dropout操作，一个reduction层和一个decision层。

图3. FastReID中不同head的实现

批量归一化［8］用于解决内部协变位移，因为很难训练具有饱和非线性的模型。给定一批特征向量（m为一个批次中的样本数），则bn层的特征向量可计算为

在这里和是可培训的scale和shift参数，是为数值稳定性添加到小批次（mini-batch）方差的常数。

简化层（Reduction layer）旨在将高维特征变成低维特征，即2048维-512维。

决策层（Decision layer）输出不同类别的概率，区分不同类别，用于后续的模型训练。

4. Training

4.1. Loss Function

特别值得一提的是其损失函数，不仅包括常见的Cross-entropy loss， Triplet loss，Arcface loss，还实现了今年上半年刚出的旷视CVPR 2020 Oral 论文中的Circle loss！（被认为是目前在各种度量学习任务中表现最好的）可见FastReID开发团队紧跟前沿。

在Fast-ReID中实现了四种不同的损失函数。

交叉熵损失（Cross-entropy loss）通常用于多分类的一种，可以定义为

其中，交叉熵损失使得logit预测值与地面真实值接近。它鼓励最大logit与其他所有logit之间的差异变得更大，而这与有界梯度（bounded gradient）结合在一起降低了模型的适应能力，导致模型对其预测过于自信。这进而会导致过拟合。为了建立一个能很好地推广的鲁棒模型，谷歌 Brain提出了标签平滑的方法来解决这个问题。它鼓励倒数第二层的激活靠近正确类的模板，与不正确类的模板距离相同。因此交叉熵损失的 ground truth label可定义为和

。
Arcface loss［9］将笛卡尔坐标映射到球坐标。它将logit转换成，其中是权重和特征的角度，它通过正则化修复了单个权重，也通过正则化修复了嵌入特性f，并且改变大小为。所以。为了同时增强类内紧致性和类间差异，Arcface在类内度量中添加了角边缘惩罚m
，所以被重写为。

圆的损失（Cicle loss）。圆损失的推导过程这里不详细描述，可以参考［10］。
三联体损失（Triplet loss）确保一个特定的人的图像相比于其他人的任何图像，更接近于同一个人的其他图像。在图像嵌入空间中，想让一个特定的人的一个图像(anchor)，相比于任何其他人的任何图像（negative），更接近同一个人的所有其他图像（positive）。因此，我们需要，其中是关于人的图像对的距离度量。那么N个样本的Triplet Loss被定义为，其中m是一对正和负之间的边界。

4.2. Training Strategy

训练策略，包含Learning rate warm-up,Backbone freeze等。

图4显示了包含多种技巧的训练策略，包括不同迭代（diffierent iteration）、网络的学习率热身（warm-up）和冻结（freeze）。

图4. 作为迭代次数的函数的学习速率曲线

Learning rate warm-up有助于减缓模型训练的初始阶段的小批量过早过拟合。此外，它有助于保持模型深层的稳定性。因此，我们会给一个非常小的学习率，如在最初的训练是，然后在2k个迭代里逐渐增加它。然后在2k个迭代到9k个迭代里，学习率一直保持在。然后，在9k个迭代之后，学习速率以余弦规则从下降到，在18k个迭代后结束。

Backbone freeze. 为了重新训练一个分类网络以满足我们的任务要求，我们使用从任务中收集的数据对ImageNet预训练的模型进行微调。通常我们添加一个收集网络的分类器，如ResNet，并随机初始化分类器参数。为了更好地初始化分类器的参数，我们在训练开始时只训练分类器参数，并且冻结网络参数，不进行更新(2k次迭代)。经过2k次迭代后，将释放网络参数进行端到端训练。

5. Testing

5.1. Distance Metric

度量部分，除支持常见的余弦和欧式距离，还添加了局部匹配方法 deep spatial reconstruction (DSR)；

在FastReID中实现了欧几里德测度和余弦测度。并实现了一种局部匹配方法:深度空间重构(DSR)。

深度空间重建（Deep Spatial rexonstruction）。假设有一对行人图像和，对应的主干网络（backbone）的空间特征图的维度为，对应的主干网络（backbone）的空间特征图的维度为。从个区域得到的总共个空间特征整合成一个矩阵，其中。与此同时，我们也构建了gallery的特征矩阵，其中。然后，可以在中找到最相似的空间特征，并且它的匹配分数为。因此，我们试着获得关于的所有的空间特征的的相似的分数，而且最后的匹配分数可以被定义为。

5.2. Post-processing

后处理部分，指对检索结果的处理，包括K-reciprocal coding 和 Query Expansion (QE) 两种重排序方法。

在FastReID中的两种re-rank方法：k -倒数编码[11]（K-reciprocal coding）和查询扩展[12]（Query Expansion）。

查询扩展（Query expansion）。给定一个查询图像，并使用它来查找个相似的图库图像。定义查询特征为，定义个相似库特征为。然后将验证过的库特征与查询特征进行平均，构造新的查询特征。因此，新的查询特征可以定义为

然后使用新的查询特征进行后续图像检索。QE可以很容易地用于实际场景。

5.3. Evaluation

对于性能评估，我们采用了大多数人再识别文献中的标准度量，即累积匹配治愈(CMC)和平均平均精度(mAP)。此外，我们还增加了两个指标:受试者工作特性(ROC)曲线和平均负惩罚(mINP)[13]。

5.4. Visualization

我们提供了检索结果的排名列表工具，有助于检查我们的算法中尚未解决的问题。

6. Deployment

一般来说，模型越深，性能越好。但是，深度过深的模型不容易部署到边缘计算硬件和AI芯片上，因为1)需要耗时的推理;2)在AI芯片上很难实现很多层。考虑到这些原因，我们在FastReID中实现了知识蒸馏模块，实现了高精度、高效率的轻量化模型。

图5. 知识蒸馏模块说明

如图5所示，在reid数据集上给出一个预训练的Student model和一个预训练的Teacher model，Teacher model是一个带有non-local模块、ibn模块和一些有用的tricks的更深入的模型。Student model简单而肤浅。采用双流方式（two-stream）训练带有teacher 主干冻结的Student model。Student model和Teacher model分别输出分类器logits 和特征。我们想让Student model尽可能多地学习Teacher model的分类能力，logit学习可以定义为

为了保证Student model和Teacher model在特征空间分布上的一致性，使用基于Kullback-Leibler散度的概率知识转移模型对Student model进行优化:

其中是余弦相似度测量。

同时，student model需要ReID loss 来优化整个网络。因此，总损失为:

训练完成后，使用进行推理。

我们还在在FastReID库里提供了模型转换工具（PyTorch->Caffe和PyTorch->TensorRT）。

7. Projects

7.1. Person Re-identification

数据集（Datasets）。用于评估FastReID的三种行人re-id基准数据集:Market1501[27]， DukeMTMC [28]， MSMT17[29]。我们不会在这里讨论数据库的细节。

FastReID设置（FastReID Setting）。我们使用翻转，随机擦除和自动增强来处理训练图像。带有Non-local模块的IBN-ResNet101用作主干网络。gem pooling 和bnneck分别作为head层和aggregation层。对于batch hard triplet loss函数，每批次4个目标，每个目标有16幅不同的图像，我们采用cicle loss 和triplet loss对整个网络进行训练。

结果（Result）。表1列出了在CVPR、ICCV、ECCV 2018-2020年发布的最先进的算法，在rank-1/mAP精度方面，FastReID在市场上取得了最好的性能，分别为Market1501 96.3%(90.3%)，DukeMTMC 92.4%(83.2%)和MSMT17 85.1%(65.4%)。图6显示了三个基准数据集的ROC曲线。

FastReID 取得了三大数据集上的所有评价指标的最高精度！超越了之前最高的 CVPR 2020 的 Circle Loss！

可见FastReID的实现质量很高，且其包含的各个模块的组合是十分有效的。

表1. Market1501,DukeMTMC和MSMT17数据集的人员重识别性能比较。

表2. FastReID在DukeMTMC上的消融研究。（ResNet50，384x128)。

图6. FastReID的三个基准数据集的ROC曲线以及类内和类间样本的分布曲线(ResNet101-ibn)

7.2. Cross-domain Person Re-identification

问题的定义（Problem definition）。跨域人员重识别是指调整模型使得其在有标注的源域数据集训练而在另一个无标注的目标域数据集仍然具有推广性，不同的域往往图像差异很大。

设置（Setting）。提出了一种跨域方法FastReIDMLT，该方法采用混合标签传输的方式，通过多粒度策略学习伪标签。我们首先使用源域数据集训练一个模型，然后使用目标域数据集的伪标签对预训练的模型进行微调。FastReID-MLT是由ResNet50主干、gem pooling和bnneck head实现的。对于batch hard triplet loss函数，一个batch包含4个目标，每个目标有16张不同的图像，使用circle loss和triplet loss来训练整个网络。详细配置可以在GitHub网站上找到。FastReID-MLT的框架如图7所示。

图7. FastReID-MLT的框架

结果（Result）。表3显示了几个数据集的结果，FastReID-MLT在D->M,M->D的设置里可以达到92.7%(77。5%)，82.7%(69.2%)。其结果与监督学习结果相近。

表3. 在三个基准数据集上与无监督跨域re-id SOTA方法的性能比较。“BOT”指的是“小把戏包”方法，它是ReID任务中的一个强大的基线。M: Market1501, D: DukeMTMC, MS: MSMT17

可见在FastReID-MLT超过了绝大多数该方向的算法，且接近监督学习方法的结果。

7.3. Partical Persion Re-identificastion

问题的定义（Problem denification）。部分可见的人员重识别（Partial Person Re-identification）即只有某人的部分不完整图像，在候选图像中检索这个人。

设置（Setting）。设置如图8所示。

图8. FastReID-DSR的框架

结果（Result）。表4显示了在PartialREID、OccludedREID和PartialiLIDS数据集上的结果。在rank-1/mAP指标上，FastReID-DSR可以达到82.7%(76.8%)、81.6%(70.9%)和73.1%(79.8)。

表4. 在PartialREID、OccludedREID和PartialiLIDS数据集上最新方法的比较

FastReID-DSR 同样达到了在绝大多数指标上的最好结果。

7.4. Vehicle Re-identification

数据集（Datasets）。三个车辆re-id基准数据集:VeRi,VehicleID和VERI-Wild被用于评估提出的FastReID。我们不会在这里讨论数据库的细节。

设置（Settings）。设置如图9所示。

图9. 在VehicleID和VERI-Wild上的FastReID的框架

结果（Result）。表5、表6、表7列出了2015-2019年发布的最先进的算法。FastReID在VeRi、vehicle和VERI-Wild上的性能最好。

表5. 在VeRi数据集上比较最先进的车辆重新识别方法

表6. 在车辆数据集上比较最先进的车辆重新识别方法

表7. 在VERI-Wild数据集上比较最先进的车辆重新识别方法

在这个问题上结果异常好，FastReID 匪夷所思地实现了对17-19年出现的SOTA算法碾压式超越！

8. Conclusion

本文介绍了一个用于重新识别的开放源码库FastReID。实验结果表明，该算法在人员再识别和车辆再识别等多种任务上具有通用性和有效性。我们共享FastReID是因为开源研究平台对于整个社区(包括学术界和工业界的研究人员和从业者)在人工智能方面的快速发展至关重要。我们希望释放FastReID将继续加速在人员/车辆重新识别方面的进展。我们也期待相互合作，相互学习，共同推动计算机视觉的发展。

为什么FastReID在各种任务中都表现这么抢眼？我想就如YOLOv4一样，不是去创造新算法而是组合各种最佳实践，开发团队实现了业界验证过的诸多有效的SOTA算法和tricks，这也使得它对于实际项目的开发者更具吸引力。

Shell Script 编程笔记 huangpg丶 Supporting Technology
考虑下面两个场景：场景一：我们在训练深度网络模型过程中保存了10个不同epoch模型。我们希望通过测试集验证每个模型的性能。每次对模型进行测试集验证需要30分钟，对于原始的操作方式，每次验证需要在终端手动输入一条指令，等待30分钟后程序运行结束，然后复制窗口输出的模型性能信息手动保存。再输入指令测试下一个模型，再进行等待......场景二：现在有一个任务需要进行视频内的行人检测和行人重识别，如果我
基于CLIP视觉语言大模型的行人重识别方法的简单框架设计 max500600 开发语言算法开发工具视觉语言 clip
以下是一个基于CLIP视觉语言大模型的行人重识别方法的简单框架设计，用于数据集测试。我们将使用torch和clip库，假设数据集是一个包含行人图像的文件夹结构，每个子文件夹代表一个行人身份。步骤概述安装必要的库加载CLIP模型定义数据集类提取图像特征进行重识别测试代码实现importosimporttorchimportclipfromtorch.utils.dataimportDataset,D
计算机设计大赛行人重识别(person reid) - 机器视觉深度学习 opencv python iuerfee python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
行人重识别 NineDays66 人工智能
在人的感知系统所获得的信息中，视觉信息大约占到80%～85%。行人重识别（personre-identification）是近几年智能视频分析领域兴起的一项新技术，属于在复杂视频环境下的图像处理和分析范畴，是许多监控和安防应用中的主要任务，并且在计算机视觉领域获得了越来越多的关注。下面我们就仔细来聊聊行人重识别(ReID)。1.什么是行人重识别行人重识别（PersonRe-identificat
跨模态行人重识别：Cross-Modality Person Re-Identification with Generative Adversarial Training 学习记录笔记深度学不会习深度学习
目录摘要方法cmGANGeneratorDiscriminatorTrainingAlgorithmExperiments论文链接：https://www.ijcai.org/Proceedings/2018/0094.pdf摘要（1）提出一种新的跨模态生成对抗网络（称为cmGAN）。为了解决鉴别信息不足的问题，设计了一种基于生成对抗训练的鉴别器，从不同的模式中学习鉴别特征表示。（2）为了解决大规
跨模态行人重识别：Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identiﬁcation学习记录笔记深度学不会习学习
目录摘要网络结构具体方法MAMPAM模态分类损失共享特征ID损失中心簇损失总损失试验注意模式可视化分布结果原文链接：DiscoverCross-ModalityNuancesforVisible-InfraredPersonRe-Identiﬁcation摘要提出了一种联合模态和模式对齐网络(MPANet)来发现可见红外人Re-ID不同模式中的跨模态细微差别，它引入了模态缓解模块和模式对齐模块来共
跨模态行人重识别：Dynamic Dual-Attentive Aggregation Learningfor Visible-Infrared Person Re-Identiﬁcation学习笔记深度学不会习学习
目录摘要方法模态内加权聚合（IWPA）跨模态图结构化注意力（CGSA）GraphConstructionGraphAttention动态对偶聚合学习试验论文链接：DynamicDual-AttentiveAggregationLearningforVisible-InfraredPersonRe-Identiﬁcation摘要通过挖掘VI-ReID的模态内部分级和跨模态图级上下文线索，提出了一种新
跨模态行人重识别：Modality Synergy Complement Learning withCascaded Aggregation for Visible-InfraredPerson 笔记深度学不会习深度学习 python
目录简述贡献MSCLNet方法模态协同模块模态补充模块级联聚合策略子类级聚合类内聚合类间级上的聚合目标函数基于级联聚合的模态协同互补学习在可见光-红外人员识别中的应用简述级联聚合的模态协同互补学习网络(MSCLNET)。基本思想是协同两个模态来构造不同的身份鉴别语义和较少噪声的表示。然后，在这两种模式的优点下对协同表征进行了补充。此外，提出了级联聚合策略，用于细粒度的特征分布优化，该策略将子类、类
行人重识别（二）跨模态的行人重识别石头儿啊行人重识别计算机视觉人工智能
感谢前辈总结的论文列表，为了方便自己以后翻阅，链接搁这儿1.背景在我们现实生活中，可见光条件下的摄像机拍到的图像，往往会包含行人的大部分外观信息，然而现实中并不只需要在可视条件极佳的条件下进行监控，在夜晚或者可视条件极差的场景中也有监控的需要，这个时候，红外相机拍摄的图像便可用于行人的再识别。据我所知，现阶段大部分ReID工作都聚焦在RGB图像这种单一模态上，而基于RGB-IR的跨模态ReID工作
使用中间X模态的跨模态行人重识别小小猿D 笔记
引入X模态作为辅助，将红外线--可见光跨模态学习转化为X-IR-V三模态学习，提出了一个X-红外-可见光(XIV)ReID跨模态学习框架。首先X模态由轻量型网络生成，其次，在xiv框架下，跨模态学习由一个精心设计的模态间隙约束引导，信息交换跨越可见、x和红外模态。基于红外图像的图像主要包括结构和形状信息X模态是一种伴随辅助模态，用于协调红外和可见光。一个轻量级X模态生成器和一个权重共享XIV跨模态
【跨模态行人重识别】RGB-Infrared Cross-Modality Person Re-Identification(ICCV2017) 渺渺404 跨模态行人重识别计算机视觉人工智能深度学习
文章目录摘要1介绍2SYSU-MM01数据集2.1数据集描述2.2评估标准3跨模态模型的网络结构比较3.1常见的深度模型网络结构3.2网络结构分析单流结构和双流结构在特殊情况下的联系（双流网络可以用单流网络表示）一般情况下的单流结构分析4深度零填充4.1零填充作为网络输入的分析（梯度分析）4.2RGB-IR应用深度零填充4.3跨模态学习的比较5实验5.1比较的模型5.2模型比较与分析6总结摘要行人
跨模态行人重识别综述 - 计算机视觉小小猿D 笔记深度学习
跨模态行人重识别综述-计算机视觉0引言近年来，随着智能监控领域的不断发展，单纯凭借传统的人力已经很难在对复杂的监控场景做出完善详尽的处理。作为一项在大型非重叠视角多摄像机网络获取到的海量视频画面序列里找到目标行人的任务，行人重识别（PersonRe-Identification）可以被看作是多摄像头的行人检索问题。它建立在行人检测的基础之上，捕捉获取同一目标个体在不同非重叠摄像头中分布位置信息，推
跨模态行人重识别都需要学什么 ALGORITHM LOL 人工智能
跨模态行人重识别（Cross-ModalityPersonRe-identification,简称Cross-ModalityRe-ID）是计算机视觉领域的一项挑战性任务，旨在跨越不同模态之间（例如，可见光与红外线图像）识别同一行人。该任务涉及图像处理、特征提取、模态转换、深度学习等多个方面。1.基础知识计算机视觉与图像处理：理解图像基础（如像素、色彩空间）、图像变换、图像增强技术。机器学习基础：
基于深度学习的行人重识别(person reid) 计算机竞赛 Mr.D学长 python java
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的行人重识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1技术背景行人重识别技
互联网加竞赛基于深度学习的行人重识别(person reid) Mr.D学长 python java
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的行人重识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1技术背景行人重识别技
姿态估计概述 Diros1g 姿态估计
定义和优势单目摄像机拍摄的二维图像中预测行人的人体关键点坐标，为其他任务做支持如行人重识别、动作识别。目前分类两类：单人和多人基于计算机视觉的人体姿态佶计不需要额外的穿戴设备，该技术比传统的穿戴式动作捕捉技术成本更加低廉且灵活性更高人体姿态表示形式1.二位坐标关键点（人体主要关节）表达方式以二位坐标的形式（x,y），方法简洁，无序后处理2.空间热力图回归的数据是关键点落在该坐标的概率，优点定位更精
大创项目推荐行人重识别(person reid) - 机器视觉深度学习 opencv python laafeer python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
竞赛保研基于深度学习的行人重识别(person reid) iuerfee python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的行人重识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1技术背景行人重识别技
大创项目推荐深度学习实现行人重识别 - python opencv yolo Reid laafeer python
文章目录0前言1课题背景2效果展示3行人检测4行人重识别5其他工具6最后0前言优质竞赛项目系列，今天要分享的是**基于深度学习的行人重识别算法研究与实现**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate
一些想法：关于行人检测与重识别 baidu_huihui 人工智能计算机视觉
本文主要是介绍我们录用于ECCV'18的一个工作：PersonSearchviaAMask-guidedTwo-streamCNNModel.这篇文章着眼于PersonSearch这个任务，即同时考虑行人检测（PedestrianDetection）与行人重识别（PersonRe-identification），简单探讨了一下行人检测与行人重识别这两个子任务之间的关联性，并尝试利用全景图像中的背景
论文阅读: AAAI 2022行人重识别方向论文-PFD_Net 菜鸟的追梦旅行 ReID ReID 行人重识别深度学习
本篇博客用于记录一篇行人重识别方向的论文所提出的优化方法《Pose-GuidedFeatureDisentanglingforOccludedPersonRe-identificationBasedonTransformer》，论文中提出的PDF_Net模型的backbone是采用《TransReID:Transformer-basedObjectRe-Identification》的主干网络Tr
【2024 行人重识别最新进展】ReID3D：首个关注激光雷达行人 ReID 的工作！ BIT可达鸭 3d 人工智能 3维重建计算机视觉行人重识别
【2024行人重识别最新进展】ReID3D：首个关注激光雷达行人ReID的工作！摘要：数据集：方法模型：多任务预训练：ReIDNetwork：实验结果：结论：来源：Arxiv2023机构：清华大学&北京理工大学论文题目：LiDAR-basedPersonRe-identification本文是首个基于激光雷达的人ReID的工作，展示了在具有挑战现实世界的户外场景中，利用激光雷达进行的行人ReID的
行人Reid半自动化标注贝猫说python
1、检测跟踪的方法得到一个视频的行人idid会有重叠的行人，一个人的多张图片变成多个id,针对这个问题，采用人脸的聚类方法，重新生成聚类后的id参考：半自动的行人重识别数据标注算法Tracking+infomap
浅析行人重识别 Shirleybebe
行人重识别在此先给出官方解释：行人重识别（Personre-identification）也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。给定一个监控行人图像：给定一个希
论文阅读17 | Cross-modality Person re-identification with Shared-Specific Feature Transfer Hygge MrYang 跨模态行人重识别网络机器学习
论文：Cross-modalityPersonre-identificationwithShared-SpecificFeatureTransfer（基于共享特征和具体特征转移的跨模态行人重识别）出处：CVPR2020文章目录1.motivation2.proposedmethod2.1Two-streamfeatureextractor2.2Shared-SpecificTransferNetw
行人重识别RE-ID 琐碎知识点总结 xuluohongshang 行人重识别行人重识别 Re-ID 知识总结琐碎要点 re-ID笔记
1.singleshot和mutishot前者是指gallery中每个人的图像为一张（N=1），而后者是指gallery中每个人的图像为N>1张图像，同样的Rank-1下，一般N越大，得到的识别率越高。2.gallery、probe和CMCgallery是候选行人库，probe是待查询输入，也叫查询图像（query），CMC是一种reid的性能评价方法，即CumulativeMatchCharac
行人重识别-REID 椒椒。计算机视觉深度学习人工智能
行人重识别-REID一、REID二、为什么使用REID三、REID应用场景四、REID研究形式五、REID存在的挑战一、REID行人重识别-REID（personre-identification）也叫做行人再识别技术。利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。如下图所示：一个区域有多个摄像头拍
【毕业设计】深度学习行人重识别系统 - person reid caxiou 毕业设计大数据深度学习人工智能计算机视觉行人重识别 person reid
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言Hi，大家好，这里是丹成学长的毕设系列文章！对毕设有任何疑问都可以问学长哦!这两年开始，各个学校对毕设的要求越来越高，难度也越来越大…毕业设计耗费时间，耗费精力，甚至有些题目即使是专业的老师或者硕士生也需要很长时间，所以一旦发现问题，一定要提
竞赛选题行人重识别(person reid) - 机器视觉深度学习 opencv python laafeer python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
人工智能迁移学习人工智能技术与咨询深度学习机器学习人工智能
1.深入了解神经网络的组成、训练和实现，掌握深度空间特征分布等关键概念；2.掌握迁移学习的思想与基本形式，了解传统迁移学习的基本方法，对比各种方法的优缺点；3.握深度迁移学习的思想与组成模块，学习深度迁移学习的各种方法；4.掌握深度迁移学习的网络结构设计、目标函数设计的前沿方法，了解迁移学习在PDA、Source-FreeDA上的应用；5.掌握深度迁移学习在语义分割、目标检测、行人重识别等任务中的
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S