小威威__

ReID：Harmonious Attention Network for Peson Re-Identification 解读

最近阅读了CVPR2018的这篇论文 Harmonious Attention Network for Peson Re-Identification，论文还是比较容易理解的，下面就简单的解读一下，纯属个人观点，有不同意见的欢迎评论与我探讨~

Problem

Existing person re-identification(re-id) methods either assume the availability of well-aligned person bounding box images as model input or rely on constrained attention selection mechanisms to calibrate misaligned images.
现有的re-id方法一般假设人物的bounding box是well-aligned的，或者依赖于constrained attention selection mechanisms去矫正bounding box使它们对齐。
They are therefore sub-optimal for re-id matching in arbitrarily aligned person images potentially with large human pose variations and unconstrained auto-detection errors.
因此作者认为它们在re-id matching问题中是局部最优的，潜在的包含大量的human pose variations 和 auto detection errors。
- Auto-detection: misalignment with background cluster, occlusion, missing body parts
- Auto Detection会由于混乱背景或者身体部分缺失而出错
A small number of attention deep learning models for re-id have been recently developed for reducing the negative effect from poor detection and human pose change
然后就有人尝试attention selection deep learning model in re-id
Nevertheless, these deep methods implicitly assume the availability of large labelled training data by simply adopting existing deep architectures with
high complexity in model design. Additionally, they often consider only coarse region-level attention whilst ignoring the fine-grained pixel-level saliency.
尽管如此，这些deep model复杂度较高，需要的training data较大，并且它们重视region-level attention而忽略了fine-grained pixel-level saliency.
Hence, these techniques are ineffective when only a small set of labelled
data is available for model training whilst also facing noisy person images of arbitrary misalignment and background clutter.
因此，这些方法在训练集较小的时候效率不高，而且还会面临由misalignment和background clutter引起的混乱的图片场景。

总的来说，这篇论文解决的是ReID传统问题。

Motivation

Existing works:
- simply adopting a standard deep CNN network typically with a large number of model parameters and high computational cost in model deployment
- Consider only coarse region-level attention whilst ignoring the fine-grained pixel-level saliency
Our works:
- We design a lightweight yet deep CNN architecture by devising a holistic attention mechanism for locating the most discriminative pixels and regions in order to identify optimal visual patterns for re-id.
- The proposed HA-CNN model is designed particularly to address the weakness of existing deep methods as above by formulating a joint learning scheme for modelling both soft and hard attention in a singe re-id deep model.
问题一：现存的方法大多采用传统的CNN，这样带来的影响是：参数过多，计算的代价过大

所以作者提出了HA-CNN网络，该网络是一个lightweight (参数少) 同时又保证了deep（足够深）的特性。

问题二：现存的方法中，虽然考虑到了hard region-level attention，但pix-level attention 却被忽略了

所以作者提出的HA-CNN网络采用了联合学习hard and soft attention 的scheme，充分考虑hard and soft attention。

Contribution

(I) We formulate a novel idea of jointly learning multi-granularity attention selection and feature representation for optimizing person re-id in deep learning.
贡献一：提出了Jointly learning of attention selection 与 feature representation (global && local feature)
(II) We propose a Harmonious Attention Convolution Neural Network (HA-CNN) to simultaneously learn hard region-level and soft pixel-level attention within arbitrary person bounding boxes along with re-id feature representations for maximizing the correlated complementary information between attention selection and feature discrimination。
贡献二: 提出了HA-CNN 模型
(III) We introduce a cross-attention interaction learning scheme for further enhancing the compatibility between attention selection and feature representation given re-id discriminative constraints.
贡献三：引入了cross-attention interaction

我个人觉得这三点归结起来就是提出了一个较为novel 的 architecture — HA-CNN.下面就详细讲述这个网络。

HA-CNN

我个人总结了该网络的四个特点：
1. LightWeight (less parameters)；
2. Joint learning of global and local features;
3. Joint learning of soft and hard attention;
4. Cross-attention interaction learning scheme between attention selection and feature representation.

该网络是一个多分支网络，包括获取global features 的 global branch 与获取local features 的 local branches。每个branch的基本单位都是Inception-A/B(某种结构，还有其它结构如ResNet,VGG,AlexNet，你可以看成一个工具箱，能用就行了)。

Global branch 由3个Inception A(深色)与3个Inceprtion B(浅色)构成，还包含3个Harmonious Attention(红色)，1个Global average pooing(绿色)，1个Fully-Connected Layer(灰色), 最后获得一个512-dim global features。

Local branches 有多条(T branches)，每条由3个Inception B(浅色) 和 1个 Global average pooling构成，最后每条分支的输出汇总到一起，通过一个 Fully-Connected Layer以获得512-dim local features.

补充： Global branch 只有一条，Local branches有T条，每条Local branch处理一个region。每一个bounding box可以有T个regions。

然后Global feature 与 Local feature 连接起来获得1024-dim feature，即是HA-CNN的输出。

图中的虚线与红色箭头，将在后面结合HA解释。这里先铺垫一下：Global features 是从 whole image 提取的， Local features 是从来自于bounding box 的 regions，而这些regions是由HA提供的。即虚线是HA将Regions 发送到前面的结点，然后红线是将这些regions分配到各个Local branches。

讲清楚了这个网络的结构，便能解释它的第一个特点— LightWeight。
1. 采用分支网络，参数量的计算由乘法降为加法；
2. Global branch 与 Local branches 共享第一层Conv的参数；
3. Local branches 共享d1, d2, d3的参数。

该网络同时学习Global and Local Features，所以体现了它的第二个特点 — Joint learning of global and local features

补充一下图上参数的注解：
1. di 表示filter的数目，也就是channel的数目；
2. 第一层卷积 {32,3∗3,2} 表示32个filters，3*3 卷积核， 2 步长。

在深入了解HA结构之前，我们需要了解一下Attention机制。

什么是Attention？我觉得就是一个衡量信息价值的权重，以确定搜索范围。比如我现在要在一张图片上搜索某个人的脸部，那么这张图像上价值权重最高的部分便是包含脸部的regions，这些regions就是我们的attention，也就是我们的搜索范围。再举个例子，我现在有个包含10个单词的句子，我每个单词赋予一个权重，作为每个单词在这个句子中的价值衡量，权重越大，价值越高。自然，我的Attention就是一个10-dim vector，这也是它的本质。

Attention主要包含两类：Hard attention 与 Soft attention。简单的来说，Hard attention 关注的是 region级别的，Soft attention 关注的是 pixel 级别的。举个例子：现在有一张聚会的合影，合影背景有各种吃剩的食物，瓶子等。但是你依然能很快的从中发现你认识的人(假如有你认识的人)。这就是一个Hard attention。即你能在非常混乱的背景下找到你认识的人，而没有受到太大干扰。这种确实很适合解决misaligned image。然后再举个阅读理解的例子：先阅读问题，提取出关键字(token)，然后回文中查找。你寻找的这些token便是soft attention的体现。

Stack overflow上一段比较形象的解释 Attention

HA结构包含四个框：red、yellow、green、black。red 框代表 soft attention learning， black 框代表 hard attention learning， red框内的green 框代表soft spatial attention， red 框内的yellow 框代表soft channel attention。

下面解释各个框，结合公式可能会好理解一点。

首先来看red 框。(1) green 框的输出与 yellow 框的输出进行 multiply op，得到的结果(2) 通过一层卷积层，再 (3) 经过一个Sigmoid获得red框的输出(we use the sigmoid operation to normalise the full soft attention into the range between 0.5 and 1)。公式(1) 描述的是步骤(1).

补充： 将 yellow 框与 green 框的输出作multiply op 以获得 soft attention，然后经过一层卷积，这层卷积有利于这两种soft attention 的 combination。最后经过sigmoid层，让输出每一分量保持在0.5~1范围。

接着看green 框。(1) HA的输入传入Reduce层(Global cross-channel averaging pooling layer), (2)得到的结果经过一层卷积层，(3)再经过一层Resize层(双线性插值), 最后(4)再经过一层卷积得到 soft spatial attention。公式(2) 描述的是步骤(1)的Reduce层，其实本质上就是一个channels的平均。

补充： Reduce Layer是对通道作avg操作，即将3d tensor转化为spatial tensor。紧接着的一层卷积用于提取spatial attention的特征。然后通过resize层，恢复h、w大小，该层采用的是双线性插值。最后一层Layer应该是为了增大其非线性表达。

然后看yellow 框。(1) HA的输入传入Global averaging pooling layer，对输入进行squeeze运算，(2)得到的结果通过两个卷积层得到结果。公式(3)描述的是步骤 (1) 的squeeze函数，公式(4) 描述的是步骤 (2)。

补充： 第一层squeeze操作，是将3d tensor 转化为 channel tensor。然后经过两层卷积提取特征。

red框的输出与HA的输入作multiply op后传入下一层。red框体现了HA-CNN的第三个特点: Joint learning of soft and hard attention

最后来看黑色框。作者 model the hard region attention as a transform matrix, 即公式(5), which allows for image cropping, translation and isotropic scaling operations by varying two scale factors (sh,sw) and 2-D spatial position (tx,ty)

作者通过使用固定的 sh 与 sw 来限制模型复杂度，所以hard attention model 只需要考虑两个参数。目前输入是一个c-D vector
, 并且我们提取T个regions，所以蓝色部分的全连接层的参数便是2T*c 个参数。然后经过Tanh，最后获得2T输出 θ 。

补充： 作者将hard attention 给 model 成一个变换矩阵，该矩阵主要有4个参数： sh 、 sw 、 tx 、 ty 。其中， sh 、 sw 用于固定region的大小，以限制模型的复杂度，所以hard attention learning 学的便是这两个t变量。所以，全连接层的输出是2T，再经过Tanh，将position转化为百分比，以方便定位region的位置，即输出的 θ 是T个region的位置信息

~~θ 按照虚线传输回之前的结点，然后分成T个parts根据红线输入到各个Local branches做add op。~~

更正：现在解释一下HA-CNN的虚线与红线。虚线部分，引用原文如下：

The hard region attention is enforced on that of the corresponding network block to generate T different parts which are subsequently fed into the corresponding streams of the local branch.

这个“enforce” and then “generate T parts” 很迷，应该是没讲清楚。作者的意思应该是从HA模块传回的 θ 是regions的position info，然后从所到达的network block的当前feature map中获得region，将他们分别resize 成24x28x32、12x14x d1 、6x7x d2 ，传入local分支中与local feature做 add op。这一过程可以用公式(6) 描述

补充： 为什么做这个加法？作者的意思将global branch 学习到的东西分享给local branch，相当于分享了global branch 的学习能力，所以这样可以减少local branch的层数，继而减少参数量。

模型的参数训练，如公式(7)

公式(6) 与公式 (7) 体现了HA-CNN的第四个特点：Cross-attention interaction learning scheme between attention selection and feature representation

HA-CNN on ReID

A test probe image Ip , A set of test gallery image {Igi}
(1) We first compute their corresponding 1,024-D feature vectors by forward-feeding the images to a trained HA-CNN model, denoted as xp=[xpg;xpl] and {xgi=[xgg;xgl]}
(2) We then compute L2 normalisation on the global and local features, respectively.
(3) Lastly, we compute the crosscamera matching distances between xp and xgi by the L2distance.
(4) We then rank all gallery images in ascendant order by their L2 distances to the probe image.

Experiment

实现细节：
1. All person images are resized to 160×64；
2. we set the width of Inception units at the 1st/2nd/3rd levels as: d1 =128, d2 = 256 and d3 = 384；
3. we use T = 4 regions for hard attention；
4. In each stream, we fix the size of three levels of hard attention
as 24×28, 12×14 and 6×7；
5. For model optimisation, we use the ADAM algorithm at the initial learning rate 5×10−4 with the two moment terms β1 = 0:9 and β2 = 0:999；
6. We set the batch size to 32, epoch to 150, momentum to 0.9；
7. , we do not adopt any data argumentation methods (e.g. scaling, rotation, flipping, and colour distortion), neither model pre-training.

实验结果：

Market-1501
DukeMTMC-ReID
CUHK03
这个比较特殊，原本是1367/100 training/test split，作者采用的是767/700
Attention Evaluation
CAIL Evaluation
Joint of global and local feature Evaluation
模型参数对比
Visulisation
Soft attention捕捉具有强烈区分性的特征，如那一坨彩色的东西；
Hard attention能够定位身体部位，如那四个框框

跨模态行人重识别：Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identiﬁcation学习记录笔记深度学不会习学习
目录摘要网络结构具体方法MAMPAM模态分类损失共享特征ID损失中心簇损失总损失试验注意模式可视化分布结果原文链接：DiscoverCross-ModalityNuancesforVisible-InfraredPersonRe-Identiﬁcation摘要提出了一种联合模态和模式对齐网络(MPANet)来发现可见红外人Re-ID不同模式中的跨模态细微差别，它引入了模态缓解模块和模式对齐模块来共
（Re-ID论文精读）PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification 达柳斯·绍达华·宁目标跟踪视觉检测深度学习
最近对Re-ID比较感兴趣，读了一篇关于Re-ID的文章，作为自己学习的一个记录，有说的不正确的地方欢迎大家指正，也希望大家一起共同学习共同进步！！！原文地址：ZhuK,GuoH,YanT,etal.Pass:Part-awareself-supervisedpre-trainingforpersonre-identification[C]//EuropeanConferenceonCompute
（Re-ID论文精读3）WACV2023 | Body Part-Based Representation Learning for Occluded PersonRe-Identificatio 达柳斯·绍达华·宁目标跟踪视觉检测深度学习
最近对Re-ID比较感兴趣，读了一篇关于Re-ID的文章，作为自己学习的一个记录，有说的不正确的地方欢迎大家指正，也希望大家一起共同学习共同进步！！！作为系列的第三篇文章，读下来深刻感觉一句话的含金量：不积跬步无以至千里不积小流无以成江海！！借此勉励自己，坚持把这个系列做下去。原文地址：https://openaccess.thecvf.com/content/WACV2023/papers/So
（Re-ID论文精读2）CVPR2023: Patch-wise High-frequency Augmentation for Transformer-basedPerson Re-id 达柳斯·绍达华·宁 transformer 深度学习目标跟踪视觉检测
最近对Re-ID比较感兴趣，读了一篇关于Re-ID的文章，作为自己学习的一个记录，有说的不正确的地方欢迎大家指正，也希望大家一起共同学习共同进步！！！原文地址：https://openaccess.thecvf.com/content/CVPR2023/papers/Zhang_PHA_Patch-Wise_High-Frequency_Augmentation_for_Transformer-B
[论文阅读笔记27]Occlusion-Aware Detection and Re-ID Calibrated Network for Multi-Object Tracking wjpwjpwjp0831 读文献 MOT 多目标跟踪论文阅读笔记计算机视觉人工智能目标跟踪深度学习
论文地址:论文这篇文章的写作和创新点都比较标准,且在VisDrone数据集上进行的训练,因此做一篇笔记.这篇文章主要通过数据增强的方式增加模型被实际背景遮挡的情况,并且通过硬掩码让网络在训练时更能区分前景和背景.在致力于解决遮挡问题的MOT的工作中,也是一篇比较有趣的.0.Abstract在MOT任务中,遮挡一直是一个有挑战性的问题.遮挡不仅会降低检测效果,导致轨迹碎片化,还会影响Re-ID的精度
行人重识别RE-ID 琐碎知识点总结 xuluohongshang 行人重识别行人重识别 Re-ID 知识总结琐碎要点 re-ID笔记
1.singleshot和mutishot前者是指gallery中每个人的图像为一张（N=1），而后者是指gallery中每个人的图像为N>1张图像，同样的Rank-1下，一般N越大，得到的识别率越高。2.gallery、probe和CMCgallery是候选行人库，probe是待查询输入，也叫查询图像（query），CMC是一种reid的性能评价方法，即CumulativeMatchCharac
深度学习行人重识别综述与展望，TPAMI 2021 最新文章小白学视觉编程语言 python 计算机视觉机器学习人工智能
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达作者|叶茫武汉大学编辑|CV君转自|我爱计算机视觉（微信id：aicvml）摘要：行人重识别（PersonRe-Identification，简称Re-ID），是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的AI技术，在智慧城市等监控场景中具有重要的应用意义和前景。本文介绍我们最新的IEEETPAMI综述论文《
车辆重识别（Vehicle Re-ID）：DSAM-GN:Graph Network based on Dynamic Similarity Adjacency Matrices for Vehic 学术菜鸟小晨人工智能计算机视觉
论文作者：YuejunJiao,SongQiu,MingsongChen,DingdingHan,QingliLi,YueLu作者单位：EastChinaNormalUniversity;FudanUniversity;ShanghaiArtificialIntelligenceLaboratory论文链接：http://arxiv.org/abs/2310.16694v1内容简介：1）方向：车辆
Self-Supervised Modality-Aware Multiple Granularity Pre-Training for RGB-Infrared Person Re-ID—通用范式 JJxiao24 论文学习跨膜态行人重识别计算机视觉深度学习
文章目录题目：elf-SupervisedModality-AwareMultipleGranularityPre-TrainingforRGB-InfraredPersonRe-Identification（RGB-红外人物再识别的自监督模态感知多粒度预训练）研究背景论文分析网络框架A.ProblemFormulationB.Cross-ModalityPermutationRecoveryⅠ.
ICCV2019 paper list Person Re-ID 从天而降小可爱论文笔记REID
另附网址：https://zhuanlan.zhihu.com/p/84478668Instance-GuidedContextRenderingforCross-DomainPersonRe-IdentificationYanbeiChen,XiatianZhu,ShaogangGong[pdf][supp][bibtex]MixedHigh-OrderAttentionNetworkforPe
新科技创业2019 | 「云从科技」：2019年在资本方面或有新进展薇薇安是小仙女
新科技创业2019|「云从科技」：2019年在资本方面或有新进展Q1、2019年第一季度，公司在技术、产品、市场、商业化、融资、团队等方面取得了哪些进展？今年以来，云从科技已经在核心技术领域3次刷新世界纪录，分别在3D人体重建、机器阅读理解、跨镜追踪（Re-ID）技术上取得突破。与国美零售、东风日产数据公司、西南财经大学、老挝外贸银行等在零售、教育、金融等领域达成新的合作，同时发布了新一代“炬眼智
FairMOT论文阅读笔记我在阳澄湖畔吃炸鸡 CV 深度学习深度学习计算机视觉
Abstract近些年目标检测和Re-ID有很大的发展，但是没有人在单个网络中联合这两个任务。由于re-ID任务没有公平的学习，这导致了大量id的转换。不公平之处在于两个方面:(1)他们将重新身份识别视为次要任务，其准确性在很大程度上取决于主要检测任务。所以训练很大程度上偏向于检测任务，而忽略了重识别任务；(2)它们使用感兴趣区域对齐来提取直接从对象检测中借用的重标识特征。然而，这在表征对象时引入
【实验记录】AGW | Visible-Infrared Re-ID ca1m4n 实验记录备忘录模式计算机视觉 pytorch
【RT】VisibleThermalRe-IDDeepLearningforPersonRe-identification:ASurveyandOutlook中提出了一个针对单/跨模态行人重识别的baseline：AGW做过两次，在测试阶段有问题，现在再重做一次CodeRTX3090修改数据集路径：test.py,train.py,data_loader.py,pre_process_sysu.p
【自监督Re-ID】ICCV_2023_Oral | ISR论文阅读 ca1m4n ReadingTime 目标跟踪目标检测
Codehttps://github.com/dcp15/ISR_%20ICCV2023_Oral面向泛化行人再识别的身份导向自监督表征学习，清华大学目录导读摘要相关工作DGReID用于ReID的合成数据无监督表征学习Identity-SeekingRepresentationLearning结果消融实验导读新角度：提出了从大规模无标注互联网行人视频中学习领域泛化的行人表征。新方法：设计了新颖的自
行人重识别 A Pose-Sensitive Embedding for Person Re-Identiﬁcation with Expanded Cross Neighborhood Re-... EverydayRunning
基于姿态的Re-Id人的体态特征对于完成Re-Id任务来说是一个非常重要的线索。SDALF[1]利用两轴代表体态特征，进一步推演出具有姿态不变性的特征。Cho[2]定义了四个不同视角（前视，左视，右视，后视），通过学习对应的匹配权重来强化相同视角行人图像的匹配。Cheng[3,4]首次基于图像结构提出了更加细微的姿态表示方法，更加注重于匹配个体部分。Zheng[5]提出使用利用CNN的外部姿态估计
论文解读：DeepSort（目标跟踪） AI大道理目标跟踪（Object Tracking）目标跟踪人工智能计算机视觉
本文来自公众号“AI大道理”——————论文原文：https://arxiv.org/abs/1703.07402SORT是一个比较简单的算法，用FrRCNN做探测，卡尔曼滤波和匈牙利算法做跟踪。缺点：线性恒速运动模型可能并不精确，未考虑相机的非线性运动。未考虑同一目标再次出现的重识别(Re-ID)问题。deepSort就是在SORT的基础上进行改进，有效地减少了身份切换的数量，缓解了重识别问题。
【目标跟踪】2、FairMOT | 平衡多目标跟踪中的目标检测和 Re-ID 任务 | IJCV2021 呆呆的猫目标跟踪目标跟踪目标检测人工智能
文章目录一、背景二、方法2.1Backbone2.2检测分支2.3Re-ID分支2.4训练FairMOT2.5OnlineInference三、效果3.1数据集3.2实现细节3.3消融实验3.4最终效果论文：FairMOT:OntheFairnessofDetectionandRe-IdentificationinMultipleObjectTracking代码：https://github.co
re-id #issue Simplicity_ 学习笔记 pytorch
#1尝试跑https://github.com/L1aoXingyu/reid_baseline的试验，发现import的问题如下：Traceback(mostrecentcalllast):File"tools/train.py",line15,infromdataimportmake_data_loaderFile"./data/__init__.py",line7,infrom.buildi
车辆重识别/再辨识数据集： Vehicle Re-ID Datasets Collection 羽客S 数据集 python
转载自：https://zhuanlan.zhihu.com/p/106216763车辆数据库1.ADeepLearning-BasedApproachtoProgressive车辆数据库1.ADeepLearning-BasedApproachtoProgressiveVehicleRe-identificationforUrbanSurveillance数据库名称：VeRi776论文：http
【科研】【ReID】科研论文怎么写？八股文写作思路锥栗 ML&DL ReID 人工智能计算机视觉
拿DenselySemanticallyAlignedPersonRe-Identification这篇文章举例。本文写作非常好，写的很有逻辑，很标准。科研论文虽然是八股文，但是能经历了百年的发展而来，有它的合理性。我把它Introduction的写作思路跟一下，与诸位共勉：首先，按照国际惯例：先介绍一下ReID，和ReID面临的问题/痛点：行人重识别（re-ID）旨在匹配特定的跨多个摄像机视图或
[笔记]Dissecting Person Re-identification from the Viewpoint of Viewpoint 砖业人士
摘要：行人重识别领域中，通常认为的挑战是不同摄像头拍摄的图片在视角、行人姿态、光照、背景、分辨率等视觉因素方面的巨大差异造成准确率不高。但是，现下只是认为这些因素会影响识别精度，并没有定量的研究说明这些因素会怎样影响一个re-ID系统的识别精度。这篇文章就尝试从视角的角度去分析，摄像头视角的不同是怎么影响行人重识别精度的。因而标题是fromtheviewpointofviewpoint.论文的主要
Unsupervised Person Re-identification by Soft Multilabel Learning 阅读笔记 Anderson_luo
这篇是CVPR2019已经录用的少数几篇re-ID方向的论文，来自中山大学和腾讯实验室，代码也已经放出来了(https://github.com/KovenYu/MAR)想法是引入辅助数据集来挖掘无标签的样本潜在的标签信息，有效地提升了无监督re-ID的效果.1.文章解决了什么问题，提出了怎样的解决方法1）在无监督的re-ID中，因为缺少跨摄像头的成对的标签图片，因此我们很难学习到discrimi
论文精读：FairMOT: On the Fairness of Detection and Re-Identification in MultipleObject Tracking 樱花的浪漫目标追踪网络深度学习计算机视觉人工智能 cnn
1.提出背景以往的工作通常将re-ID视为次要任务，其准确性受到主要检测任务的严重影响。因此，网络偏向于主检测任务，这对re-ID任务不公平。2.核心思想将MOT表示为单个网络中目标检测和reid的多任务学习，因为它允许两个任务的联合优化，并且具有较高的计算效率。然而，我们发现这两个任务倾向于相互竞争，这需要仔细处理。特别是，以往的工作通常将re-ID视为次要任务，其准确性受到主要检测任务的严重影
论文笔记——FairMOT：A Simple Baseline for Multi-Object Tracking 汐梦聆海多目标追踪
论文题目：ASimpleBaselineforMulti-ObjectTracking论文链接：https://github.com/ifzhang/FairMOT以往的MOT大多是基于tracking-by-detection的，首先对每一个frame做检测，再用re-Id，各种匹配关联算法进行dataassociation，这两个步骤都是独立的。这篇文章提出了一个网络，可以将上述步骤进行结合，
无监督与领域自适应的行人重识别任务(Re-ID) 努力学习DePeng 深度学习计算机视觉
参考链接：IntroductiontoMutualMean-Teaching(ICLR2020),StructuredDomainAdaptation,VisDA-2020Solution(ECCVW2020),Self-pacedContrastiveLearning(NeurIPS2020),OpenUnReIDCodebase.领域自适应（DomainAdaptive）Commonscena
顶刊TIP 2023｜Rethinking无监督行人Re-ID，中科院研究团队表明采样策略是重中之重 CV顶刊顶会顶刊TIP 人工智能计算机视觉
论文标题：RethinkingSamplingStrategiesforUnsupervisedPersonRe-Identification论文链接：https://ieeexplore.ieee.org/document/9969623代码仓库：https://github.com/ucas-vg/GroupSampling作者单位：中国科学院大学、鹏城实验室、天津大学欢迎关注微信公众号CV顶
Re-id多粒度网络（MGN）的PPT汇报总结三度就好 reid 深度学习论文学习深度学习
本文是对上篇MGN论文阅读做一个详细的补充，主要补充其结构设计及技术实现细节。文章内容整合来自云从科技资深算法研究员袁余锋老师，通过以下四个方面来讲解本次课题：1、ReID的定义及技术难点；2、常用数据集与评价指标简介；3、多粒度网络（MGN）的结构设计与技术实现；4、ReID在行人跟踪中的应用分析与技术展望ReID是行人智能认知的其中一个研究方向，行人智能认知是人脸识别之后比较重要的一个研究方向
行人重识别通用数据集及介绍 tcsone 人工智能深度学习
行人重识别（personre-identification,Re-ID）作为一个特定的跨不重叠摄像头的检索问题，已经有了许多的研究，可广泛应用于智能视频监控，智能安保等领域。给定想要查询的人（query）,Re-ID的目标便是确认该查询是否在另一个地点不同时间被另一个摄像头捕捉到，或者是不同时间被同一个摄像头所捕捉到。行人重识别的挑战在于类内差异大，类间差异小，即同一个人在不同时刻的特征差异大（由
Horizontal Pyramid Matching for Person Re-ID sth_catcher
行人再识别问题行人再识别是一项很具有挑战性的任务，主要因素包括环境因素和行人本身的因素：（1）环境因素：复杂的背景、光照、获取的图像分辨率等；（2）行人因素：衣着、姿势、步态等。之前很难提取到robust的特征，深度学习的发展使特征提取成为可能。论文方法[主要思想]使用多个尺度，将提取到的特征图进行水平划分成bins；将每个bin分别进行平均池化和最大池化，并将两个池化结果整合起来：每个尺度的不同
深度学习行人重识别综述与展望，TPAMI 2021 最新文章我爱计算机视觉计算机视觉机器学习人工智能深度学习 python
作者|叶茫武汉大学编辑|CV君报道|我爱计算机视觉（微信id：aicvml）摘要：行人重识别（PersonRe-Identification，简称Re-ID），是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的AI技术，在智慧城市等监控场景中具有重要的应用意义和前景。本文介绍我们最新的IEEETPAMI综述论文《DeepLearningforPersonRe-identificat
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla