Yemiekai

目标跟踪 SiamRPN++（SiamRPN++：Evolution of Siamese Visual Tracking with Very Deep Networks）

文章标题：《SiamRPN++：Evolution of Siamese Visual Tracking with Very Deep Networks》
文章地址：(1) https://arxiv.org/pdf/1812.11703v1.pdf、(2) https://lb1100.github.io/SiamRPN++/
github地址：https://github.com/STVIR/pysot

2019年 CVPR 的一篇文章。
作者来自商汤研究院（SenseTime Research），中国科学院自动化研究所（CISIA），中科院计算所（ICT）。

摘要

基于暹罗网络（siamese network）的跟踪器的做法是：对匹配模板和搜索区域各自做卷积后，把得到的特征做互相关（cross-correlation）。然而这类跟踪器与最先进的算法相比仍然存在差距，不能发挥深层网络提取的特征，例如 ResNet-50 或更深的网络。本文我们证明了它的主要原因是没有严格平移不变性（translation invariance）。
（ the core reasion comes from the lack of strict translation invariance）

通过全面的理论分析和实验验证，用一个简单且高效的空间感知采样（spatial aware sampling）策略打破了这一限制，成功地训练了一个由 ResNet 所驱动的暹罗跟踪器，获得了显著的性能提升。

另外，我们提出了一个新的模块来进行 layer-wise 和 depth-wise 的汇聚，这不仅提升了准确度，并且减小了模型尺寸。

我们做了广泛的消融实验，证明了我们提出的跟踪器的有效性，在 $5$ 个大型跟踪基准上取得了最好的成绩：OTB2015，VOT2018，UAV123，LaSOT，TrackingNet。

介绍

视觉目标跟踪在过去的几十年里受到了越来越多的关注，一直是一个非常活跃的研究方向。它在视觉监控、人机交互、增强现实等多个领域有着广泛的应用。尽管最近已经取得了很大的进展，但由于照明变化、遮挡和背景杂乱等因素，仍然被普遍认为是一个非常具有挑战性的任务。

最近基于暹罗网络（siamese network）的跟踪器受到了广泛的关注。它把跟踪任务看做：学习到目标模板和搜索区域的特征表示，把它们进行互相关，学习这个互相关后的一般相似图。为了保证跟踪效率，这个暹罗相似度函数通常是离线学习的，在实际运行的时候就固定住。CFNet 和 DSiam 跟踪器会在线更新模型，分别用了移动平均的模板和快速转换模块。 SiamRNN 引入了区域提议网络（RPN），用在 Siamese network 之后，并且同时用了分类和回归来做跟踪。DaSiamRPN 跟踪器进一步引入了干扰感知模块，提高了模型的辨别能力。

虽然以上的 Siamese 跟踪器取得了很好的跟踪性能，尤其是在精度和速度方面取得了平衡。不过，即使是性能最好的SiamPRN ，在 OTB2015 等基准上的精度与目前最先进的跟踪器仍有显著的差距。我们观察到，所有这些跟踪器都在类似 AlexNet 的架构上构建了自己的网络，并多次尝试使用更复杂的架构（如 ResNet-50）来训练Siamese跟踪器，但没有任何性能增益。基于这样的观察，我们对现有的暹罗追踪器进行了分析，发现其核心原因在于严格平移不变性的破坏。由于目标可能出现在搜索区域的任何位置，因此学习后的目标模板特征表示应该保持空间不变，我们进一步从理论上发现，在现代深度架构中，只有变种的零填充（zero-padding）的 AlexNet 满足这种空间不变限制。

为了克服这种限制，用更深网络来驱动 Siamese 跟踪器，通过广泛的实验验证，我们通过引入了一种简单且高效的采样策略来打破这种空间不变性（spatial invariance）的限制。我们用 ResNet 作为骨干（backbone）来训练一个基于 SiamRPN 的跟踪器，获得的显著的性能提升。得益于 ResNet 的架构，我们为互相关操作（cross-correlation）提出了一种layer-wise 的特征汇聚结构，帮助跟踪器从多级网络中学习到的特征来预测相似度（similarity map）。通过分析用于互相关（cross-correlation）的暹罗网络结构，我们发现两条网络支路在参数量方面非常不平衡，于是我们进一步提出了深度可分离互相关结构（depth-wise separable correlation），这不仅极大地减少了目标模板支路的参数量，而且使得整个模型的训练过程更加稳定。另外，我们还发现了一个有趣的现象，同一类的目标在相同的通道上会得到较高的响应，其余的通道会被抑制。正交性质也会提高跟踪器的性能。

总地来说，我们的主要贡献如下：

$\bullet$ 对 Siamese 跟踪器进行了深入的分析，证明了使用更深的网络时准确度的下降，是由于破坏了平移不变性。
$\bullet$ 提出了一种简单而有效的采样策略来打破空间不变性限制，成功地训练了由 ResNet 架构驱动的 Siamese 跟踪器。
$\bullet$ 提出了一种 layer-wise 的特征聚合结构来进行互相关（cross-correlation）操作，帮助跟踪器从多级特征中预测相似性图（similarity map）。
$\bullet$ 提出了一种深度可分离互相关（depth-wise separable correlation）结构来增强互相关，产生多个不同语义的相似图（similarity map）。

基于上述理论分析和技术贡献，我们开发了一种高效的更正模型，在跟踪准确度上达到了最先进的水平，以 $35\text{FPS}$ 的速度运行。我们取名为 $\text{SiamRPN++}$ ，我们用 MobileNet 做了一个变种，不仅很快，性能也很能打，运行速度达到 $70\text{FPS}$ 。为了促进研究，代码和训练好的模型也开源了。

Siamese Tracking with Very Deep Networks
（用很深的网络来做暹罗跟踪）

本文最重要的一个发现是，如果使用更深的网络，基于暹罗网络的跟踪算法的性能可以显著提高。但是，简单滴用更深的网络（如 ResNet）是不行的，达不到预期。我们发现这和暹罗跟踪器的内在限制有关。所以我们先对暹罗网络进行深入的分析。

Analysis on Siamese Networks for Tracking

基于暹罗网络的跟踪算法把视觉跟踪任务看做一个互相关（cross-correlation）的问题，它用一个结构为暹罗网络的深度模型，从中学习跟踪相似度图。一个支路学习跟踪目标模板的特征表示，另一个支路学习搜索区域的特征表示。目标模板的图片一般从序列第一帧选取，用 $\textbf{z}$ 表示。要在语义特征嵌入空间 $\phi(\cdot)$ 中，从后续视频帧 $\textbf{x}$ 中找到最相似的范例： $f(\textbf{z}, \textbf{x}) = \phi(\textbf{z}) * \phi(\textbf{x}) + b \tag{1}$ 其中 $b$ 用来建模相似值的偏移（model the offset of the similarity value）。

在设计暹罗跟踪器时，这个简单的匹配函数天然地隐含了两个内在的限制。
$\bullet$ 特征提取部分和收缩部分对于平移不变性存在内在性约束（The contracting part and the feature extractor used in Siamese trackers have an intrinsic restriction for strict translation invariance）： $f(\textbf{z},\textbf{x}[\triangle\tau_j]) = f(\textbf{z},\textbf{x})[\triangle\tau_j]$ ，其中 $[\triangle\tau_j]$ 是平移子窗口操作（translation shift sub window operator），保证了训练和推理的有效性。
$\bullet$ 收缩部分（contracting part）对于结构对称性（structure symmetry）存在内在性约束（intrinsic restriction）。例如 $f(\textbf{z}, \textbf{x}') = f(\textbf{x}',\textbf{z})$ ，这是适合做相似学习的（which is appropriate for the similarity learning）。

经过详尽的分析，我们发现用不了深层网络的核心原因在于两个方面。具体来说，一个原因是 padding 会破坏平移不变性。另外一个是， $\text{RPN}$ 需要非对称（asymmetrical）的特征来做分类和回归。我们将引入空间感知的采样策略来应对第一个问题，第二个问题在后面章节讨论。

只有在没有 padding 的网络中，才符合严格的平移不变性（strict translation invariance），例如改造过的 no-padding 的 AlexNet。先前大家用的暹罗跟踪网络都比较浅，所以符合这种限制。如果我们用 ResNet、MobileNet 等现代网络，为了使网络更深，会不可避免地用到 padding，这将破坏平移不变性。我们的假设是，违反了这一点会导致空间偏差。

我们在一个没有 padding 的网络上进行模拟实验来证明我们的假设。我们把漂移（shift）定义为：在数据增强中，均匀分布产生的最大平移范围（max range of translation generated by a uniform distribution in data augmentation）。我们的实验如下。首先，把目标放在中心，分别设置 $3$ 个漂移范围（ $0$ ， $16$ ， $32$ ）进行 $3$ 次训练实验。收敛后，将测试数据集生成的热图进行汇总，结果如图(1)所示。

(图1)

在第一个实验中，shift 量为 $0$ ，在边界处预测概率降至零。这表明无论测试目标的外表是什么，都学到了一个强力的中心偏置。另外两个实验表明增加漂移（shift）的范围可以逐渐防止模型崩塌为这种没有用的解。定量结果表明，shift 为 $32$ 的汇聚热力图更接近测试对象的位置分布。实验证明，该采样策略有效地缓解了没有 padding 的网络对平移不变性的破坏。

为了防止在目标上产生一个强烈的中心偏置，我们用空间感知采样策略（spatial aware sampling strategy），用 ResNet-50 作为骨干来训练 SiamRPN，通过在搜索图上进行均匀分布来采样匹配目标。如图(2)所示，在 VOT2018 上零漂移（zero shift）的性能下降到了 $0.14$ ，合适漂移（ $±64 \pm64$ 像素）对于训练深度暹罗跟踪器至关重要。

(图2)

ResNet-driven Siamese Tracking

基于上述分析，可以消除中心偏差的影响。一旦我们消除了学习到的对于中心位置偏差，任何现成的网络（例如 MobileNet, ResNet 等）都可以迁移学习用来跟踪。另外，我们可以自适应地构造网络拓扑结构，发挥深度网络的性能。

这一小节将会讨论如何把深度神经网络搞到我们的跟踪算法里。特别地，我们的实验主要集中在 ResNet-50 上。原本的 ResNet-50 下采样倍率很大，Stride 为 $32$ 个像素，对于我们的任务（dense Siamese network）是不太合适的。

(图3)

如图(3)所示，我们修改了 $c o n v 4$ 和 $c o n v 5$ 中的东西，使整个网络的下采样倍数（stride）为 $8$ 。
（原本经过 $c o n v 4$ 之后是 $16$ 倍，经过 $c o n v 5$ 之后是 $32$ 倍了）
同时通过空洞卷积（dilated convolutions）来增加感受野（receptive field）。再加一个 $\times 1$ 的卷积层把每一个 block 的输出通道数降至 $256$ 。

由于每一层都保留着 padding，模板特征的空间尺寸增至 $15$ ，这么大的面积对于相关（correlation）的计算带来较大的负担。于是我们裁剪出中间的 $7\times7$ 的区域当做模板特征，其中每个格子仍然能捕捉整个目标区域。

像 SiamRPN 那样，我们用互相关层和全卷积层来组成网络头，用于计算分类得分（记为 $\mathcal{S}$ ）和包围框回归（记为 $\mathcal{B}$ ）。Siamese RPN 块记为 $\mathcal{P}$ 。

进一步地我们发现微调的 ResNet 能够提升性能。把 ResNet 特征提取器的学习率设置为 RPN 部分的 $1 / 10$ ，使特征表示更适合跟踪任务。与传统的 Siamese 方法不同，深度网络的参数可以一起进行端到端的训练。据我们所知，端到端地训练一个这么深的网络，用于跟踪任务的，我们是第一个。

Layer-wise Aggregation

利用了深度网络之后，我们可以把不同深度的层聚合起来。直观地讲，视觉跟踪任务需要丰富的表示，从低层次到高层次，从大尺度到小尺度，从细到粗的分辨率。尽管卷积网络有的深度特征，但是一个孤立的层是不够的，混合、汇聚这一些特征表示，能够提高 recognition 和 localization 的推理。

在先前的工作中，用的是一些比较浅的网络，像 AlexNet ，那些网络的多级特征并不能提供非常丰富的特征表示。而 ResNet 中的不同层会更有意义，因为感受野的变化很大。在前面那些层主要关注的是较低层次的信息，例如颜色、形状等，这是定位（localization）所必须的，不过缺乏语义信息。后面几层的特征含有更丰富的语义信息，在一些具有挑战性的场景中，如运动模糊、巨大变形，这可能是有益的。使用这种丰富的层次信息是为了帮助跟踪。

在我们的网络里，通过提取多个分支的特征来协同进行目标定位。对于 ResNet-50，我们从最后 $3$ 个残差块中提取的多级特征来做 layer-wise 的汇聚。我们将这几个输出分别称为 $\mathcal{F}_3(\textbf{z})$ ， $\mathcal{F}_4(\textbf{z})$ ， $\mathcal{F}_5(\textbf{z})$ 。如图(3)所示， $c o n v 3$ ， $c o n v 4$ ， $c o n v 5$ 的输出被分别放进 $3$ 个 Siamese RPN 模块。

由于 $3$ 个 RPN 模块输出的空间分辨率尺寸是一样大的，因此直接对 RPN 的输出做加权和。 $\mathcal{S}_{all} = \sum^5_{l=3} \alpha_i * \mathcal{S}_l \;，\quad \mathcal{B}_{all} = \sum^5_{l=3} \beta_i * \mathcal{B}_l \tag{2}$
由于作用域不同，分类的结合权重和回归的结合权重是不一样的。这个权重也随着网络进行离线的端到端训练。

与之前的工作相比，我们的方法没有明确地把卷积特征相结合，而是分别学习分类器和回归。值得注意的是，随着骨干网深度的显著增加，我们可以从视觉-语义层次结构的多样性中获得实质性的收益。

Depthwise Cross Correlation

互相关（cross correlation）模块是一个关键的操作，它将两条支路的信息相嵌起来。
SiamFC 利用互相关操作获得单个通道的响应图，用于目标的定位。
SiamRPN 添加了一个很大的卷积层（UP-Xcorr）将互相关进行扩展，以嵌入更高级别的信息（例如anchor）。但是他的 up-channel 模块太大，造成参数分布严重不平衡（RPN 模块的参数量是 $20\text{M}$ ，而特征提取器只有 $4\text{M}$ ）。使得训练优化很困难。

本小节将介绍一个轻量级的互相关层，称为深度互相关（Depthwise Cross Correlation，DW-XCorr），为了使信息关联更有效率，DW-XCorr 层的参数量比 SiamRPN 中的 UP-Xcorr 要少 $10$ 倍，性能与之相当。

为了做到这一点，我们用了 conv-bn 块来调整每个残差块输出的特征，使其适应跟踪任务。基本上，包围框的预测和 anchor based 的分类都是对称的，这与 SiamFC 不同。为了对差异进行编码，模板支路和搜索支路经过两个不共享权重的卷积层。然后两个特征图具有相同的通道数，在每个通道上各自做互相关，再用一个 conv-bn-relu 层来融合不同通道的输出。最后，再加上分类头和回归头。

通过将交叉互相关（cross-correlation）操作替换为深度互相换（depthwise correlation），可以显著地减少计算量和内存。这样的话，模板分支和搜索分支的参数量取得了平衡，使得训练过程更加稳定。

我们还发现了一个有趣的现象，如图(5)所示。

(图5)

同一类的物体在相同的通道上具有较大的响应（车子在第 $148$ 通道，人在第 $222$ 通道，人脸在第 $226$ 通道），而其它的通道会被抑制。这种特性可以被压缩，因为 depth-wise cross correlation 操作几乎是正交的，每个通道代表一些语义信息。我们同样分析了用 up-channel cross correlation 产生的热力图，它的响应图的可解释性较差。

实验

数据集与评价

Training
我们用的 backbone 是在 ImageNet 上预训练过的，经过证明，用这个权重来初始化其它任务是很好的。我们用 COCO、ImageNet DET、ImageNet VID、YouTube-BoundingBoxes 这几个数据集来训练，对于跟踪任务，让我们的网络学习一种概念，来度量两个目标之间的相似性。在训练和测试中，我们用的目标（template）图的尺寸是 $127$ 像素，搜索（search）图的尺寸是 $255$ 像素。

Evaluation
我们用 OTB-2015、VOT2018、UAV123 来关注短期的单目标跟踪任务。在 VOT2018-LT 来评估长期跟踪性能。在长期跟踪中，目标可能长时间离开视场或完全被遮挡，这比短期跟踪更具挑战性。我们还分析了我们的方法在LaSOT 和 TrackingNet 上的泛化性，这两个数据集是近年两个最大的单目标跟踪基准。

实现细节

Network Architecture
实验部分我们按照 DaSiamRPN 的设置进行训练和推理。我们在这个降低了下采样倍数的 ResNet-50 上添加了两个卷积层来对 $5$ 个 anchors 做 classification 和 bounding box regression。在 conv3、conv4、conv5 上各用一个 $1\times1$ 的卷积层把特征维度降至 $256$ 。

Optimization
优化器用的 SGD，在 $8$ 个 GPU 上训练，每个 minibatch 是 $128$ pairs 的图片（每张 GPU 上 $16$ 对）。训练 $12$ 个小时后收敛。前 $5$ 个 epoch 用 $0.001$ 的 warmup 学习率来训练 RPN 支路，后面 $15$ 个 epoch 整个网络的学习率从 $0.005$ 指数衰减到 $0.0005$ 。momentum 为 $0.9$ 。regression 的损失是标准的 smooth $L_1$ 损失，训练损失是分类和回归损失的总和。

消融实验

Backbone Architecture
特征提取器的选择至关重要，因为参数的数量和层的类型直接影响跟踪器的内存、速度和性能。我们比较了不同的模型结构，图(6)展示了用 AlexNet、ResNet-18、ResNet-34、ResNet-50、MobileNet-v2 作为骨干的性能。我们在 OTB2015 上用成功率的 AUC (Area Under Curve) 作为纵坐标，用 ImageNet 上的 top1 accuracy 作为横坐标，来报告他们的性能。我们观察到 SiamRPN++ 能够从更深的网络中受益。

(图6)

表1也表明了从 AlexNet 换成 ResNet-50 后，在 VOT2018 上的性能提升了不少。另外，我们的实验表明对网络骨干部分进行精调是很关键的，能极大地提升跟踪性能。

(表1)

Layer-wise Feature Aggregation
为了探究 layer-wise 特征汇聚的影响，我们用 ResNet-50 训练了 $3$ 个变体，它们都只用单个 $R P N$ 。我们发现只对 $c o n v 4$ 用 RPN 就能达到很有竞争力的性能，得到 $0.374$ 的 EAO，而深一层或者浅一层都会变差，性能会掉 $4\%$ 。 如果用两个分支， $c o n v 4$ 和 $c o n v 5$ 结合能得到提升，结合另外两个则没有提升。尽管如此，robustness 还是提升了 $10\%$ ，这是我们跟踪器的主要缺陷。将 $3$ 个 $c o n v$ 都结合起来的话，accuracy 和 robustness 都得到稳定的提升，在 VOT 和 OTB 上提升了 $3.1\%$ 和 $1.3\%$ 。总的来说，做了 Layer-wise Feature Aggregation 之后，在 VOT2018 上取得 $0.414$ 的 EAO，比单个 layer 高 $4.0\%$ 。

Depthwise Correlation
和 UP-Channel Cross Correlation 相比，我们的 depthwise correlation 在 VOT2018 上提高了 $2.3\%$ ，在 OTB2015 上提高了 $0.8\%$ ，如表(1)所示。这在一定程度上是因为两个分支的平衡参数分布使学习过程更稳定，收敛性更好。

不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
基于JAVA中的spring框架和jsp实现自然灾害论坛平台项目【附项目源码+论文说明】大雄是个程序员项目实践自然灾害论坛平台 java 项目源码 spring 毕业设计课程设计网页设计
摘要在上个世纪末期，也就是20世纪末，随着计算机技术的发展与进步和数据库方面的知识在互联网的大力运用，互联网技术以及网站技术在网上的大力推广，网上论坛（自然灾害论坛）也逐渐在网兴起，它的出现帮助了网上各种特定的群体进行一个在线的知识传递与信息的交流。本计算机自然灾害论坛设计，采用了JSP（JAVA）技术和MYSQL数据库开发，尝试实现了自然灾害论坛的基本功能以及帮助我们掌握了论坛技术的核心特点。该
穴位按摩培训系统Django-SpringBoot-php-Node.js-flask QQ188083800 django spring boot php
目录具体实现截图技术栈介绍系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示具体实现截图技术栈介绍本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。研究的选题立意明确，结构合理，研究内容充实，研究方法准确有
【读点论文】Chain Replication for Supporting High Throughput and Availability 寻雾&启示分布式系统论文阅读
在分布式系统中，强一致性往往和高可用、高吞吐是矛盾的。比如传统的关系型数据库，其保证了强一致性，但往往牺牲了可用性和吞吐量。而像NoSQL数据库，虽然其吞吐量、和扩展性很高，但往往只支持最终一致性，无法保证强一致性。由此ChainReplicationforSupportingHighThroughputandAvailability提出了链式复制协议，旨在保证高吞吐、高可用的同时，支持数据的强一
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
【软考论文】论软件系统架构评估罗小爬EX 软考（系统架构师）软考系统架构师论文
目录一、题目二、论文2.1摘要2.2正文三、扩展3.1基础知识3.2评估方式综合对比3.3SAAM基于场景的架构分析方法3.4ATAM架构权衡分析方法3.5质量属性一、题目对于软件系统，尤其是大规模的复杂软件系统来说，软件的系统架构对于确保最终系统的质量具有十分重要的意义，不恰当的系统架构将给项目带来高昂的代价和难以避免的灾难。对一个系统架构进行评估，是为了：分析现有架构存在的风险，检验设计中提出
论文阅读：2023 arxiv Multiscale Positive-Unlabeled Detection of AI-Generated Texts CSPhD-winston-杨帆论文阅读论文阅读人工智能
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://arxiv.org/abs/2305.18149https://www.doubao.com/chat/211427064915225
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
Transposed convolution（2016 IEEE）刘若里论文阅读人工智能计算机视觉学习网络笔记
论文标题FullyConvolutionalNetworksforSemanticSegmentation论文作者EvanShelhamer,JonathanLong,TrevorDarrell发表日期2016年05月01日GB引用>ShelhamerEvan,LongJonathan,DarrellTrevor.FullyConvolutionalNetworksforSemanticSegme
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
《基于自适应正负样本对比学习的特征提取框架》-核心公式提炼简洁版 2022年neural networks 阳光明媚大男孩学习深度学习人工智能论文笔记
论文源地址以下是从文档中提取的关于“基于对比学习的特征提取框架（CL-FEFA）”中正负样本对比学习实现的技术细节，包括详细的数学公式、特征提取过程以及特征表示方式的说明。1.正负样本的定义与构造在CL-FEFA框架中，正负样本的定义是动态且自适应的，基于特征提取的结果，而不是预先固定的。这种自适应性是CL-FEFA区别于传统对比学习（如SimCLR、SupCon）的一个关键点。定义方式：指示矩阵
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

目标跟踪 SiamRPN++（SiamRPN++：Evolution of Siamese Visual Tracking with Very Deep Networks）

摘要

介绍

相关工作

Siamese Tracking with Very Deep Networks
（用很深的网络来做暹罗跟踪）

Analysis on Siamese Networks for Tracking

ResNet-driven Siamese Tracking

Layer-wise Aggregation

Depthwise Cross Correlation

实验

数据集与评价

实现细节

消融实验

你可能感兴趣的:(跟踪,论文,目标跟踪,计算机视觉,人工智能)

目标跟踪 SiamRPN++（SiamRPN++：Evolution of Siamese Visual Tracking with Very Deep Networks）

摘要

介绍

相关工作

Siamese Tracking with Very Deep Networks（用很深的网络来做暹罗跟踪）

Analysis on Siamese Networks for Tracking

ResNet-driven Siamese Tracking

Layer-wise Aggregation

Depthwise Cross Correlation

实验

数据集与评价

实现细节

消融实验

你可能感兴趣的:(跟踪,论文,目标跟踪,计算机视觉,人工智能)

Siamese Tracking with Very Deep Networks
（用很深的网络来做暹罗跟踪）