MJ5513

SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks(论文翻译)

论文地址：https://arxiv.org/pdf/1812.11703.pdf

项目地址：SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

摘要

基于孪生网络的跟踪器将跟踪公式化为目标模板和搜索区域之间的卷积特征互相关。然而，与最先进的算法相比，孪生追踪器的准确度仍然有差距，而且它们不能利用深层网络的特性，例如 resnet-50或更深层次的特性。在本文中，我们证明了其核心原因在于缺乏严格的平移不变性。通过全面的理论分析和实验验证，我们通过一种简单而有效的空间感知采样策略突破了这一限制，成功地训练了一个性能有明显提高的ResNet-driven的孪生跟踪器。此外，我们提出了一个新的模型架构来执行分层和分深度的聚合，这不仅进一步提高了精度，而且减少了模型的大小。我们进行了广泛的消融实验来证明所提出的跟踪器的有效性，目前在五大跟踪基准上获得了最好的结果，包括 OTB2015 VOT2018 UAV123 LaSOT 和 TrackingNet。我们的模型将会发布，以便进一步的研究。

1.引言

视觉目标跟踪在过去的几十年中受到了越来越多的关注，并且一直是一个非常活跃的研究方向。它在视觉监控、人机交互、扩增实境等不同领域有着广泛的应用。尽管最近已经取得了很大进展，但由于光照变化、遮挡和背景杂波等诸多因素的影响，这仍然是一项非常具有挑战性的任务。

最近，基于孪生网络的跟踪器[40,1,15,42,41,24,43,52,44]引起了社会的广泛关注。这些孪生跟踪器通过在目标模板和搜索区域的特征表示之间建立互相关来学习一个通用的相似性映射，从而形成视觉目标跟踪问题。为了确保跟踪效率，离线学习的孪生相似性函数通常在运行时固定[40,1,15]。CFNet 跟踪器[41]和 DSiam 跟踪器[11]分别通过运行平均模板和快速转换模块更新跟踪模型。 SiamRPN 跟踪器[24]在Siamese网络之后引入了区域建议网络[24] ，并进行联合分类和回归跟踪。DaSiamRPN 跟踪器[52]进一步引入了一个干扰器感知模块，并提高了模型的识别能力。

虽然上述Siamese追踪器获得了出色的追踪性能，特别是在均衡的精度和速度方面，即使是表现最好的Siamese追踪器，比如SiamRPN，在追踪基准上的精度仍然与最先进的追踪基准存在显著差距。我们观察到，所有这些追踪器都在类似 Alexnet [23]的架构上建立了自己的网络，并多次尝试训练具有更复杂架构的暹罗追踪器，比如 ResNet [14] ，但没有任何性能提升。受此启发，我们对现有的Siamese追踪器进行了分析，发现其核心原因在于严格的平移不变性的破坏。由于目标可以出现在搜索区域的任意位置，因此目标模板的学习特征表示应该保持空间不变，我们进一步从理论上发现，在现代深度结构中，只有补零变量满足这一空间不变性约束。

为了克服这个限制，使Siamese跟踪器具有更强大的深层架构，通过广泛的实验验证，我们提出了一个简单而有效的采样策略来突破了Siamese跟踪器的空间不变性限制。我们成功地训练了一个基于使用ResNet作为骨干网络的 SiamRPN [24]跟踪器，并获得了显著的性能改进。受益于 ResNet 体系结构，我们提出了一个分层的特征加重结构用于互相关操作，这有助于跟踪器从多个层次学习的特征中预测相似度图。通过分析连体网络的互相关结构，我们发现它的两个网络支路在参数数上存在高度不平衡;为此，进一步提出了一种深度可分离相关结构，该结构不仅大大减少了目标模板分支中的参数个数，而且稳定了整个模型的训练过程。此外，还观察到一个有趣的现象，即同一类别的物体在同一通道上有高的响应，而其余通道的响应被抑制。正交性也可以提高跟踪性能。

总而言之，这项工作的主要贡献如下:

1.通过对Siamese追踪器的深入分析，证明了深度网络使用时，由于严格的平移不变性的破坏，导致精度下降。

2.我们提出了一种简单而有效的采样策略，突破了空间不变性的限制，成功地训练了由ResNet结构驱动的Siamese跟踪器。

3.我们提出了一种分层的特征聚合结构用于互相关操作，这有助于跟踪器从多个层次学习的特征中预测相似性映射。

4.我们提出了一种深度可分离的相关结构来增强互相关，从而产生多个与不同语义相关的相似映射。

在上述理论分析和技术贡献的基础上，我们开发了一个高效的视觉跟踪模型，建立了一个新的就跟踪精度而言最先进的算法，同时高效运行在35FPS。这个被称为 SiamRPN++ 的跟踪器，在五个最大的跟踪基准上，包括 OTB2015[46]、 VOT2018[21]、 UAV123[31]、 LaSOT [10]和 TrackingNet [30] ，始终获得最好的跟踪结果。此外，我们还提出了一种使用 MobileNet [18]骨干网的快速变体跟踪器，该骨干网在保持竞争性能的同时，运行速度为70 FPS。为了便于对视觉跟踪方向的进一步研究，我们将发布SiamRPN跟踪器的源代码和训练模型。

2.相关工作

在这一部分，我们简要介绍了最近的追踪器，特别关注Siamese网络的追踪器[40,1]。此外，还介绍了深度网络的最新发展。由于构建了新的基准数据集[45,46,19,21,10,30]和改进了的方法[16,51,6,7,17,32,9,5,43,52,49] ，视觉跟踪在过去十年中得到了迅速的发展。标准化的基准[45,46,10]为与不同算法的比较提供了公平的测试平台。每年举办的追踪挑战赛[22,19,20,21]不断推动追踪表现。随着这些进步，许多有前途的跟踪算法被提出。Bolme 等人的开创性工作把卷积定理从信号处理领域引入视觉跟踪，并把目标模板匹配问题转化为频域中的相关运算。对于这种转换，基于相关滤波器的跟踪器不仅获得了高效的运行速度，而且如果使用适当的特征，还可以提高精度[16,50,51,8,6]。随着深度学习模型在视觉跟踪中的广泛应用，基于深度特征表示的相关滤波器的跟踪算法[9,5]在流行的跟踪基准[45,46]和挑战[22,19,20]中获得了最先进的精度。

最近，基于Siamese网络的追踪器因其良好的跟踪精度和效率而受到了广泛关注[40,1,15,42,41,12,24,43,52,44]。这些追踪器将视觉跟踪作为一个互相关问题来解决，期望它们能更好地利用深层网络的优点，从端到端学习。为了从两个分支的互相关生成相似性映射，他们训练了一个 Y型神经网络，将两个网络分支连接起来，一个用于对象模板，另一个用于搜索区域。此外，这两个分支可以保持固定在追踪阶段[40,1,15,43,24,52]或在线更新，以适应目标的外观变化[42,41,12]。目前最先进的Siamese追踪器[24,52]通过Siamese网络之后的区域建议网络提高了跟踪性能，并产生了非常有希望的结果。然而，在 OTB 基准[46]上，它们的跟踪精度仍然与最先进的深度跟踪器(如 ECO [5]和 MDNet [32])存在相对较大的差距。

2012年，随着Alex等人提出的现代深度建筑网络的建议，网络结构的研究正在迅速发展，许多复杂的深度建筑被提出，如 VGGNet [37] ，GoogleNet [38] ，ResNet [14]和 MobileNet [18]。这些深层架构不仅提供了对神经网络设计的更深入的理解，同时也推动了许多计算机视觉任务的发展像目标检测[33]，图像分割[4]和人体姿态估计[39]。在深度视觉追踪器中，网络结构通常包含不超过5个由 AlexNet 或 VGGNet 定制的结构层。这种现象解释了浅层特征主要有助于物体的准确定位[34]。在这项工作中，我们认为，如果模型在整个Siamese网络中得到适当的训练，使用更深层次的模型，Siamese追踪器的性能可以得到显著提高。

3.深度网络的Siamese跟踪

这项工作最重要的发现是，如果Siamese网络的跟踪算法装备了更深的网络，它的性能可以得到显著的提高。然而，仅仅通过直接使用更深层的网络(比如 ResNet)来训练Siamese跟踪器并不能获得预期的性能改进。我们发现潜在的原因很大程度上与Siamese追踪器的内在限制有关，因此，在引入Siamese追踪模型之前，我们首先对Siamese追踪网络进行了深入的分析。

3.1 Siamese网络跟踪分析

基于Siamese网络的跟踪算法[40,1]将视觉跟踪制定为一个互相关问题，并从具有Siamese网络结构的深度模型中学习跟踪相似性图，一个分支用于学习目标的特征表示，另一个分支用于搜索区域。目标块通常在序列的第一个框架中给出，可以看作是一个样本 z。我们的目标是在语义嵌入空间 φ ()中，从下面的框架 x 中找到最相似的块(实例) :

其中 b 用于模拟相似性值的偏移量。

这个简单的匹配函数自然地暗示了设计Siamese跟踪器的两个内在限制。

1.Siamese跟踪器中的联合部分和特征提取部分对于严格的平移不变性有着内在的限制, $f(z,x[\Delta \tau j])=f(z,x)[\Delta \tau j]$ ，其中 $[\Delta \tau j]$ 是转换移位子窗口算子，保证了有效的训练和推理。

2.连接部分对结构的对称性有内在的限制，例如，适用于相似性学习。

经过详细分析，我们发现阻止Siamese跟踪器使用深度网络的核心原因与这两个方面有关。具体来说，一个原因是深层网络中的填充会破坏严格的平移不变性。另一个是RPN 需要不对称特征进行分类和回归。我们将介绍空间感知的抽样策略来克服第一个问题，并在第3.4节讨论第二个问题。

严格的平移不变性只存在于没有填充的网络中，如修改的 AlexNet [1]。以前基于Siamese的网络[1,42,41,24,52]被设计得很浅以满足这个限制。然而，如果使用的网络被诸如ResNet或MobileNet这样的现代网络所取代，填充不可避免地会使网络更深入，这破坏了严格的平移不变性限制。我们的假设是，违反这一限制将导致空间偏差。

我们通过在一个有填充的网络上的仿真实验来验证我们的假设。移位定义为在数据增强过程中均匀分布所产生的最大平移范围。我们的仿真实验如下所示。首先，在三个不同的训练实验中，将目标放置在不同移位范围(0，16和32)的中心。收敛后，我们聚合测试数据集上生成的热图，然后在图1中可视化结果。在第一次零位移模拟中，边界区域上的概率被降级为零。结果表明，尽管有测试目标的出现，但学习到了很强的中心偏向。另外两个模拟表明，增大位移范围将逐渐防止模型崩溃到这个微不足道的解。定量结果表明，32偏移的聚合热图更接近于测试对象的位置分布。结果表明，空间感知采样策略有效地缓解了填充网络对严格平移不变性的破坏。

为了避免对目标产生强烈的中心偏向，我们采用空间感知采样策略对带有ResNet-50主干的SiamRPN进行训练。如图2所示，在VOT2018上，零位移性能降至0.14，适当的零位移(±64像素)对于训练深度暹罗跟踪器至关重要。

3.2 ResNet-driven的Siamese跟踪

通过以上分析，可以消除中心偏置的影响。一旦我们消除了对中心位置的学习偏差，任何现成的网络(如MobileNet、ResNet)都可以在域自适应后进行视觉跟踪。此外，我们还可以自适应地构建网络拓扑结构，揭示深度网络的视觉跟踪性能。

在这一小节中，我们将讨论如何将深度网络转移到我们的跟踪算法中。特别地，我们主要针对ResNet-50[14]进行实验。原始ResNet具有32个像素的大跨度，不适合密集暹罗网络预测。如图3所示，通过修改卷积4和卷积5块以具有单位空间步长，我们将最后两个块的有效步长从16个像素和32个像素减少到8个像素，并且还通过扩大卷积来增加其接收范围[27]。额外的1×1卷积层被附加到每个块输出，以将信道减少到256。

由于保留了所有层的填充，模板特征的空间大小增加到15，这给关联模块带来了很大的计算负担。因此，我们裁剪中心7×7区域[41]作为模板特征，其中每个特征单元仍然可以捕获整个目标区域。

在[24]之后，我们使用互相关层和全卷积层的组合来组装一个用于计算分类分数(表示为S)和边界盒回归(表示为B)的HEAD模块。Siamese RPN块用P表示。

此外，我们发现仔细微调ResNet会提高性能。通过将ResNet提取器的学习率设置为RPN部分的10倍，使得特征表示更适合于跟踪任务。与传统的Siamese方法不同，深层网络的参数是以端到端的方式联合训练的。据我们所知，我们是第一个在深度Siamese网络(>20层)上实现端到端学习以进行视觉跟踪。

3.3 分层聚合

在利用了ResNet-50这样的深层网络后，聚合不同的深层成为可能。直观地说，视觉跟踪需要从低到高、从小到大、从精细到粗略的丰富表示。即使在卷积网络中有这么深的特征，孤立的一层也是不够的：合成和聚合这些表示可以提高识别和定位的推论。

在以往只使用浅层网络(如AlexNet)的工作中，多层特征不能提供非常不同的表示。然而，考虑到接受场的差异很大，ResNet中的不同层更有意义。较早层的特征主要集中在颜色、形状等对定位至关重要的低层信息，而缺乏语义信息；较后层的特征具有丰富的语义信息，在运动模糊、巨大变形等挑战场景中是有益的。假设使用这种丰富的分层信息来帮助跟踪。

在我们的网络中，提取多分支特征来协同推断目标定位。对于ResNet50，我们探索了从最后三个残差块中提取的多层特征进行分层聚合。我们将这些输出分别称为F3(Z)、F4(Z)和F5(Z)。如图3所示，Cv3、Cv4、Cv5的输出分别馈入三个暹罗RPN模块。

由于三个RPN模块的输出尺寸具有相同的空间分辨率，因此直接对RPN输出采用加权和。加权融合层将所有输出组合在一起。

由于组合权重域不同，因此将它们分开进行分类和回归。权重与网络一起离线进行端到端优化。

与以往的工作不同，我们的方法没有显式地结合卷积特征，而是分别学习分类器和回归。请注意，随着主干网络深度的显著增加，我们可以从视觉语义层次的足够多样性中获得实质性的收益。

3.4 深度互相关

互相关模块是嵌入两个分支信息的核心操作。SiamFC[1]利用交叉相关层来获得用于目标定位的单通道响应图。在SiamRPN[24]中，通过增加一个巨大的卷积层来缩放信道(Up-Xcorr)，扩展了互相关以嵌入更高级别的信息，例如锚点。较重的上行通道模块使得参数分布严重不平衡(即RPN模块包含20M个参数，而特征提取器在[24]中只包含4M个参数)，这使得SiamRPN的训练优化变得困难。

在这一小节中，我们提出了一种轻量级互相关层，命名为深度互相关(DW-XCorr)实现高效的信息关联。在性能与SiamRPN相当的情况下，DW-XCorr层包含的参数比SiamRPN中使用的Up-XCorr少10倍。

为了实现这一点，采用了卷积BN块来调整每个剩余块的特征以适应跟踪任务。重要的是，包围盒预测和基于锚的分类都是不对称的，这与SiamFC不同(见3.1节)。为了编码差值，模板分支和搜索分支通过两个非共享卷积层。然后，具有相同通道数的两个特征映射逐个通道地进行相关运算。另一个conv-bn-relu块被附加以融合不同的通道输出。最后，添加分类或回归输出的最后一层卷积层。

通过将互相关替换为深度相关，可以大大降低计算量和内存使用量。这样，模板和搜索分支上的参数数量是平衡的，使得训练过程更加稳定。

此外，一个有趣的现象如图5所示。同一类别的物体在同一通道(汽车在第148通道，人在222通道，人脸在226通道)上的反应较高，而其余通道的反应被抑制。这一特性可以理解为深度互相关产生的通道特征是近乎正交的，并且每个通道代表一些语义信息。我们还分析了使用上行通道互相关时的热图，响应图的可解释性较差。

4.实验结果

4.1 训练和测试数据集

训练。我们的体系结构[14]的骨干网络在ImageNet[36]上进行了图像标记的预训练，这已被证明是对其他任务[13，27]的一个非常好的初始化。我们在COCO[25]、ImageNet Det[36]、ImageNet VID和YouTube边界盒数据集[35]的训练集上训练网络，并学习如何测量一般对象之间的相似性以进行视觉跟踪的一般概念。在训练和测试中，我们使用127个像素的单尺度图像作为模板块，255个像素的图像作为搜索区域。

评估。我们重点研究了OTB2015[46]、VOT2018[21]和UAV123[31]上的短期单目标跟踪。我们使用VOT2018-LT[21]来评估长期设置。在长期跟踪中，目标可能会离开视场或长时间处于完全遮挡状态，这比短期跟踪更具挑战性。我们还分析了我们的方法在LaSOT[10]和TrackingNet[30]上的推广情况，这两个基准是目前最大的单目标跟踪基准。

4.2 实施细节

网络结构。在实验中，我们按照[52]进行训练和推理设置。我们在步幅缩小的ResNet-50(Sect.3.2)上附加了两个兄弟卷积层，以执行方案分类和具有5个锚点的包围盒回归。将三个随机初始化的1×1卷积层附加到卷积3、卷积4、卷积5，以将特征维数降低到256。

优化。SiamRPN采用随机梯度下降(SGD)算法进行训练。我们在8个GPU上使用同步SGD，每个小批量总共128对(每个GPU 16对)，需要12小时才能收敛。我们对最开始的5个epoch使用0.001的预热学习率来训练RPN分支。在最后的15个epoch，整个网络被端到端地训练，学习率从0.005指数衰减到0.0005。使用0.0005的权重衰减和0.9%的动量。训练损失是分类损失和用于回归的标准平滑L1损失之和。

4.3 消融实验

主干架构。特征提取器的选择至关重要，因为参数的数量和层的类型直接影响跟踪器的内存、速度和性能。在视觉跟踪方面，我们比较了不同的网络结构。图6显示了使用AlexNet、ResNet-18、ResNet-34、ResNet-50和MobileNet-v2作为主干的性能。我们根据ImageNet上的TOP 1精确度报告了OTB2015上成功图的曲线下面积(AUC)的表现。我们观察到，我们的SiamRPN可以从更深的ConvNets中受益。

表1也说明，通过将AlexNet替换为ResNet-50，VOT2018数据集的性能有了很大提高。此外，我们的实验表明，对主干部分进行微调是非常关键的，这将极大地提高跟踪性能。

分层特征聚合。为了研究分层特征聚合的影响，我们首先在ResNet-50上训练了三个具有单一RPN的变体。我们的实验发现，在EAO中，单独使用Conv4可以达到0.374的竞争性能，而较深层和较浅层的性能下降了4%。通过合并两个分支，conv4和conv5的增益有所改善，而其他两个组合没有观察到改善。尽管如此，鲁棒性提高了10%，这是我们的跟踪器的关键漏洞。这意味着我们的跟踪器还有改进的空间。在综合了所有三层之后，准确率和鲁棒性都稳步提高，VOT和OTB的增益在3.1%到1.3%之间。总体而言，分层要素聚合在VOT2018上的EAO得分为0.414，比单层基线的得分高4.0%。

深度相关。我们将原始的上行信道互相关层与提出的深度互相关层进行了比较。如表1所示，提出的深度相关比VOT2018提高了2.3%，比OTB2015提高了0.8%，这说明了深度关联的重要性。这在一定程度上是因为两个分支的均衡参数分布使学习过程更稳定，收敛更好。

4.4 与最先进的比较

OTB-2015数据集。标准化的OTB基准[46]为鲁棒性提供了一个公平的测试平台。基于Siamese的跟踪器将跟踪描述为一次检测任务，没有任何在线更新，因此导致在此无重置设置基准上的性能较差。然而，我们发现来自浅层网络的有限表示是阻碍Siamese跟踪器超越性能最好的方法(如C-COT变体[9，5])的主要障碍。

我们在OTB2015上将我们的SiamRPN++跟踪器与最先进的跟踪器进行了比较。图7显示了我们的SiamRPN++跟踪器在重叠成功方面产生了领先的结果。与最新的DaSiamRPN[52]相比，我们的SiamRPN在重叠方面提高了3.8%，在显著增加的深度基础上提高了3.4%的精度。从深度凸网中提取的表示对光照和背景杂波的敏感度较低。据我们所知，这是Siamese跟踪器首次在OTB2015数据集上获得与最先进的跟踪器相当的性能。

VOT2018数据集。我们在最新的VOT-2018数据集[21]上测试了我们的SiamRPN++跟踪器，并与10种最先进的方法进行了比较。VOT-2018公共数据集是用于评估在线无模型单对象跟踪器的最新数据集之一，包括60个具有不同挑战性因素的公共序列。按照VOT-2018评估协议，我们采用期望平均重叠度(EAO)、准确度(A)和稳健性(R)以及基于无重置的平均重叠度(AO)来比较不同的跟踪器。有关的详细比较载在表2。

从表2中，我们观察到所提出的SiamRPN++方法在EAO、A和AO标准上获得了最好的性能。特别是，我们的SiamRPN跟踪器的性能超过了所有现有的跟踪器，包括VOT2018挑战赛获胜者。与VOT2018挑战赛中的最佳跟踪器(LADCF[21])相比，该方法获得了2.5%的性能提升。此外，我们的跟踪器比挑战获胜者(MFT[21])有了很大的改进，准确率提高了9.5%。

与基线跟踪器DaSiamRPN相比，我们的方法在鲁棒性上获得了10.3%的大幅提升，这是基于Siamese网络的跟踪器对抗相关滤波器方法的常见漏洞。即使由于缺乏对模板的适应性，鲁棒性与依赖于在线更新的最先进的相关滤波器方法[2]相比仍有差距。

采用OPE(One Pass Review)方法对跟踪器进行了评估，并报告了AO值以展示其性能。从表2的最后一行我们可以观察到，与DLSTpp[21]相比，我们的方法获得了与DLSTpp[21]相当的性能，并且将DaSiamRPN[52]方法改进了10.0%的绝对增益。

精确度 vs. 速度。在图9中，我们相对于每秒帧数(FPS)可视化了VOT2018上的EAO。报告的速度在配备NVIDIA Titan XP GPU的机器上进行评估，其他结果由VOT2018官方结果提供。从图中可以看出，我们的SiamRPN++实现了最佳性能，同时仍以实时速度(35FPS)运行。值得注意的是，我们的两个变种实现了与SiamRPN++几乎相同的精确度，同时运行速度超过了70FPS，这使得这两个变种具有很强的竞争力。

VOT2018长期数据集。在最新的VOT2018挑战中，新引入了一项长期实验。它由35个长序列组成，在这些序列中，目标可能会离开视野或在很长一段时间内变得完全遮挡。绩效衡量标准是精确度、召回率和综合F分。我们报告了所有这些指标，并与VOT2018-LT上最先进的跟踪器进行了比较。

如图10所示，在为我们的跟踪器配备了长期战略后，SiamRPN++从DaSiam LT获得了2.2%的收益，在Fcore上的表现比最好的跟踪器高出1.9%。ResNet提取的强大功能使TP和TR比我们的基准DaSiamRPN提高了2%。同时，SiamRPN的长期版本仍然能够以21FPS的速度运行，比VOT2018-LT的获胜者MBMD[21]快了近8倍。

UAV123数据集。UAV123数据集包括123个序列，平均序列长度为915帧。除了[29]中最新的跟踪器外，还对比添加了ECO[5]、ECO-HC[5]、DaSiamRPN[52]、SiamRPN[24]。图11展示了比较的跟踪器的精确度和成功曲线图。具体地说，我们的跟踪器获得了0.613的成功得分，远远超过了DaSiamRPN(0.586)和ECO(0.525)。

LaSOT数据集。为了在更大、更具挑战性的数据集上进一步验证所提出的框架，我们在LaSOT[10]上进行了实验。LaSOT数据集提供了大规模、高质量的密集标注，总共有1400个视频，测试集中有280个视频。图12显示了我们的SiamRPN++跟踪器在LaSOT测试集上的总体性能。在没有花哨的情况下，我们的SiamRPN++模型足以达到最先进的AUC得分49.6%。具体地说，SiamRPN++比MDNet[32]的归一化距离精度和AUC分别提高了23.7%和24.9%，而MDNet[32]是本文报道的最好的跟踪器。

TrackingNet数据集。最近发布的TrackingNet[30]提供了大量数据来评估野外的跟踪者。我们在包含511个视频的测试集上对SiamRPN++进行了评估。在[30]之后，我们使用三个指标成功率(AUC)、精确度(P)和归一化精确度(PNorm)进行评估。表3展示了与AUC得分最高的跟踪器的比较结果，显示SiamRPN++在所有三个指标上都取得了最好的结果。具体而言，SiamRPN++的AUC得分为73.3%，P得分为69.4%，PNorm得分为80.0%，分别以9.5%、10.3%和6.6%的优势超过排名第二的跟踪者DaSiamRPN[52]，AUC得分为63.8%，P得分为59.1%，Pnorm得分为73.4%。

总之，值得注意的是，所有这些一致的结果都显示了SiamRPN++的泛化能力。

5.结论

在本文中，我们提出了一个统一的框架，称为SiamRPN++，用于端到端地训练用于视觉跟踪的深层Siamese网络。我们给出了如何在Siamese跟踪器上训练深度网络的理论和经验证据。我们的网络由一个多层聚合模块和一个深度相关层组成，该模块将连接的层次结构组合在一起，以聚合不同层次的表示，从而减少了计算开销和冗余参数，同时也导致了更好的收敛。用SiamRPN++，我们在VOT2018上实时获得了最先进的结果，显示了SiamRPN++的有效性。SiamRPN++还在LaSOT和TrackingNet等大型数据集上获得了最先进的结果，表明了它的普适性。

你可能感兴趣的:(目标跟踪论文翻译,深度学习)

YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
对标ChatGPT，「文心一言」今日亮相！AI人机时代来临，未来在何方？ AI医学
本文由「AI医学er」提供医海无涯，AI同舟。关注我们，助力高效科研。3月15日，OpenAI公布了其大型语言模型的最新版本——GPT-4。3月16日，百度文心一言人工智能聊天机器人正式上线。一个时代开始了。OpenAI在官网表示，GPT-4是一个能接受图像和文本输入，并输出文本的多模态模型，是OpenAI在扩展深度学习方面的最新成果。此前的ChatGPT，只能通过向其输入文字提问才能生成文字回答
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数