Yemiekai

目标跟踪 SiamFC++ （Towards Robust and Accurate Visual Tracking with Target Estimation Guidelines）

文章标题：《SiamFC++：Towards Robust and Accurate Visual Tracking with Target Estimation Guidelines》
文章地址：https://arxiv.org/abs/1911.06188
github地址：https://github.com/MegviiDetection/video_analyst

2020年 AAAI（Proceedings of the AAAI Conference on Artificial Intelligence）的一篇文章。
作者来自浙大和旷视。

引言

现在很多基于深度学习的跟踪都被当做一个分类任务来做，对于给定的目标，要同时得到鲁棒的分类和准确的状态估计。以往大家提出了许多不同方法来进行目标状态估计，但是他们很少考虑到视觉跟踪问题本身的特殊性。经过仔细的分析，我们提出了一系列准则，用于指导设计高效的目标跟踪器。我们根据以下 4 条准则设计了全卷积暹罗跟踪器++（Fully Convolutional Siamese tracker++，SiamFC++）。(G1) 同时引入 ‘分类’ 分支和 ‘状态估计’ 分支。(G2) 明确的分类得分。(G3) 无先验知识地跟踪。(G4) 估计质量的得分。

（ps：这里说的 ‘状态估计’ 我觉得就是指坐标回归：Location、Regression）

大量的分析和消融实验证明了上述准则的有效性。没有花哨的功能，我们的 SiamFC++ 跟踪器在五个具有挑战性的基准测试（OTB2015，VOT2018，LaSOT，GOT-10k，TrackingNet）上实现了最先进的性能，这证明了跟踪器的跟踪和泛化能力。特别是，在大规模的 TrackingNet 数据集上，SiamFC++ 在超过 $90$ FPS 的情况下，实现了之前未见过的 $75.4$ 的 AUC 得分，这远远超过了实时要求。

1. 介绍

通常来说，视觉跟踪要做的是，在信息非常有限的情况下（例如只有被跟踪对象的第一帧的坐标），要在后续视频帧上连续定位它的位置。它是许多计算机视觉问题中的基本模块，例如用于无人机的跟随和其它监控系统中。通用的目标跟踪有一个特点，就是没有先验知识，不知道跟踪的对象是什么，也不知道它周围是什么样的环境。

跟踪问题可以被看做是分类（classification）任务和估计（estimation）任务的结合。第一个任务主要通过 ‘分类’ 对目标提供一个鲁棒的粗略的定位。第二个任务就接着来估计它的准确状态。虽然现代跟踪器已经取得了很大的进步，但令人惊讶的是，它们对于第二项任务（即目标状态估计）的方法却有很大的不同。根据这一点，它们的方法可以分为以下 $3$ 个种类：
（1） DCF 和 SiamFC，粗鲁地用多尺度测试，又不准确，效率又低。另外，它们预先假设了固定的尺度比例和变化率，这在实际变化中通常是不成立的。
（2）ATOM，通过梯度上升，迭代地调整多个初始边界框（bounding boxes）来估计目标位置，这大大提高了准确性。然而这种目标估计方法不仅计算量大，而且附加超参数较多（例如初始框的数量和分布），不好调参。
（3）SiamRPN 系列，通过引入区域建议网络（Region Proposal Network，RPN）达到准确和高效的状态估计。然而，预定义的锚点（Anchor）设置不仅引入了模糊的相似度评分，严重阻碍了鲁棒性，而且还需要知道数据分布的先验信息，这明显不符合通用跟踪器的初衷。

根据上述分析，我们提出了高性能通用跟踪器的设计准则：

$\bullet$ G1: 把分类和状态估计分开 (decomposition of classification and state estimation)
跟踪器应该进行两个子任务：分类和状态估计。如果没有强大的分类器，跟踪器就无法从背景或干扰物中区分目标，这严重阻碍跟踪器的鲁棒性。没有准确的估计结果，跟踪器的准确性从根本上受到限制。那些粗鲁的多尺度测试方法很大程度上忽略了后一项任务，存在效率低、准确性低等问题。

$\bullet$ G2：无歧义评分 (non-ambiguous scoring)
分类得分应该直接表明目标在 “视场” 中是否存在，例如说，是否在对应像素的子窗口里。而不是用像锚点框这类预先定义的设置。作为一个负面例子，在目标与锚点框之间进行匹配（例如 anchor-based RPN branch）容易产生假阳性（false positive）结果，导致跟踪失败。

$\bullet$ G3：无先验知识 (prior knowledge-free)
通用跟踪器应该不受尺度、比例分布等先验知识的影响，现有方法普遍存在对数据分布先验知识的依赖，影响了算法的泛化能力。

$\bullet$ G4：估计 ‘质量评估’ (estimation quality assessment)
直接依据分类得分来选择边界框（bounding box）会导致性能下降。应该再用一个独立于分类得分的 ‘质量评估’ 得分。以前有一些人就是这么做的，增加一个这样的分支，得到了惊人的准确性，例如 ATOM 和 DiMP。

根据上述准则，我们设计了 SiamFC++。输出特征图的每个像素直接对应搜索图（就是那个输入x）上的子窗口。根据 G1，我们增加了一个回归头，用于进行准确的目标状态估计，这个回归头和分类头是并行的。由于预定义的锚点框被移除了，就没有了 G2 中的模糊匹配，也没有了 G3 中关于目标尺度和比例分布的先验知识。最后，根据 G4，再增加一个质量评估头。

我们的贡献可以总结为以下三个方面：
（1）通过分析跟踪问题的特点，我们为现代跟踪器的设计提供了一套目标状态估计的实用指导思想。
（2）我们应用这些准则，设计了一个简单但是功能强大的 SiamFC++ 跟踪器。大量的实验和全面的分析证明了我们提出的指导准则的有效性。
（3）我们的方法在五个具有挑战性的基准上取得了最先进的结果。据我们所知，我们的SiamFC++ 是第一个在大规模数据集（TrackingNet ）运行速度超过 $90$ FPS、AUC得分达到 $75.4$ 的跟踪器。

2. 相关工作

略…

3. SiamFC++

(图1)

3.1 Siamese-based Feature Extraction and Matching （暹罗特征提取和匹配）

目标跟踪任务可以看做是相似度学习（similarity learning）问题。具体来说，我们离线训练一个暹罗网络，然后通过在线评估，在一个更大的搜索图（search image）上定位我们的模板图（template image）。暹罗网络由两个分支组成，template 分支以 $z$ 作为输入，它是从第一帧图像中，目标所在位置裁剪出来的图像块。search 分支采用当前帧作为输入，记为 $x$ 。两个分支共用同一个骨干（backbone），它对输入 $z$ 和 $x$ 进行同样的转换，把它们嵌入到同一个特征空间中，用于后续的任务。模板图和搜索图在嵌入空间 $\phi$ 上进行相关（cross-correlation）：
$f_i(z,x) = \psi_i \, ( \, \phi(z) \,) \, \star \, \psi_i \, ( \, \phi(x) \,) \, ，\; i\in\{ \text{cls, reg}\} \tag{1}$

其中 $\star$ 表示相关操作（cross-correlation）。 $\phi(.)$ 表示用骨干网络提取通用特征。 $\psi_i(.)$ 表示特定的任务层，用 $i$ 指明哪个任务（ $\text{cls}$ 表示分类， $\text{reg}$ 表示回归）。在我们的实现中，对模板图的 $\psi_{\text{cls}}(.)$ 和对搜索图的 $\psi_{\text{cls}}(.)$ 是两个不一样的卷积层，另外两个 $\psi_{\text{reg}}(.)$ 也是如此。另外，对同一个图的 $\psi_{\text{cls}}(.)$ 和 $\psi_{\text{reg}}(.)$ ，输出尺寸是一样的。（详情看上面的图）

3.2 Application of Design Guidelines in Head Network （网络头的设计）

基于 SiamFC，我们根据指导准则，逐个部分来改进。

根据 G1，模板图和搜索图在特征空间进行相关之后，我们设计了分类头和回归头。对于特征图上的每一个像素，分类头对每个对应的图像块进行分类，判断它是正类还是负类。回归头输出一个 offset 来预测边界框的位置。具体见图(2)。

具体来说，对于分类任务，一个在分类头输出特征图上坐标为 $P_{\text{cls}}=(x,y)$ 的点，它对应于输入搜素图上的点是 $\lfloor \frac{s}{2} \rfloor + xs, \lfloor \frac{s}{2} \rfloor + ys, )$ ，如果这个点落在 ground-truth box 内，这个这个点 $P_{\text{cls}}$ 应该被认为是正样本，否则就是个负样本。这里 $s$ 是骨干网络的总步长（total stride of backbone），可以认为是下采样倍数，本文中 $s = 8$ ，即 $303 \div 2^3 = 37.875 \approx 28$
（由于这里没有Padding，所以最后实际得到的会小一点，实际计算的时候从特征图返回到原图时要加上一个偏置）。

对于回归任务，回归头输出特征图上坐标为 $P_{\text{reg}}=(x,y)$ 的点，这个点上有 $4$ 个通道，用一个 $4\text{D}$ 向量 $\boldsymbol{t}^* =(l^*, t^*, r^*, b^*)$ 表示。它对应于输入搜索图上的点是 $\lfloor \frac{s}{2} \rfloor + xs, \lfloor \frac{s}{2} \rfloor + ys, )$ ，设这个点为 $P_l$ ，这个点上记录了它自己所在坐标的左上右下值。 $\boldsymbol{t}^*$ 负责预测对应的点 $P_l$ 自己的坐标与 ground-truth bounding box 的 $4$ 坐标偏移值。对于点 $P_{\text{reg}}$ ，我们的回归输出结果 $l^*, t^*, r^*, b^*)$ 可以由以下式子规定：
$\begin{array} ll^* = \left( \left\lfloor{ \dfrac{s}{2} } \right\rfloor+ xs \right) -x_0， \quad t^* = \left( \left\lfloor{ \dfrac{s}{2} } \right\rfloor+ ys \right) -y_0 \\ \, \\ r^* = x_1 - \left( \left\lfloor{ \dfrac{s}{2} } \right\rfloor+ xs \right) ， \quad b^* = y_1 - \left( \left\lfloor{ \dfrac{s}{2} } \right\rfloor+ ys \right) \end{array}\tag{2}$

其中 $x_0, y_0)$ 和 $x_1, y_1)$ 表示与点 $(x, y)$ 关联的 ground-truth bounding box $B^*$ 的左上角和右下角坐标。

在分类头和回归头的输出特征图上，每个位置 $(x, y)$ 都对应于输入搜索图上的位置 $\left\lfloor \dfrac{s}{2} \right\rfloor + xs, \left\lfloor \dfrac{s}{2} \right\rfloor + ys, )$ 。根据 G2，我们直接对相应的图像块进行分类，在该位置上回归目标框，这和之前的一些跟踪器的做法一样。换句话说，我们的 SiamFC++ 直接把 locations 视为训练样本。别人那些基于锚点框（anchor-based）的做法把输入图像上的位置当做许多锚点框的中心，在同一个位置输出多个分类得分，对这些锚点框进行坐标回归，这样会导致 anchor 与目标之间的模糊匹配。在我们的逐像素预测方式中，最终特征图上的每个像素只做一个预测。因此每个分类分数都直接表示目标是否在对应像素的子窗口的置信度，我们的设计在这种程度上是没有歧义的。

由于 SiamFC++ 是根据位置来做分类和回归的，不需要依赖预先定义的锚点框，因此不需要关于数据分布的先验知识（例如尺度和比例），这符合 G3。

在上述章节中，我们还没有考虑目标状态的估计质量，直接用了分类得分来选择最终的框。这会导致定位准确性的下降，分类得分没有很好地和定位准确性关联起来，在输出特征图像素点对应的输入子窗口上，中心点附近的重要性比周围的要大。因此，我们假设围绕物体中心的特征像素比其他特征像素具有更好的估计质量。根据 G4，我们添加了一个简单而有效的质量评估分支，和分类头一样，用一个 $1\times1$ 卷积输出多一块特征图。这块特征图的输出用于估计中心度得分（Prior Spatial Score， $\text{PSS}$ ），其定义如下：
$\text{PSS}^* = \sqrt{ \dfrac{ \min(l^*, r^*) } { \max (l^*, r^*) } \times \dfrac{ \min (t^*, b^*)} { \max(t^*, b^*) } } \tag{3}$

$\text{PSS}$ 并不是质量评估的唯一选择，作为一个变量，我们也可以预测真实框和预测框之间的 $\text{IoU}$ 得分：
$\text{IoU}^* = \frac{ \text{Intersection} (B, B^*) }{ \text{Union}(B, B^*) } \tag{4}$

其中 $B$ 是预测的包围框， $B^*$ 是对应的真实标签框。

在推理过程中，将预测出来的分类得分和对应位置的 $\text{PSS}$ 相乘，然后依据这个最终的得分来选择包围框。这样一来，远离目标中心点的包围框会被降低权值，提高了跟踪的准确性。

3.2 Training Objective （训练目标）

损失函数如下：
$\begin{aligned} L( \{ p_{x,y}\}, \; q_{x,y}, \; \{ \boldsymbol{t}_{x,y} \} ) = & \frac{1}{N_{\text{pos}}} \sum_{x,y} L_{\text{cls}} (p_{x,y}, \; c^*_{x,y}) \\ & + \frac{\lambda}{N_{\text{pos}}} \sum_{x,y} \boldsymbol{1}_{ \{ c^*_{x,y} > 0 \} } L_{\text{quality}} (q_{x,y}, \; q^*_{x,y}) \\ & + \frac{\lambda}{N_{\text{pos}}} \sum_{x,y} \boldsymbol{1}_{ \{ c^*_{x,y} > 0 \} } L_{\text{reg}} (\boldsymbol{t}_{x,y}, \; \boldsymbol{t}^*_{x,y}) \end{aligned} \tag{5}$

其中
$\boldsymbol{1}_{ \{ . \} }$ 是一个指示函数，如果括号里的式子成立，那么函数的值为 $1$ ，反之为 $0$ 。
$L_{\text{cls}}$ 表示 $\text{focal loss}$ ，用于对分类做损失。
$L_{\text{quality}}$ 表示二值交叉熵（binary cross entropy，BCE），用于对质量评估做损失。
$L_{\text{reg}}$ 表示 $\text{IoU}$ 损失，用于边界框坐标回归的损失。
如果位置 $(x, y)$ 上被认为是正样例，则 $c^*_{x,y}$ 的值为 $1$ ，对于负样例， $c^*_{x,y}$ 的值为 $0$ 。

4.Experiments （实验）

4.1 Implementation Details （实现细节）

4.1.1 Model settings （模型设置）

本文用不同的网络骨干，做了两个版本的跟踪器：
（1）backbone 用改造过的 AlexNet，记为 SiamFC++ - AlexNet。
（2）backbone 用 GoogLeNet，记为 SiamFC++ - GoogLeNet。

其中 GoogLeNet 的计算成本比之前的 ResNet-50 更低，而在基准测试上与 ResNet-50 的性能相同甚至更好。
这些网络都在 ImageNet 上做了预训练，经证明，对于跟踪任务来说都是非常实用的。

4.1.2 Training data （训练数据）

我们采用 ILSVRC-VID/DET，COCO，Youtube-BB，GOT-10k 作为基本训练集。对于视频数据集，我们从 VID，LaSOT，GOT-10k 上选取一对一对的图片，每一对图片来自同一个视频序列，两张图片的间隔不超过 $100$ 帧（Youtube-BB 是 $5$ 帧）。对于图像数据集（COCO，Imagenet-DET）我们弄一些负样本（两张图片是不同的目标）作为训练数据的一部分，来提高模型识别区分干扰物的能力。作为数据增强技术，我们在搜索图像上按照均匀分布进行随机移动和缩放。

4.1.3 Training phase （训练阶段）

对于 AlexNet 的版本，我们冻结 conv1 到 conv3 的参数，微调 conv4 和 conv5。对于那些没有预训练权重的网络层，我们采用零中心的高斯分布（zero-centered Gaussian distribution）进行初始化，标准差为 $0.01$ 。首先用 $5$ 个 epoch 对网络进行预热训练，学习率从 $10^{-7}$ 线性上升到 $2\times 10^{-3}$ 。然后用余弦退火学习率（cosine annealing learning rate）调整剩下的 $45$ 个 epochs，每个 epoch 用 $600, 000$ 个图像对。用动量为 $0.9$ 的随机梯度下降（SGD）作为优化器。

对于 GoogLeNet 的版本，我们冻结 stage $1$ 和 $2$ 的参数，微调 $3$ 和 $4$ 。基础学习率增加到 $2\times 10^{-2}$ ，骨干网络的学习率的大小设为全局学习率的 $0.1$ 。每个 $e p o c h$ 的图像对数量减少为 $300, 000$ 对，epoch 总数减少为 $20$ （其中 $5$ 个 epoch 用于预热， $15$ 个 epoch 用于训练），在第 $10$ 个 epoch 时解冻骨干网络的参数以防止过拟合。对于 LaSOT 的基准实验，我们冻结骨干网络的参数，将每个 epoch 的图像对进一步降低至 $150, 000$ 对，使训练数据量相对较少的训练得以稳定。

在 VOT2018 的 sort-term 基准测试中，用 AlexNet 作为骨干的跟踪器运行速度为 $160$ FPS，用 GoogLeNet 的运行速度为 $90$ FPS，用的 GPU 都是 NVIDIA RTX 2080Ti。

4.1.4 Test phase （测试阶段）

模型的输出是一系列包围框，以及它们对应的得分 $s$ 。基于每个框的尺度和比例的变化，以及它们与最后一帧预测目标位置的距离，对得分进行惩罚。根据惩罚后的得分来选择最终的结果，更新目标状态。

4.2 From SiamFC towards SiamFC++ （从 SiamFC 到 SiamFC++ ）

虽然它们两者都用了逐个像素预测的方式，但是 SiamFC 和我们的 SiamFC++之间存在显著的性能差距。在本小节中，我们对 VOT2018 数据集进行了消融研究，以 SiamFC 为基线，旨在找出改善跟踪性能的关键部分。

(表1)

如 (表1) 所示，在 SiamFC++ 基线中，跟踪器只做分类任务，目标状态估计是用多尺度测试来做的。我们逐渐对它添加额外训练数据（第 $2$ , $4$ 行），采用一个更好的网络头（第 $3$ 行），增加回归头升级成我们的 SiamFC++（第 $5$ 行）。进一步地，还把骨干从 AlexNet 换成了 GoogLeNet 来更好地提取视觉特征（第 $6$ 行）。

下面以降序地方式罗列影响跟踪器性能的关键组件：回归分支（ $0.094$ ），数据源的多样性（ $0.063 / 0.010$ ），更强的骨干（ $0.026$ ），更好的网络头结构（ $0.02$ ），其中括号里面表示这些组件带来的 $\Delta \text{EAO}$ 。注意这些额外组件都是来自建立在 SiamFC 之上的 SiamRPN++。在 SiamFC 上添加了所有这些组件后，我们的 SiamFC++ 以更少的计算预算实现了优异的性能。此外，值得一提的是：(1) 第 $2$ 行的鲁棒性 ( $\textbf{R}$ ) 超过了 SiamRPN ( $0.46$ )；(2) 第 $3$ 行的 $\textbf{R}$ 与 DaSiamRPN ( $0.337$ ) 水准相同，但是用了更少的数据（没有用COCO 和 DET）。这些结果表明，引入 RPN 和 Anchor 无疑会提高精度，但其鲁棒性并没有得到提高，甚至受到阻碍。可以认为这是由于它们违反了我们提出的设计准则。

4.3 Quality Assessment Choice （质量评估的选择）

在 GOT-10k 的验证集上，通过对SiamFC++ - GoogLeNet进行实验，用 $\text{PSS}$ 的方法达到 $77.8$ 的 AO，用 $\text{IoU}$ 的方法达到 $78.0$ 的 AO。我们在最后的实现中采用 $\text{PSS}$ ，因为在实验中发现它跨数据集的稳定性较好。

4.4 Results on Several Benchmarks（一些基准上的结果）

(表2)

4.4.1 Results on OTB2015 Benchmark

作为目标跟踪最经典的基准之一，OTB 基准为所有跟踪器家族提供了一个公平的测试。我们在包含 $100$ 个视频的 OTB2015 上进行实验，用于跟踪器性能评估。成功得分为 $0.682$ ，与其他跟踪器相比，我们的跟踪器达到了最先进的水平。

4.4.2 Results on VOT Benchmark

VOT2018 包含 $60$ 个视频序列，包含几个具有挑战性的主题，包括快速运动、遮挡等。我们提出的两个版本的跟踪器和当前最先进的跟踪器都有得一比。在相同的速度下，AlexNet 版本要比其他的跟踪器性能都好，GoogLeNet 版本的也不相上下。此外，我们的跟踪器在鲁棒性方面具有明显的优势。据我们所知，这是第一个在 VOT2018 基准测试中，以超过 $100$ FPS的速度运行， $\text{EAO}$ 达到 $0.400$ 的跟踪器，这证明了它在实际生产中应用的潜力。

4.4.3 Results on LaSOT Benchmark

LaSOT（Large scale Single Object Tracking）拥有大量的视频序列，在协议 I（Protocol I ）下有 $1400$ 个序列，协议 II（Protocol II ）下有 $280$ 个序列，这使得跟踪器不可能在它上面过拟合，因此可以测试目标跟踪的真实性能。在 Protocol II 下，跟踪器在 train 集上训练，在 test 集上验证，我们的 SiamFC++ 实现了更好的性能，甚至超过了那些在 VOT2018 上比我们好的。这表明基准数据集的规模会影响跟踪器的排名。

4.4.4 Results on GOT-10k Benchmark

对于目标类别的泛化性测试，我们在 GOT-10k（Generic Object Tracking-10k）上进行训练和测试。这个数据集不仅是一个大规模的数据集（ train 集上有 $10, 000$ 种视频， val 集和 test 集上都分别有 $180$ 种），它还在类别不确定性的要求方面对通用跟踪器提出了挑战，因为在 train 子集和 test 子集之间没有类别的交集。我们遵循 GOT-10k 的规则，仅在 train 集上训练。我们的 AlexNet 版本在 test 集上达到了 $53.5$ 的 $\text{AO}$ 值，比 SiamRPN++ 高了 $1.7$ ，我们的 GoogLeNet 版本达到了 $59.5$ 的 $\text{AO}$ 值，比用在线更新方法的 ATOM 还高。这表明我们的跟踪器具有一定的泛化能力，即使跟踪对象在训练时并没出现过。

4.4.5 Results on TrackingNet Benchmark

我们在 TrackingNet 的 test 集提供的 $511$ 个视频上进行验证。为了避免数据的泄露，我们从训练数据中排除掉 Youtube-BB。这个数据集从 $3$ 个方面对跟踪器进行评价：成功率（success rate），精度（precision），标准化精度（normalized precision）。我们的 GoogLeNet 版本达到了当前最先进的性能，AlexNet 版本在性能和速度之前取得了平衡。

具体实施

网络输入数据的选取

(图2)

如上图所示，进入 Siamese 网络的两张图片是这样来的。模板图可以不变，搜索图根据每一次的跟踪结果重新裁剪缩放而来。另外，作者源码实现里没有做数据的标准化（减均值，除方差）。

为了方便描述，这里假设输入图像的像素为 $12 \times 12$ ， $4$ 倍下采样，输出特征图的尺寸是 $\times 3$ 。

(图3)

根据下采样倍数的关系，输出特征图上 $1$ 个格子对应原图上一个 $4\times4$ 的区域。
比如输出特征图中蓝色的格子对应原图中间那个 $4\times4$ 的蓝色区域。
该目标（ground-truth bounding box）的中心点落在蓝色区域内，在分类回归中，则该格子为正样本，于是得到分类标签。

用两个矩阵记下输入图像每个像素点的 $x$ 坐标和 $y$ 坐标：

(图4)

由于我们 bounding box 的坐标表示法用的是 “左上” ，“右下” ，用 $X$ 矩阵减去 ground-truth bounding box 的 $l^*$ 和 $r^*$ ，用 $Y$ 矩阵减去 $t^*$ 和 $b^*$ ，就能得到每个像素点对于真实框的坐标的偏移量。

实际操作时用 $X-l^*)$ ， $r^*-X)$ ， $Y-t^*)$ ， $b^*-Y)$ 得到输入图片的每个像素点对于 ground-truth bounding box 的 “左上” ，“右下” 两个坐标点（共 $4$ 个坐标值）的偏置。

(图5)

根据上面提到的公式（3），用所有的偏置算出 $\text{PSS}^*$ 作为质量评估：
（这里直接贴用代码跑的结果，懒得画图了）

(图6)

设输出特征图上的像素点坐标为 $(x, y)$ ，根据公式

$total_stride y ′ = offset + y × total_stride (6) \begin{aligned} x'=\text{offset} +x\times \text{total\_stride} \\ y'=\text{offset} +y\times \text{total\_stride} \end{aligned} \tag{6}$

算出该特征图的点对应于输入图像的点，取那个位置的值作为 target。
其中 $\text{offset}$ 是由于卷积或下采样时没有 padding 造成的。
$x_size − 1 ) − ( score_size − 1 ) ∗ total_stride ) / / 2 \text{offset} = \left( (\text{x\_size} -1) - (\text{score\_size} -1) * \text{total\_stride}\right) // \,2$

这个例子里 $x_size = 12 \text{x\_size} = 12$ ， $score_size = 3 \text{score\_size}=3$ ， $total_stride = 4 \text{total\_stride}=4$
算出来 $\text{offset} = 1$ 。

根据 (公式6) 算出特征图对应于原图上的坐标，取上面的值。

例如：
特征图上 $(x, y) = (0, 0)$ 的格子对应原图 $(x^{'}, y^{'}) = (1, 1)$ 的格子。
特征图上 $(x, y) = (1, 1)$ 的格子对应原图 $(x^{'}, y^{'}) = (5, 5)$ 的格子。

quality assessment 的标签：

(图7)

regression 的标签：

(图8)

这样就能得到所有的 target，后面用来和网络的预测输出做损失，就能进行训练了。

反过来验证一下：

cls_score 特征图的每个像素和 quality assessment 特征图的每个像素相乘，得分最高的像素点坐标为 $(1, 1)$ ，根据（公式6）它对应于原图的坐标为 $(5, 5)$ 的格子。

在 reg_output 特征图上也选择坐标为 $(1, 1)$ 上的值。
于是算出来目标框为
“左上”： $x_0,y_0) = （5-x_1,5-x_2）=(4,4)$
“右下”： $x_1,y_1) = （5+y_1,5+y_2）=(7,7)$
得到和（图2）中红色框相同的坐标。

LiteCoT：难度感知的推理链压缩与高效蒸馏框架大千AI助手人工智能 #Prompt #OTHER 深度学习人工智能机器学习自然语言处理提示词 LiteCoT 思维链
“以智能裁剪对抗冗余，让推理效率与精度兼得”LiteCoT是由香港科技大学（广州）联合独立研究者团队提出的创新方法，旨在解决大模型知识蒸馏中推理链过度冗长和缺乏难度适应性的核心问题。该方法通过难度感知提示（DAP）动态生成精简的推理链，显著提升小模型推理效率与准确性。相关论文发表于arXiv预印本平台（2025年），为当前大模型轻量化部署的前沿方案。本文由「大千AI助手」原创发布，专注用真话讲AI
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
旋转目标检测：Deep Spatial Feature Transformation for Oriented Aerial Object Detection【方法解析】沉浸式AI 《AI与SLAM论文解析》人工智能计算机视觉旋转目标检测
DeepSpatialFeatureTransformationforOrientedAerialObjectDetection目录DeepSpatialFeatureTransformationforOrientedAerialObjectDetection摘要关键词引言相关工作旋转对齐模块特征对齐方法旋转对齐模块特征选择模块摘要航空图像中的目标检测在计算机视觉领域引起了广泛关注。不同于自然图像
【AI论文】EmbRACE-3K: 复杂环境中的具身推理与行为研究
摘要：近期先进的视觉语言模型（Vision-LanguageModels，VLMs）在被动、离线的图像和视频理解任务中展现出了卓越的性能。然而，在具身场景中，这些模型的有效性仍较为有限。具身场景要求在线交互和主动的场景理解，在此类场景中，智能体以第一人称视角感知环境，且每一次动作都会动态地影响后续的观察结果。即便是像GPT-4o、Claude3.5Sonnet和Gemini2.5Pro这样的先进模
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
2022年度数据统计水亦宽
水亦宽，你的2022互动总结如下：点赞文章：14982篇评论文章：25843次发布文章：168篇点赞评论：837条关注用户：179人关注专题：24个关注文集：2个你互动量最多的一天是2022-07-22，这一天你在社区进行了212次互动。你最喜欢给念薇薇的文章点赞，这一年你为TA送上了324个赞。你最喜欢评论云展云舒的文章，这一年你在TA的文章下评论了486次。2022年中，你写的文章曾25次登上
阿里巴巴推出ThinkSound：让AI像音效师一样“思考“创造声音至顶头条人工智能机器学习
这项由阿里巴巴通义实验室的刘华戴博士领导，联合香港科技大学和浙江大学共同完成的突破性研究，于2025年6月26日发表在arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2506.21448v1访问完整论文，演示页面也可在https://ThinkSound-Demo.github.io查看。当你看电影时，是否想过那些逼真的音效是如何产生的？当汽车在银幕上疾驰而过，你听到的引擎轰
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
我过了把论文答辩的瘾珍惜心理
我于八十年代末大专毕业，此后通过函授拿到本科文凭，没有过论文答辩关，所以对这高大上的论文答辩一无所知。2019年9月进入韦志中心理学网校学习，得知要取得中级证书，需提交一篇3000—5000字的论文，并要通过论文答辩。我教中学语文三十年，为了评职称，也曾写过几十篇教学论文，并获各种奖项，也在不同刊物发了几篇，但那些论文不过一二千字，浅尝辄止，从没经过论文答辩，心里还是有点怯怯的。2020年初突如其
AI驱动型论文搜索工具司南锤 AI 工具
✅一、AI驱动型论文搜索工具（强烈推荐）1.Consensus官网：consensus.app特点：输入自然语言问题（如“Doesgreenspacereduceurbanheatislandeffect?”），系统会自动返回论文中直接回答该问题的句子，标明支持/不支持的证据。适合人群：科研人员、政策制定者、想快速得到文献共识的人。2.ScispaceCopilot（原SemanticSchola
【计算机毕业设计】基于SSM+Vue的游戏攻略网站系统【源码+lw+部署文档+讲解】
目录1绪论1.1研究背景1.2目的和意义1.3论文结构安排2相关技术2.1SSM框架介绍2.2B/S结构介绍2.3Mysql数据库介绍3系统分析3.1系统可行性分析3.1.1技术可行性分析3.1.2经济可行性分析3.1.3运行可行性分析3.2系统性能分析3.2.1易用性指标3.2.2可扩展性指标3.2.3健壮性指标3.2.4安全性指标3.3系统流程分析3.3.1操作流程分析3.3.2登录流程分析3
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
基于STM32的智能花盆浇水系统毕业设计看，是大狗 stm32 课程设计嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机毕业设计论文前言随着城市化进程的加快和人们生活水平的提高，越来越多的人开始在家中种植植物，以美化环境、净化空气和陶冶情操。然而，由于工作繁忙或缺乏种植经验，许多人难以对植物进行及时、适量的浇水，导致植物生长不良甚至死亡。传统的花盆浇水方式依赖人工操作，存在效率低下、难以精准控制水量等问题，无法满足现代家庭对植物养护的智能化需求。近年
基于STM32的语音播报小项目课程设计程序开源看，是大狗 stm32 开源嵌入式硬件
目录单片机毕业设计论文前言单片机毕业设计功能介绍设计视频演示单片机课程设计设计论文前言随着科技的飞速发展和智能化时代的到来，人们对环境监测的需求日益增加，尤其是在温度监测方面，精准、实时的温度数据对于工业生产、农业生产以及日常生活都具有重要意义。传统的温度监测系统往往功能单一，缺乏实时反馈和智能化处理能力，难以满足现代应用场景的需求。近年来，嵌入式系统、传感器技术和语音交互技术的快速发展，为温度监
甘肃省天水市13家亲子鉴定中心大全(附2024年9月汇总鉴定) 鼎律基因刘主任
宗旨：在提高亲子鉴定咨询结果的准确性和真实性，为每一位受检客户得到一个公平、公证、真实、可靠的咨询结果，长期关注国内亲子鉴定师编写论文，从而确保提供实时亲子鉴定解答，是我们作为一家有责任心企业的标准的原则。实验室实力：配备了多套高端实验设备，包括美国AB公司3500XL遗传分析仪、9700金座PCR扩增仪、普洛麦格公司超精确检测系统PP21+PPY23，准确度高达99.9999%超高精确试剂盒等，
法学本科毕业论文什么选题方向好写？专科、本科都能看
加文末微信，获取论文服务：专科、本科、专升本；自考、函授、成教、国开、网教、成人专升本；全学科1对1咨询，承接各种论文辅导帮助；扫描文末，专业老师1v1论文服务。法学本科毕业论文什么选题方向好写？专科、本科都能看法学专业的本科毕业论文写作中，选题是一个关键步骤，它直接影响到论文的质量和研究的深度。如果你还在为选题而苦恼，不妨参考一下师哥师姐的经验，他们的研究方向往往能为你提供有价值的参考和启示。本
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
短文完结版☞【重生后，我打脸渣男狗女】唐秋苏渺渺☞【重生后，我打脸渣男狗女】一口气读完！妞妞爱读书1
前世，我苦心研究了三年的科研成果却被男友的学妹举报抄袭。只因我们的sci论文完全相同，但她却比我还要提早发表。铁板钉钉的证据面前，我无力反驳，被网络暴力。甚至有极端网友破坏了我家的电线导致短路失火，让我父母葬身火海。我因此患上了抑郁症，割喉自杀。再睁眼，我回到了发表论文的前一天。我睁开眼睛，映入眼帘的是电脑屏幕上即将完成的sci论文。“唐秋你实在是太棒了!"“你居然真的研究出了常温下的超导材料，这
「感恩日语」2021-303篇，吸渣体质能学多少学多少
学习感悟，避免成为“吸渣”体质很重要，“环境”能改变人，学会甄别那些“书籍”、那些“文章”（论文）对自己成长有利，而非“奶头乐”系统算法之类推送的让自己无法自拔的内容，个人每天、每周、每月、每年、一生总时间是有限的，缩小到每天，计算一下每天浪费有多少，真正发挥价值时间效力有多少，简单做个记录，会发现很可怕。同时找到了为什么每天进步一点点的重要性，只跟昨天的自己，前天的自己比较一下，很重要，多做对自
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><