SIGAI_csdn

CornerNet: Detecting Objects as Paired Keypoints论文解读

#### 作者简介：SIGAI人工智能平台

全文PDF下载：http://sigai.cn/paper_101.html

本文提出一种使用单个卷积神经网络的新型物体检测方法: CornerNet.本文通过将目标定义为成对关键点，消除了单阶段检测网络中对anchor box的需要. 除了新颖的网络形式外,本文还介绍了角落池化(corner pooling):一种新的池化方式,它可以帮助网络更好地定位物体的边角。实验表明，CornerNet在MS COCO上实现了42.1％的AP，优于所有现有的单阶段检测模型。

一. 概述:

基于卷积神经网络的目标检测算法已经在各种具有挑战性的基准测试中取得了一系列成果。Anchor box作为现有技术模型的一个共同组成部分，以不同的大小和横纵比为检测任务提供一系列的候选框。单阶段检测模型将anchor box密集的放置在输入图片上, 并对每一个box进行类别预测和坐标校准。随着anchor box在检测模型上的普遍应用, 单阶段检测模型逐渐获得了等同甚至优于两阶段检测模型的精度, 同时保有更高的效率。

但anchor box的使用有两个缺点, 第一，检测网络通常需要非常大量的anchor box(如：在DSSD中超过 $4$ 万个，在RetinaNet中超过 $10$ 万)来保证可以最大限度覆盖所有的待检测物体。但结果便是:只有一小部分anchor与待检测物体有比较可观的重叠比例;正负anchor数量的差异在训练时造成了极大的数据不平衡并减缓了训练速度。

第二，Anchor box的使用引入了太多新的超参数和网络设计上的选择, 包括: anchor的个数, 大小, 横纵比等等。这些选择主要是通过ad-hoc启发式方法进行的，并且当与多尺度架构相结合时可能变得更加复杂，具体是指: 由于单个网络在多个分辨率下同时进行单独的预测，每个尺度都会使用不同的特征和对应的一组anchor box。

图1作者将一个目标定义为一对组合在一起的边界框角。卷积网络为所有左上角输出heatmap，为所有右下角输出heatmap，并为每个检测到的角点输出嵌入向量,训练网络以预测属于同一对象的角点的相似嵌入。

在本文中作者介绍了一种新的单阶段目标检测方法CornerNet，避免了anchor box的使用。作者将一个目标定义为一对关键点(边界框的左上角和右下角), 使用单个卷积网络来预测同一类别所有目标的左上角的热图(heatmap)，所有右下角的热图以及每个检测到的角点的嵌入向量。嵌入向量用于对属于同一目标的一对角点进行分组, 以训练网络的方法获取它们的向量表示。本文的方法极大地简化了网络的输出，并且无需设计anchor box。图1说明了该方法的整体流程。

图2通常局部信息无法来确定边界框角落的位置。本文通过提出一种新的池化层来解决这个问题。

CornerNet的另一个新颖组件是corner pooling，这是一种新型的池层，用于帮助卷积网络更好地定位边界框的角落。如图2所示,边界框的一角通常在目标的范围之外，在这种情况下角落不能根据局部特征进行定位。相反，为了确定在某个像素位置是否存在左上角，我们往往需要从该位置开始往右看至边界，并且垂直向下看至底部。这激发了本文corner pooling的思想：使用两张特征图, 在每个像素位置, 对第一张特征图该像素所在行的右侧和第二个特征图该像素所在列的下方进行池化操作，然后将两个池化结果相加, 如图3所示:

图3 角落池化：对于每个通道，我们求两个方向（红线）的最大值（红点），每个方向都来自一个单独的特征图，并将两个最大值加在一起（蓝点）。

作者假设了检测角落比检测边界框中心更好的两个原因。第一，anchor的中心可能更难以定位，原因是它取决于目标的所有4个边，而定位角点仅取决于2个边因而更加容易，而且corner pooling为定义角点引入了合理的先验。第二，角点提供了一种密集地离散化box空间的方法：我们只需要 $O (w h)$ 的角点便可以表示出 $O(w^2h^2)$ 可能的anchor。

本文证明了CornerNet在MS COCO数据集上的有效性: Corner-Net实现了 $42.1 ％$ 的AP，优于所有现有的单阶段探测模型。另外通过研究，作者发现corner pooling对于CornerNet的卓越性能至关重要。

二. 相关工作:

Two-stage detector:

R-CNN首先发明并推广了两阶段检测方法。两阶段检测器生成稀疏的感兴趣区域（RoI）并通过网络对它们中的每一个进行分类。 R-CNN使用低级视觉算法生成RoI, 然后从图像中提取每个区域并由ConvNet独立处理, 因而需要大量冗余的计算。后来，SPP和Fast-RCNN通过设计一个特殊的池化层来改进R-CNN，该池化层从特征图中池化每个区域, 但是两者仍然依赖于单独的提议(proposal)算法，并且无法进行端到端的培训。Faster - RCNN通过引入区域提议网络（RPN）来避免低级别提议算法，该网络从一组预定的候选框（通常称为anchor box）生成提议, 这不仅使检测器更有效，而且还允许检测器端到端地进行训练。 R-FCN通过用全卷积替换全连接的子检测网络，进一步提高了Faster-RCNN的效率。

One-stage detector:

另一方面，YOLO和SSD推广了单阶段的检测方法，它消除了RoI池化步骤并从单个网络中检测目标。单阶段检测器通常比两阶段检测器更具计算效率，同时在不同的挑战性基准测试中保持着有竞争力的性能。

SSD将anchor box密集地布置在来自多个尺度的特征图上，直接分类并重新定义每个anchor。 YOLO直接从图像预测bbox坐标，而后在YOLO9000中引入了anchor的概念。 DSSD 和RON采用类似于hourglass net的网络，通过skip connection组合低级和高级特征，以更准确地预测边界框。然而在引入RetinaNet之前，这些单阶段检测器仍然无法优于两阶段检测器。在RetinaNet中作者提出, 密集的anchor box在训练时使正负样本间产生极大的数据不平衡,这种不平衡导致训练效率的低下及性能的下降。为了动态调整每个anchor的权重, 他们提出了一种新的损失函数 : Focal Loss，并通过实验证明他们的单阶段检测器甚至可以胜过两阶段的检测模型。 RefineDet通过过滤anchor box粗略的调整了anchor结构, 使得负anchor的数量得到一定程度的限制.

DeNet是一种两阶段的检测器，它可以在不使用anchor box的情况下生成RoI, 具体步骤如下: 首先它确定每个位置属于边界框的左上角，右上角，左下角或右下角的可能性, 然后它通过枚举所有可能的角点组合来生成RoI，并遵循标准的两阶段方法来对每个RoI进行分类。本文的方法与DeNet非常不同, 第一，DeNet不会识别两个角是否来自相同的对象，并通过子检测网络来拒绝错误的RoI, 而本文的方法是一个单阶段方法，使用单个ConvNet检测和分组角点。第二，DeNet在手动确定的位置选择相对于分类区域的特征，而本文的方法不需要任何特征选择步骤。第三，本文使用了corner pooling，一种新型的池化层，来增强角点的检测。

本文的方法受到了Newell等人在多人姿势估计的关联嵌入工作的启发。Newell提出一种在单个网络中检测和分组人体关节的方法, 在他们的方法中，每个检测到的人类关节具有一个嵌入向量, 最终通过嵌入向量之间的距离对关节进行分组。在本文中，作者首先将物体检测任务定义为同时检测和分组角点的任务, 本文的另一个新颖之处便是corner pooling，它有助于更好地定位角落。作者还显著地修改了沙漏的架构，并添加了focal loss的新型变体以更好地训练网络。

三.CornerNet:

Overview:

在CornerNet中，作者将目标定义为一对关键点(边界框的左上角和右下角)。卷积网络预测两组heatmap来表征不同类别对象的角点位置，一组用于左上角，另一组用于右下角。网络还预测每个检测到的角点的嵌入向量，使得来自同一对象的两个角点的嵌入向量之间的距离很小。为了产生更准确的边界框，网络还预测了角点位置微调的偏移量。通过heatmap，嵌入向量和偏移量，作者应用一个简单的后处理算法来获得最终的边界框。

图4: CornerNet概述。 backbone之后是两个预测模块，一个用于左上角，另一个用于右下角。使用两个模块的预测进行定位并分组角点。

图4是CornerNet的一个概述图。本文使用沙漏网络作为CornerNet的backbone。沙漏网络之后是两个预测模块, 一个模块用于左上角，而另一个模块用于右下角。每个模块都有自己的corner pooling模块，用于在预测heatmap，嵌入向量和偏移量之前池化沙漏网络中的特征。与许多其他目标检测器不同，本文不使用多尺度特征来检测不同尺寸的物体,而只是将两个模块应用于沙漏网络的输出端。

Detecting Corners:

作者预测两组heatmap，一组用于左上角角点，另一组用于右下角角点。每组heatmap的大小为 $KaTeX parse error: Expected 'EOF', got '\*' at position 2: H\̲*̲W$ , 通道数为C(类别个数且不设有背景通道)。每个通道都是一个二进制掩码，用于指示对应类别的角点位置。

对于物体的每一个拐角，都有一个ground-truth的正位置与之对应，所有其他位置都为负。在训练时，本文没有对负位置进行同等地惩罚, 而是减少了对以正位置为圆心的某个半径区域内的负位置给予的惩罚。这是因为如果一对错误corner的预测都靠近它们各自的ground-truth位置，它仍然可以产生一个与真实物体足够重叠的bbox（图5）。本文通过物体的大小来确定该半径的数值, 以保证该半径范围内的角点仍能以 $e^{-\frac{x^2+y^2}{2\sigma^2}}$ 较高的IOU t(如 $0.7$ )来表示相应物体。在给定半径的情况下, 惩罚量由非标准化的2D高斯分布给出，即其中心位于正位置且$\sigma $是半径的1/3。

图5. “Ground-truth“用于训练的heatmap。Boxes（绿色虚线矩形），其角落在正位置的半径内（橙色圆圈）仍然与Ground-truth标注（红色实心矩形）有很大的重叠。

$P_{cij}$ 为预测heatmap中c类别对应位置（ $i$ ; $j$ ）的得分， $y_{cij}$ 为用非标准化高斯增强的“ground-truth”的heatmap。本文设计了一个focal loss的变体：
$$
L_{det}=\frac{-1}{N}\sum_{c=1}^{{C}\sum_{i=1}}{H}\sum_{j=1}^{W}\left{\begin{matrix}

(1-p_{cij})^{\alpha}\log(p_{cij}) &if;y_{cij}=1 \

(1-y_{cij})^{\alpha }\log(1-p_{cij}) &otherwise

\end{matrix}\right.
$$
其中 $N$ 是图像中目标的数量， $\alpha$ 和 $\beta$ 是控制每个点的贡献的超参数（本文的所有实验中设置为 $2$ 和 $4$ ）。（1-y_{cij}）项减少了ground-truth周围的惩罚。

许多网络涉及下采样层来获取全局信息并减少内存使用, 所以在网络应用于图像时，输出的特征图大小通常小于图像的大小。因此，图像中的位置（ $x$ ; $y$ ）被映射到heatmap中的位置为 $(\frac{x}{n},\frac{y}{n})$ ，其中 $n$ 是下采样因子。当我们将位置从heatmap重新映射到输入图像时，可能会丢失一些定位精度，而这可能会极大地影响小边界框与ground-truth匹配的IoU。为了解决这个问题，本文对预测位置设置微调偏移量，然后再将它们重新映射到输入图像中。
$o_{k}=\left ( \frac{x_{k}}{n}-\left \lfloor \frac{x_{k}}{n} \right \rfloor ,\frac{y_{k}}{n}-\left \lfloor \frac{y_{k}}{n} \right \rfloor\right )$
$O_k$ 是偏移量， $x_k$ 和 $y_k$ 是角点 $k$ 的 $x$ 和 $y$ 坐标。本文预测所有类别的左上角共享一组 $O$ 集合，以及右下角共享另一组 $O$ 集合。对于训练，本文在ground-truth角点位置应用平滑的 $L 1$ 损失：
$L_{off}=\frac{1}{N}\sum_{k=1}^{N}SmoothL1Loss(o_{k},\hat{o}_{k})$

Grouping Corners:

多个对象可以出现在同一张图像中，因此可以检测到多个左上角和右下角, 因而需要确定一对左上角和右下角是否来自同一个边界框。本文的方法受到Newell等人提出的Associative Embedding方法的启发。Newell检测所有人体关节并为每个检测到的关节生成嵌入向量, 根据嵌入向量之间的距离对关节进行分组。

关联嵌入的思想也适用于本文的任务: 网络预测每个检测到的角点的嵌入向量，使得如果左上角和右下角属于同一个边界框，则它们的嵌入向量之间的距离应该很小, 从而可以根据左上角和右下角的嵌入之间的距离对角进行分组。嵌入向量的实际值并不重要, 本文仅使用嵌入向量之间的距离来对角进行分组。

本文学习Newell等人的方法, 并使用1维嵌入向量, $e_{tk}$ 和 $e_{bk}$ 分别为目标 $k$ 的左上角和右下角嵌入向量。本文使用”pull“ loss训练网络对角点进行分组，并使用”push”将角点分离：

$\begin{aligned} L_{pull} &=\frac{1}{N}\sum_{k=1}^{N}\left [ (e_{t_{k}}-e_{k})^2 +(e_{b_{k}}-e_{k})^2\right ] \\ Lpush &=\frac{1}{N(N-1)}\sum_{k=1}^{N}\sum_{j=1,j\neq k}^{N}\max(0,\Delta -\left | e_{k}-e_{j} \right |) \end{aligned}$
其中 $e_k$ 是 $e_{tk}$ 与 $e_{bk}$ 的均值,本文在所有实验中设置 $\delta$ 为1, 与 $L_{off}$ 相同,这里仅在ground-truth角点计算loss。

Corner Pooling:

如图2所示，局部特征往往无法决定角点的存在, 为了确定一个像素是否是左上角，需要从该像素起向右水平扫描以寻找对象的最顶部边界，并垂直向下扫描以寻找最左边界。因此本文通过编码这一显式的先验知识, 提出了corner pooling来更准确地定位角点。

图6.左上角pooling层可以非常有效地实现。我们从左到右扫描进行水平最大池化，从下到上扫描进行垂直最大池化。之后将两个最大池化特征图相加。

假设我们想确定位置（ $i$ , $j$ ）处的像素是否是左上角。设ft和fl是作为左上角池化层输入的两张特征图，让ftij和flij分别是ft和fl中位置（ $i$ , $j$ ）处的向量。假设特征图大小为 $H * W$ ，corner pooling首先将（ $i$ , $j$ ）和（ $i$ , $H$ ）之间的所有特征向量进行最大值池化得到特征向量 $t_{ij}$ ，同时将（ $i$ , $j$ ）和（ $W$ , $j$ ）间的特征向量进行最大值池化得到特征向量 $l_{ij}$ , 最后将 $t_{ij}$ 和 $l_{ij}$ 相加,具体公式如下:

$\begin{aligned} t_{ij} &=\left\{\begin{matrix} \max(f_{t_{ij}},t_{(i+1)j};) \quad if\;i< H & \\ f_{t_{Hj}}&otherwise \end{matrix}\right. \\ l_{ij}&= \left\{\begin{matrix} \max(f_{l_{ij}},l_{i_{j+1}\;})\quad if\;j< W & \\ f_{l_{iW}}& otherwise \end{matrix}\right. \end{aligned}$

其中max操作为元素级别(elementwise)的最大值操作, 如图6所示. 通过动态规划, $t_{ij}$ 与 $l_{ij}$ 均可被快速的计算。

本文以类似的方式定义了右下角池化层, 它最大值池化了（ $0$ ; $j$ ）和（ $i$ ; $j$ ）之间以及（ $i$ ; $0$ ）和（ $i$ ; $j$ ）之间的所有特征向量，之后将它们相加得到输出特征图。角点池化层在本文中用于预测模型中的heatmap、嵌入向量和偏移量矩阵。

图7.预测模块以修改后的残差块为开始，用角点池化模块替换第一个卷积模块, 在修改的残差块之后是另一组卷积模块, 并通过多个分支分别预测heatmap，嵌入向量和偏移量矩阵。

预测模块的结构如图7所示: 模块的第一部分是对原始残差块的一个修改版本, 在这个修改后的残差块中，作者用一个角点池化模块替换了第一个 $3 * 3$ 的卷积模块. 该模块首先通过两个 $128$ 通道的 $3 * 3$ 卷积模块处理来自backbone的特征，然后应用角点池化层, 并将池化后的特征图输入到 $256$ 通道的 $3 * 3$ Conv-BN层中，同时引入shortcut连接。修改后的残差块后接一个256通道的 $3 * 3$ 卷积模块，以及3个Conv-ReLU-Conv层，用于生成heatmap，嵌入向量和偏移量矩阵。

Hourglass Network:

CornerNet使用沙漏网络作为其backbone. 沙漏网络在设计之初是为了解决人体姿势估计问题, 它是一个由单个或多个沙漏模块组成的全卷积神经网络。沙漏模块首先通过一系列卷积和最大值池化层对输入特征进行下采样, 然后再通过一系列上采样层和卷积层将特征上采样回原始的分辨率。由于最大值池层会造成细节信息的丢失，因而网络添加shortcut层以将细节带回到上采样后的特征图中。沙漏模块的优点在于:通过一个统一的结构便可同时捕获全局特征和局部特征, 且当多个沙漏模块堆叠在网络中时，沙漏模块可以对这些特征进行多次重处理以捕获更高级别的语义信息.而这些属性也使沙漏网络成为目标检测任务backbone的理想选择。事实上, 许多现有的检测器都已经采用了类似于沙漏网络的结构模型。

本文对沙漏模块的结构进行了一些修改, 设计出了一种由两个沙漏组成的沙漏网络。作者使用步幅为2的卷积层替代最大值池化进行下采样，整个网络结构将特征的分辨率降低了5倍，同时增加了网络中特征图的通道数量（256; 384; 384; 384; 512）,作者应用两个残差模块后接最近邻上采样模块对特征进行上采样, 每个shortcut连接也包含两个残差模块。在每个沙漏模块前，作者使用步幅为2的128通道 $7 * 7$ 卷积后接步幅为2的256通道残差模块将图像分辨率降低了4倍.

四.实验:

Training Details:

作者使用PyTorch实现了CornerNet。网络在PyTorch的默认设置下随机初始化，并且不对任何外部数据集进行预训练。当引入focal loss时，作者按照何凯明的方法设置卷积层中的偏差来预测角点heatmap。在训练期间，为了保证输出分辨率为128128, 作者将网络的输入分辨率设置为511511. 为了减少过度，作者采用标准数据增强技术，包括随机水平翻转，随机缩放，随机裁剪和随机颜色抖动(包括调整图像的亮度，饱和度和对比度),同时作者也将PCA应用到了输入图像上。

作者使用Adam优化训练误差:
$L=L_{det}+\alpha L_{pull}+\beta L_{push}+\gamma L_{off}$
其中α,β,γ分别是pull、push、偏移量损失对应的权重。作者将α,β设置为0.1, γ设置为1(原因是作者经过实验发现将α,β设置为1或更大的值会导致性能的急剧下降)。作者设置batchsize为49并在10个Titan X（PASCAL）GPU上训练网络（主GPU上的4个图像，其余GPU的每个GPU 5个图像）。为了节省GPU资源，在本文的对照实验中，作者将网络以 $2.5×10^{-4}$ 的学习率训练了250k次迭代, 而在本文的对比实验(与其他检测模型)中，作者将网络训练了额外的250k次迭代，之后将学习速率降低到 $2.5×10^{-5}$ 并进行了最后50k次迭代。

Testing Details:

测试时，本文使用简单的后处理算法从heatmap，嵌入向量和偏移量矩阵中生成边界框。作者首先在角点heatmap上进行3*3最大值池化来进行非极大值抑制（NMS）,然后从heatmap中选择置信度最大的前100个左上角和前100个右下角点,角点位置由相应的偏移量进行调整。作者计算左上角和右下角嵌入向量之间的L1距离,距离大于0.5或包含来自不同类别的角点对将被拒绝。左上角和右下角的平均置信度用作检测的最终置信度。

在本文中输入图片没有resize的过程, 取而代之的是保持图像的原始分辨率并通过zero padding对图片尺寸进行填充。本文将原始图片和翻转后图像都用于测试,作者结合原始和翻转图像的检测检测结果，应用soft-nms来抑制冗余检测,最终仅输出置信度最高的前100个检测项。最终CornerNet在Titan X（PASCAL）GPU上的图片平均检测耗时为244毫秒。

MS COCO:

作者在MS COCO数据集上对CornerNet进行了评估, MS COCO包含80k张训练集图像，40k张验证集图像和20k张测试集图像。作者将训练集中的所有图像和验证集中的35k张图像用于训练,验证集中剩余的5k图像用于超参数调整和对照实验研究,测试集上的所有结果都提交给外部服务器进行评估。为了与其他探测器进行比较，作者提供了本文在test-dev集上的检测结果。 MS COCO在不同的IoU级别以及不同的物体大小上都计算了平均精度(average precisions),共同组成了统一的评测标准.

Ablation Study:

Corner Pooling:

角点池化是CornerNet的关键组成部分, 为了理解其对性能的贡献，作者训练了另一个没有角点池化但具有相同数量参数的网络。

表1中展示了添加角点池化层对网络的改善效果, 对应的提升结果为：AP提升2.0％，AP50提升2.1％，AP75提升2.2％。作者还发现角点池化的作用对中大型物体检测更为关键，它们的AP分别提高了2.4％和3.7％。从直观上分析, 由于中大型物体的最顶部，最底部，最左侧，最右边界可能更远离角落的位置,因而应用角点池化对于角点信息获取具有更好的优化作用。

Reducing penalty to negative locations:

本文减少了对于正位置由对象大小确定的半径内的负位置给出的惩罚. 为了理解这项设置有助于训练CornerNet，作者训练了一个没有减少惩罚项的网络和另一个固定惩罚半径为2.5的网络, 并在验证集上将它们与CornerNet进行了比较。

表2中展示了固定的惩罚半径使基线上的AP增加了2.7％， $AP^m$ 增加了1.5％， $AP^1$ 增加了5.3％。而依赖于对象的惩罚半径设置进一步将AP提高了2.9％， $AP^m$ 提高了2.6％， $AP^1$ 提高了6.5％。除此之外我们也能看到:减轻惩罚项设置对于大中型物体的增益效果最为明显。

Error Analysis:

CornerNet同时输出heatmap，偏移量和嵌入向量，所有这些对与检测任务的性能都有着很大的影响。如果物体的任何一个角落在检测中被忽略，那么最终的检测结果也必将丢失整个物体; 精确的偏移量矩阵对于生成精准的边界框起到关键性作用; 错误的嵌入向量表示将导致边界框无法正确的匹配从而产生错误的边界框生成结果。为了理解每个部分对于最终误差的影响，作者通过将预测的heatmap和偏移量矩阵替换为ground-truth并在验证集上评估性能来进行误差分析。

表3中展示了单独使用ground-truth的角点heatmap会将AP从38.5％提高到74.0％。 AP， $AP^m$ 和 $AP^1$ 也分别增长43.1％，40.9％和30.1％。如果我们用groud-truth偏移量矩阵替换预测的偏移量，则AP进一步提升了13.1％至87.1％。这表明尽管网络在检测和分组角点上都存在着很大的改进空间，但最主要的性能瓶颈仍是检测角点问题。

图8展示了预测角点的两个定性示例。

图8.通过预测的heatmap生成角点的边界框预测示例

Comparisons with state-of-the-art detectors

作者将CornerNet与MS COCO test-dev上的其他最先进的检测器进行了比较（表4）。通过多尺度评估，CornerNet实现了42.1％的AP，获得了现有单阶段检测模型中最优的性能,并可以与双阶段模型相提并论.

五.结论:

本文介绍了一种新的目标检测方法CornerNet，通过将边界框定义为成对的角点完成检测任务. 本文在MS COCO数据集上对CornerNet进行了评估，并展示出有竞争力的结果。

References:

Bell, S., Lawrence Zitnick, C., Bala, K., Girshick, R.: Inside-outside net: Detecting objects in context with skip pooling and recurrent neural networks. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. pp. 2874{ 2883 (2016)
Bodla, N., Singh, B., Chellappa, R., Davis, L.S.: Soft-nmsimproving object detec- tion with one line of code. In: 2017 IEEE International Conference on Computer Vision (ICCV). pp. 5562{5570. IEEE (2017)
Cai, Z., Fan, Q., Feris, R.S., Vasconcelos, N.: A uni ed multi-scale deep convolu- tional neural network for fast object detection. In: European Conference on Com- puter Vision. pp. 354{370. Springer (2016)
Cai, Z., Vasconcelos, N.: Cascade r-cnn: Delving into high quality object detection. arXiv preprint arXiv:1712.00726 (2017)
Chen, Y., Li, J., Xiao, H., Jin, X., Yan, S., Feng, J.: Dual path networks. In: Advances in Neural Information Processing Systems. pp. 4470{4478 (2017)
Dai, J., Li, Y., He, K., Sun, J.: R-fcn: Object detection via region-based fully convolutional networks. arXiv preprint arXiv:1605.06409 (2016)
Dai, J., Qi, H., Xiong, Y., Li, Y., Zhang, G., Hu, H., Wei, Y.: Deformable convo- lutional networks. CoRR, abs/1703.06211 1(2), 3 (2017)
Deng, J., Dong, W., Socher, R., Li, L.J., Li, K., Fei-Fei, L.: Imagenet: A large-scale hierarchical image database. In: Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on. pp. 248{255. IEEE (2009)
Everingham, M., Eslami, S.A., Van Gool, L., Williams, C.K., Winn, J., Zisserman, A.: The pascal visual object classes challenge: A retrospective. International journal of computer vision 111(1), 98{136 (2015)
Fu, C.Y., Liu, W., Ranga, A., Tyagi, A., Berg, A.C.: Dssd: Deconvolutional single shot detector. arXiv preprint arXiv:1701.06659 (2017)
Girshick, R.: Fast r-cnn. arXiv preprint arXiv:1504.08083 (2015)
Girshick, R., Donahue, J., Darrell, T., Malik, J.: Rich feature hierarchies for ac- curate object detection and semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 580{587 (2014)
He, K., Gkioxari, G., Dollar, P., Girshick, R.: Mask r-cnn. arxiv preprint arxiv: 170306870 (2017)
He, K., Zhang, X., Ren, S., Sun, J.: Spatial pyramid pooling in deep convolutional networks for visual recognition. In: European Conference on Computer Vision. pp. 346{361. Springer (2014)
He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 770{778 (2016)
Huang, J., Rathod, V., Sun, C., Zhu, M., Korattikara, A., Fathi, A., Fischer, I., Wojna, Z., Song, Y., Guadarrama, S., et al.: Speed/accuracy trade-o s for modern convolutional object detectors. In: IEEE CVPR (2017)
Io e, S., Szegedy, C.: Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: International conference on machine learning. pp. 448{456 (2015)
Kingma, D.P., Ba, J.: Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980 (2014)
Kong, T., Sun, F., Yao, A., Liu, H., Lu, M., Chen, Y.: Ron: Reverse connection with objectness prior networks for object detection. arXiv preprint arXiv:1707.01691 (2017)
Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classi cation with deep con- volutional neural networks. In: Advances in neural information processing systems. pp. 1097{1105 (2012)
Li, Z., Peng, C., Yu, G., Zhang, X., Deng, Y., Sun, J.: Light-head r-cnn: In defense of two-stage object detector. arXiv preprint arXiv:1711.07264 (2017)
Lin, T.Y., Dollar, P., Girshick, R., He, K., Hariharan, B., Belongie, S.: Feature pyramid networks for object detection. arXiv preprint arXiv:1612.03144 (2016)
Lin, T.Y., Goyal, P., Girshick, R., He, K., Dollar, P.: Focal loss for dense object detection. arXiv preprint arXiv:1708.02002 (2017)
Lin, T.Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., Dollar, P., Zitnick, C.L.: Microsoft coco: Common objects in context. In: European conference on computer vision. pp. 740{755. Springer (2014)
Liu, W., Anguelov, D., Erhan, D., Szegedy, C., Reed, S., Fu, C.Y., Berg, A.C.: Ssd: Single shot multibox detector. In: European conference on computer vision. pp. 21{37. Springer (2016)
Newell, A., Deng, J.: Pixels to graphs by associative embedding. In: Advances in Neural Information Processing Systems. pp. 2168{2177 (2017)
Newell, A., Huang, Z., Deng, J.: Associative embedding: End-to-end learning for joint detection and grouping. In: Advances in Neural Information Processing Sys- tems. pp. 2274{2284 (2017)
Newell, A., Yang, K., Deng, J.: Stacked hourglass networks for human pose es- timation. In: European Conference on Computer Vision. pp. 483{499. Springer (2016)
Paszke, A., Gross, S., Chintala, S., Chanan, G., Yang, E., DeVito, Z., Lin, Z., Desmaison, A., Antiga, L., Lerer, A.: Automatic di erentiation in pytorch (2017)
Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Uni ed, real-time object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 779{788 (2016)
Redmon, J., Farhadi, A.: Yolo9000: better, faster, stronger. arXiv preprint 1612 (2016)
Ren, S., He, K., Girshick, R., Sun, J.: Faster r-cnn: Towards real-time object detec- tion with region proposal networks. In: Advances in neural information processing systems. pp. 91{99 (2015)
Shen, Z., Liu, Z., Li, J., Jiang, Y.G., Chen, Y., Xue, X.: Dsod: Learning deeply supervised object detectors from scratch. In: The IEEE International Conference on Computer Vision (ICCV). vol. 3, p. 7 (2017)
Shen, Z., Shi, H., Feris, R., Cao, L., Yan, S., Liu, D., Wang, X., Xue, X., Huang, T.S.: Learning object detectors from scratch with gated recurrent feature pyramids. arXiv preprint arXiv:1712.00886 (2017)
Shrivastava, A., Sukthankar, R., Malik, J., Gupta, A.: Beyond skip connections: Top-down modulation for object detection. arXiv preprint arXiv:1612.06851 (2016)
Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556 (2014)
Singh, B., Davis, L.S.: An analysis of scale invariance in object detection-snip. arXiv preprint arXiv:1711.08189 (2017)
Szegedy, C., Io e, S., Vanhoucke, V., Alemi, A.A.: Inception-v4, inception-resnet and the impact of residual connections on learning. In: AAAI. vol. 4, p. 12 (2017)
Tychsen-Smith, L., Petersson, L.: Denet: Scalable real-time object detection with directed sparse sampling. arXiv preprint arXiv:1703.10295 (2017)
Tychsen-Smith, L., Petersson, L.: Improving object localization with tness nms and bounded iou loss. arXiv preprint arXiv:1711.00164 (2017)
Uijlings, J.R., van de Sande, K.E., Gevers, T., Smeulders, A.W.: Selective search for object recognition. International journal of computer vision 104(2), 154{171 (2013)
Xiang, Y., Choi, W., Lin, Y., Savarese, S.: Subcategory-aware convolutional neu- ral networks for object proposals and detection. arXiv preprint arXiv:1604.04693 (2016)
Xu, H., Lv, X., Wang, X., Ren, Z., Chellappa, R.: Deep regionlets for object de- tection. arXiv preprint arXiv:1712.02408 (2017)
Zhai, Y., Fu, J., Lu, Y., Li, H.: Feature selective networks for object detection. arXiv preprint arXiv:1711.08879 (2017)
Zhang, S.,Wen, L., Bian, X., Lei, Z., Li, S.Z.: Single-shot re nement neural network for object detection. arXiv preprint arXiv:1711.06897 (2017)
Zhu, Y., Zhao, C., Wang, J., Zhao, X., Wu, Y., Lu, H.: Couplenet: Coupling global structure with local parts for object detection. In: Proc. of Intl Conf. on Computer Vision (ICCV) (2017)
Zitnick, C.L., Dollar, P.: Edge boxes: Locating object proposals from edges. In: European Conference on Computer Vision. pp. 391{405. Springer (2014)

你可能感兴趣的:(机器学习,人工智能,AI,SIGAI,计算机视觉,深度学习)

机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
机器学习4——参数估计之贝叶斯估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能
贝叶斯估计问题建模：后验概率公式：P(ωi∣x,D)=P(x∣ωi,Di)P(ωi)∑j=1cP(x∣ωj,Dj)P(ωj)P\left(\omega_i\mid\mathbf{x},\mathcal{D}\right)=\frac{P\left(\mathbf{x}\mid\omega_i,\mathcal{D}_i\right)P\left(\omega_i\right)}{\sum_{j=1
8、做中学 | 四年级下期 Golang运算符
运算符：在程序中扮演执行数学、逻辑运算的过程一、算术运算符数学运算使用到的运算符运算符描述实例+相加A+B输出结果30-相减A-B输出结果-10*相乘A*B输出结果200/相除B/A输出结果2%求余B%A输出结果0++自增A++输出结果11–自减A--输出结果9//运算符varaint=10varbint=20varcint//+运算c=a+bfmt.Println("c=",c)//30//-c
用Tensorflow进行线性回归和逻辑回归（十） lishaoan77 tensorflow 线性回归 tensorboard 可视化
用TensorBoard可视化线性回归模型TensorBoard是一种可视化工具，用于了解、调试和优化模型训练过程。它使用在执行程序时编写的摘要事件。上面定义的模型使用tf.summary.FileWriter来写日志到日志目录/tmp/lr-train.我们可以用命令调用日志目录的TensorBoard，见Example3-13(TensorBoard已黙认安装与TensorFlow一起).Ex
强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
机器学习3——参数估计之极大似然估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能算法
参数估计问题背景：P(ωi∣x)=p(x∣ωi)P(ωi)p(x)p(x)=∑j=1cp(x∣ωj)P(ωj)\begin{aligned}&P\left(\omega_i\mid\mathbf{x}\right)=\frac{p\left(\mathbf{x}\mid\omega_i\right)P\left(\omega_i\right)}{p(\mathbf{x})}\\&p(\mathbf
uniapp vue3版本的一些小细节！养乐多～ch uni uni-app vue.js 前端
1,生命周期的引用import{onShow,onHide,onLoad}from"@dcloudio/uni-app"onShow(()=>{showLog('onShow')})onLoad((options)=>{showLog('onLoad')})需要引入，才可以调用2，全局引入css在main.js或者ts中，导入就可以//例如引入全局CSS文件import'./util/baseCs
第06章_java常用类假装不痛 java java jvm 开发语言
6.java常用类6.1String类publicclassMain{/*1.概述1.1String:字符串，使用一对""引起来表示1.2String是声明为final的，不可被继承1.3String实现了Serializable接口：表示字符串是支持序列化的实现了Comparable接口：表示String可以比较大小1.4String内部定义了finalchar[]value用于存储字符串数据(
java项目打包_Java项目打包方式分析 weixin_39727402 java项目打包
概述在项目实践过程中，有个需求需要做一个引擎能执行指定jar包的指定main方法。起初我们以一个简单的spring-boot项目进行测试，使用spring-boot-maven-plugin进行打包，使用java-cpdemo.jar.执行，结果报错找不到对应的类。我分析了spring-boot-maven-plugin打包的结构，又回头复习了java原生jar命令打包的结果，以及其他Maven打
iOS 13 报错:[Assert] Unsupported use of UIKit view-customization API off the main thread 干志雄 iOS ios
萤石摄像头回看，在iOS11上运行好好，在iOS13上却报错了，报错如下：2021-05-1115:36:38.174462+0800App-Beta[1141:430280][Assert]UnsupporteduseofUIKitview-customizationAPIoffthemainthread.-setBackgroundColor:sentto;layer=;contentOffs
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
高通手机跑AI系列之——3D姿势估计伊利丹~怒风 Qualcomm 智能手机 AI编程 arm python 人工智能
目录环境准备手机软件算法Demo代码功能分析关键模块解析示例代码代码效果环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能
高通手机跑AI系列之——姿态识别伊利丹~怒风 Qualcomm 智能手机人工智能 AI编程 python arm
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机速度越快软件APP：AidLux2.0系统环境：Ubuntu2
高通手机跑AI系列之——实时头发识别伊利丹~怒风 Qualcomm 智能手机 AI编程 python arm 人工智能
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机速度越快软件APP：AidLux2.0系统环境：Ubuntu2
高通手机跑AI系列之——手部姿势跟踪伊利丹~怒风 Qualcomm 智能手机 AI编程 python arm 人工智能
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机运行速度越快软件APP：AidLux2.0系统环境：Ubunt
【iOS越狱开发】iOS越狱步骤1之环境搭建 JR_Wang2491 MAC 移动苹果 ios ios iphone ipad
这段时间都是研究iOS越狱事情，如今我会一点一点的把自己学到的遇到的问题会陆续编写出来，让大家一起讨论，也让做逆向的朋友有个交流平台机会，废话不多说！！一、学习条件至少1~2年iOS开发经验基本UI界面操作多线程网络基本操作数据储存基本操作一台苹果手机，建议至少iPhone5S（因为从5S开始支持arm64架构）或者至少是iPadAir、iPadmini2等支持arm64架构的设备系统至少iOS8
iphone se 一代不完美越狱 14.6 视频壁纸教程(踩坑笔记) YANG_301 ios iphone
iphonese一代不完美越狱14.6加视频壁纸教程-踩坑笔记越狱流程1.爱思助手制作启动u盘坑点:2.越狱好后视频壁纸软件1.源2.软件安装越狱流程1.爱思助手制作启动u盘https://www.i4.cn/news_detail_42302.html此网址为具体流程,但要注意!!!坑点:下图中最后一排quickmode应被勾选(勾选后是×(´ཀ`」∠))进入options后不禁要勾选allow
Docker+Portainer 离线安装 qq_30024063 docker 容器运维
1.Docker安装步骤一：官网下载docker安装包步骤二：解压安装包;tar-zxvfdocker-24.0.6.tgz步骤三：将解压之后的docker文件移到/usr/bin目录下;cpdocker/*/usr/bin/步骤四：将docker注册成系统服务;vim/etc/systemd/system/docker.service然后在文件中添加以下内容，退出并保存（:wq!）[Unit]D
【LlamaIndex核心组件指南 | 模型篇】一文通晓 LlamaIndex 模型层：LLM、Embedding 及多模态应用全景解析
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
iPhone越狱基本流程王景程 github iphone xcode macos
目录一、什么是越狱（Jailbreak）？二、越狱前的准备工作三、越狱方式总览（按iOS版本划分）越狱类型：主流越狱工具一览：四、以Checkra1n为例讲解越狱流程（适合iPhoneX及更早）✅支持设备（iOS12–14）：步骤：五、越狱后的操作（以Cydia为例）⚠️六、越狱风险与注意事项总结流程图：一、iPhone16+iOS26：是否可以越狱？当前情况（截至2025年中）：二、为何新设备（
《AI颠覆编码：GPT-4在编译器层面的奇幻漂流》的深度技术解析踢足球的，程序猿人工智能 python c语言
一、传统编译器的黄昏：LLVM面临的AI降维打击1.1经典优化器的性能天花板//LLVM循环优化Pass传统实现（LoopUnroll.cpp）voidLoopUnrollPass::runOnLoop(Loop*L){unsignedTripCount=SE->getSmallConstantTripCount(L);if(!TripCount||TripCount>UnrollThreshol
c语言实现2的n次方 network爬虫算法 c语言
#include#includeintmain(){intn;scanf("%d",&n);doublea=pow(2,n);printf("%lf\n",a);}
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
稳定币独角兽：Circle InnoLink_1024 区块链稳定币区块链
Circle公司背景分析CircleInternetFinancial（以下简称Circle）是一家成立于2013年的美国金融科技公司，总部位于波士顿，由JeremyAllaire和SeanNeville联合创立。公司最初专注于点对点加密货币支付和交易，后转型为全球领先的稳定币发行机构，其核心产品是与美元1:1挂钩的USDCoin（USDC），目前为全球第二大稳定币，仅次于Tether的USDT。
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f