AndyLiu1997

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016

文章目录

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016
- Abstract
- 1. Introduction
- 2. Related Work
- 3. FASTER R-CNN
- - 3.1 Region Proposal Networks
  - - 3.1.1 Anchors
    - 3.1.2 A Loss Function for Learning Region Proposals
    - 3.1.3 Training RPNs
  - 3.2 Sharing Features for RPN and Fast R-CNN
  - 3.3 Implementation Details
- 4. Experiments
- - 4.1 Experiments on PASCAL VOC
  - 4.2 Experiments on MS COCO
  - 4.3 From MS COCO to PASCAL VOC
- 5. Conclusion

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016

Abstract

目前的目标检测网络依赖于region proposal算法来提出假设的目标位置。之前SPPnet和Fast R-CNN已经减少了检测网络的运行时间，但是减少proposal的时间还是一个瓶颈。本文中，**我们介绍一种region proposal network（RPN），可以与检测网络共享整张图像的卷积特征，这就使得proposal几乎不耗费时间。RPN网络是一个完全conv网络，同时在每个位置预测目标的bounds和objectness分数。RPN端对端训练，生成高质量的region proposals，然后送入Fast R-CNN进行检测。**进一步优化之后，RPN和Fast R-CNN可以训练成共享卷积特征。对于使用backbone VGG-16，我们的检测系统可以达到5帧每秒（5fps），包含所有步骤。在PASCAL VOC2007取得了73.2%mAP，2012上取得了70.4%mAP，每张图像使用300个proposals。

1. Introduction

最近目标检测的发展得益于region proposal方法的成功以及R-CNNs的成功。尽管R-CNN刚开始比较耗时，但是Fast R-CNN通过共享卷积，大大降低了计算量，当忽略region proposal的时间基础上，已经可以几乎达到实时。也就是说，现在proposals是主要的计算瓶颈。

区域proposal方法依赖于inexpensive features和economical inference策略。SS算法，基于低级特征来不断融合proposal，然而这个算法还是较慢，在CPU上每张图需要两秒。EdgeBoxes目前在proposal质量与速度上达到了最好的平衡，0.2s每张。但是无论哪种，都需要花费与检测网络时间相近的时间。

有人可能注意到，CNN使用了GPU加速，而proposal使用CPU计算，这可能会使得对比不公平。一个显然的加速proposal的方法就是使用GPU，但是这种方法可能会使得GPU忽视下游的检测网络，因此不能够共享计算。

本文中，我们改变了算法，使用深度网络来计算proposal，这种方法很有效，使得proposal计算几乎cost-free，与检测网络共享计算。我们提出了新的Region proposal networks（RPNs），可以与目前的目标检测网络共享卷积层，使得测试时，proposal的时间很短（10ms每张）。

我们观察到，R-CNN/Fast R-CNN生成的卷积特征图，同样可以用来生成region proposals。在这些卷积层的后几层（top），我们构建RPN网络（引入了两个额外的conv层），一个用来将每个conv map位置编码成一个短的（比如256维）的特征向量；另一层，在每个conv map位置，输出一个objectness分数，然后在这个位置以不同尺度和长宽比的k个区域进行回归找边界，通常k = 9。

我们的RPN网络因此是一种fully-convolutional network（FCN），它们可以对于生成proposal这个任务来进行端对端训练。**为了将RPN整合到Fast R-CNN检测网络中，我们提出了一种简单的策略：保持proposal固定时，alternates对RPN任务进行微调或对目标检测进行微调。**这种策略收敛很快，训练的网络的conv 特征可以被两种任务shared。

我们使用PASCAL VOC来评估我们的模型，我们的模型效果超过了使用SS的Fast R-CNN，同时我们还消除了SS方法在测试时的时间消耗。使用VGG，我们的检测网络在GPU上仍可以达到5fps（包括所有步骤），这意味着我们在速度和准确率方面都很实用（PASCAL VOC2007 73.2%mAP，2012上，70.4%mAP）。

2. Related Work

最近的一些文章提出了一些使用深度网络的方法来**生成class-specific或者class-agnostic的bbox。**在Overfeat中，对于只有一个单个目标的定位任务，使用一个FC层来预测box的坐标，这个FC层之后转换为conv层来检测多个class-specific目标。多box的方法从网络中生成区域proposals，网络的最后一个FC层同时预测多个boxes，R-CNN就是这种方式。它们的proposal网络在单个图像或者多个crops上应用。

共享卷积计算由于它的准确以及有效率，目前也引起了注意。Overfeat论文从一个图像金字塔来计算conv特征，用来分类、定位、检测。SPP共享卷积特征图，可以计算R-CNN和语义分割。Fast R-CNN在共享的conv特征上完成端对端检测，因此取得了好的准确率和速。

3. FASTER R-CNN

我们的目标检测系统叫做Faster R-CNN，由两个模块组成，一个是一个深度fully convolutional网络，来提出区域，第二个模块是Fast R-CNN检测器。整体来说如图2所示。使用了最近流行的神经网路中的“注意”策略，RPN网络告诉Fast R-CNN去看哪里。

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016_第1张图片

3.1 Region Proposal Networks

**RPN网络输入任意尺寸的图像，输出一系列矩形的目标proposals，每个proposal都带有一个objectness分数。**我们使用这部分介绍的一种fully-convolutional网络来完成这个过程。因为我们最终的目的是与Fast R-CNN来共享卷积计算，我们假设RPN与它共享同样的卷积层。我们的实验中，我们使用ZF5（5个卷积层），以及VGG16（13卷积层）作为模型。

**为了生成区域proposal，我们在最后一层共享卷积层的输出特征图上滑动一个小的网络，这个网络与输入卷积图的每个n * n空间窗口完全相连。每个滑动的窗口映射到一个更低维的向量（ZF-256维，VGG-512维）。**这个向量被送入两个分别的FC层，一个bbox回归层（reg），一个box-分类层（cls）。**我们在本文中，设置n = 3，注意到这个尺寸映射回输入图像的感受野是很大的（两种模型分别对应171和228像素）。**图1左边简要描述了这个网络在某位置的样子。注意到因为这个网络使用滑窗的形式，FC层在所有空间位置都是共享的。这种结构很自然的使用一个n * n的卷积层，后面接两个1 * 1的卷积层用来reg和cls，在n * n卷积层之后，使用ReLU。

3.1.1 Anchors

在每个滑窗位置，**我们同时预测k个区域proposal，reg层最后输出4k，表示k个boxes的坐标。cls输出2k，表示目标/非目标的可能性。**k个proposals使用k个参考box进行参数化，这些参考box称作anchor。每个anchor的中心是滑窗的中心，有着不同的尺度和长宽比。我们使用3个尺度和3个长宽比，一共k = 9个anchor。**对于一个尺寸为W * H的卷积特征图（通常~2400），一共就有WHk个anchors。**我们方法的一个重要特性就是平移不变性（translation invariant），在anchor和计算proposal阶段都是。

作为对比，MultiBox方法使用k-means聚类来对整张图像生成800个anchors，而且没有平移不变性。如果图像中的一个目标平移了，proposal也应该平移，同样的函数可以在另一个位置成功预测出来目标。而且，由于MultiBox anchors不是平移不变的，它需要（4+1） * 800维度的输出层，而我们方法需要的是（4 + 2）* 9维度（我们是一个小网络滑窗）的输出层，我们的proposal层参数更少，更不容易过拟合。

我们的anchor同样考虑了多尺度，我们的k个anchor的尺度和长宽比都是不同的，因此不需要金字塔，也不需要多尺度的图像，只需要在单尺度图像计算得到的特征图上取得多种anchors即可满足Fast R-CNN的要求。

3.1.2 A Loss Function for Learning Region Proposals

为了训练RPN，我们对每一个anchor使用一个二分类的标签（是目标or not）。我们对两种anchor标记为正标签：

与某个ground truth有着最大的IoU
与任意一个ground truth有着超过0.7的IoU

注意到，一个ground truth可能会使得多个anchors标记成positive。我们对与所有的ground truth的IoU都小于0.3的anchors标记为负样本，其他的样本既不是正也不是负，忽略掉，对训练没有贡献。

使用以上定义，我们依照Fast R-CNN中的多任务loss来定义我们要最小化的loss函数，如下：

这里i是一个mini-batch中anchor的index，pi是anchor i是目标的预测概率。pi * 是ground truth的label，如果anchor为positive，则为，否则为。ti是一个向量，表示预测的bbox的四个参数，ti * 是与这个positive的anchor相关联的ground truth的bbox参数。分类的Loss，Lcls为两类（目标or not）的log loss。**对于回归loss，我们使用 $L_{reg}(t_i,t_i^*) = R(t_i-t_i^*)$ ，其中R为鲁棒的损失函数（smooth L1，Fast R-CNN中定义），对于 $p_i^*L_{reg}$ 表示只有正anchor可以激活这个回归loss。**最后的输出包括pi和ti，使用Ncls和Nreg进行归一化，并且有一个平衡权重 $\lambda$ 。

对于回归，我的的四个参数为：

这里的x、y、w、h表示box中心的坐标以及宽度和高度。x、xa、x * 分别表示预测的box，anchor box，ground truth。这就可以看做从anchor不断逼近ground-truth box的回归过程。

无论如何，我们的bbox回归的方法与之前的基于特征图的回归方法都不同。之前的bbox回归是工作在对任意尺寸区域求得的卷积特征图上，回归的参数被所有区域尺寸shared。我们的方法中，用于回归的特征在特征图上有着相同的空间尺寸（n * n）。为了考虑到多种尺寸，网络学习了一系列k个bbox regressors。每个regressor负责一个尺度和长宽比，这k个regressors不共享参数。这样，尽管特征是固定尺寸的，网络仍能够预测多种不同尺寸的boxes。

3.1.3 Training RPNs

RPN网络可以通过端到端的反向传播和SGD来训练。我们遵循“image-centric”采样策略来训练网络。每一个mini-batch来自于单个图像，包括许多positive和negative的anchors。也可以对所有的anchor来对loss进行优化，但是这样可能会有所阻碍，因为negative的anchors占大多数。所以我们对一张图像随机取样256个anchors来计算这个mini-batch的loss函数，这256个正负anchor比例应该为1：1。如果正anchor少于128，那就使用更多的负anchor。

我们使用均值为0，标准差为0.01的高斯分布来对新的层随机初始化。其他的共享的卷积层使用在ImageNet分类上预训练的模型的权值。然后我们对ZF的所有层，以及VGG的con3_1之后的层进行fine-tuning。在PASCAL VOC 数据集上，我们前60k个mini-batches使用0.001的学习率，之后的20k mini-batch使用0.0001。我们使用动量0.9,0.0005的weight decay。

3.2 Sharing Features for RPN and Fast R-CNN

尽管上面我们已经描述了如何训练RPN网络，但是我们没有考虑基于区域的目标检测RNN如何利用这些proposals。对于检测网络，我们使用Fast R-CNN。下面我们描述如何使得RPN和Fast R-CNN结合到一起并且共享卷积层的算法。

单独训练RPN或者Fast R-CNN，它们对以不同方式修改卷积网络，因此我们需要使用一种技术可以在它们两个之间共享卷积层，而不是分别学习两个网络。我们讨论了三种方法：

Alternating training。这种方法，我们首先训练RPN，然后使用proposals来训练Fast R-CNN。然后再使用Fast R-CNN来微调RPN，这个过程迭代进行。本文中所有的实验都使用了这种解决方案。
Approximate joint training。这种方法，在训练时RPN和Fast R-CNN被融合成一个网络。在每个SGD迭代中，前向pass生成region proposals，这些在训练Fast R-CNN时被当做fixed、pre-computed proposals。反向传播与通常一样，对于共享层，反向传播综合了RPNloss和Fast R-CNNloss。这种方法很好应用，但是忽视了网络的坐标也是响应，因此是近似的。我们的实验中，我们发现这种方法效果较好，但是与上面方法相比降低了25-50%的训练时间。
Non-approximate joint training。正如上面介绍的，由RPN预测的bbox同样是输入的函数。Fast R-CNN中的RoI池化层将卷积特征和RPN的bbox作为输入，所以理论上有效的反向传播也应该包括对box坐标的求导。在Non-approximate joint training中，我们考虑这部分，有人通过对RoI池化层改造为RoI warping层来使得其对bbox坐标有辨别力，这个层不在我们论文的考虑范围内。

4-Step Alternating Training。本文中，我们使用一个4步训练算法来通过alternating优化来学习共享的特征。==第一步，我们使用3.1.3中描述的过程来训练RPN网络，网络使用在ImageNet预训练的模型初始化，然后针对region proposal任务进行微调；第二步，我们使用Fast R-CNN训练一个单独的检测网络，使用第一步中的RPN生成的proposals，这个网络也是使用在ImageNet预训练的模型初始化，此时这两个网络没有共享卷积层；第三步，我们使用检测网络来初始化RPN训练，但是我们固定了需要共享的conv层，只微调与RPN网络不同的层，这时两个网络就共享卷积层了；最后，保持共享卷积层不变，我们微调Fast R-CNN特有的层。==这样，两个网络共享了相同的卷积层，并且形成了一个整体网络。这种alternating训练可以迭代多次，但是我们没有观察到特别好的效果提升。

3.3 Implementation Details

**我们训练和测试网络都使用单尺度，我们resize图像使其短边为600像素。**多尺度的特征提取（金字塔）可能会提升准确率，但是会耗费许多时间，达不到一个速度和准确率的平衡。在re-scaled图像上，ZF和VGG的总步长为16像素，在rescale之前大概是10像素，即使这么大的步长也会取得好的结果，尽管使用更小的步长准确率可能会提升。

**对于anchors，我们使用3种尺度的anchor，128 * 128，256 * 256，512 * 512。三种长宽比1:1，2:1，1:2。**这几个参数不针对特定数据集，是通用的。我们的方法没有使用金字塔（以降低运行时间），但是结果表明我们的网络对各种长宽比以及尺度都有很好的效果（如图1右）。表1展示了使用ZF网络地每个anchor学习到的平均proosal尺寸。我们注意到我们的算法可以产生比感受野更大的proposal。这样的预测是可能的，感受野中可能只是目标的一部分，因此需要扩大。

跨过图像边界的anchor也需要认真处理。在训练阶段，我们忽视了所有的跨边界的anchors，它们不会对loss产生影响。**对于一个1000 * 600的图像，总计可能会有接近20000（60 * 40 * 9，总步长大约为16）个anchors。**忽略了跨边界的anchors，有大概6000个anchors用来训练。如果不忽视这些跨边界的anchors，它们会对修正错误引入困难，并且训练不会收敛。然而在测试阶段，我们仍对整张图像使用fully convolutional RPN，可能会产生跨边界的box，我们直接将其剪切到边界上。

一些RPN proposal互相高度重叠。为了减少冗余，我们使用非极大值抑制NMS，依据它们的cls分数。我们设定阈值为0.7（IoU大于0.7被留下），最后每张图像留下大概2000个proposal。我们之后会展示，NMS不会损害最终的准确率，但会极大降低proposal的数量。在NMS之后，我们使用top-N ranked区域用来检测。我们使用2000了RPN proposals来训练Fast R-CNN。

4. Experiments

4.1 Experiments on PASCAL VOC

我们在PASCAL VOC 2007上来评估我们的方法。这个数据集包含了5k的训练验证集合5k的测试集，20类目标。对于预训练网络，我们使用ZF5的快速模式，有5层conv，3层fc，以及VGG16模型，有着13层conv。我们使用mAP评估检测效果。

表2（top）展示了使用不同的region proposal方法的Fast R-CNN结果，这些结果使用了ZF网络。对于SS算法，我们使用快速模式生成2000个proposals；对于EdgeBoxes（EB），我们使用默认EN设置，0.7IoU。前者取得了58.7%的mAP，后者取得了58.6%的mAP。使用RPN，300个proposals情况下，我们取得了59.9%的mAP。RPN的速度快得多，因为共享了卷积，且proposal较少，对FC计算也有所减少。

Ablation Experiments on RPN。为了探究RPN作为proposal方法的表现，我们做了一些对比实验。首先我们展示了RPN和Fast R-CNN共享卷积层的效果，为了做到这个，我们在训练第二步停止；对比可以发现，不共享的情况下mAP从59.9%降低到58.7%。

之后我们探究RPN对训练上面的影响。我们使用SS算法来训练网络，在测试时使用RPN，且不与Fast R-CNN共享卷积。可以发现效果都降低了，但是任可以达到最差55.1%。

之后我们探究cls和reg的作用。没有使用cls的情况，我们就直接随机取样N个proposal送入后面。当N=1000时，效果几乎没什么变化，因为proposal足够多；但是N=100时，准确率明显下降了。

另一方面，当去除reg之后，即直接将anchors作为proposal输出，mAP都有所下降，这证明了RPN中的reg回归也是很有用的，只使用anchor，取得的效果不够好。

我们同样使用了更好的模型，我们使用VGG-16来训练RPN，然后仍然使用上面的SS+ZF检测器，mAP上升到了59.2%。这证明了更深的网络对训练RPN来说也更有效。

**Performance of VGG-16。**表3展示了使用VGG-16用于RPN和检测的效果，在不共享卷积的情况下取得了68.5%的mAP，比所有的SS算法的都要好，不像SS这种pre-defined，RPN网络更受益于好的网络。使用了特征共享，可以达到69.9%mAP。我们继续使用PASCAL VOC2007和2012的训练验证集组合进行训练，mAP达到了73.2%。

图5展示了在PASCAL 2007测试集上的一些结果。

在PASCAL VOC 2012测试集上（表4），我们方法取得了70.4%的mAP。

表6和表7显示了细节。

在表5中，我们总结了目标检测系统的运行时间，SS算法花费1-2秒，平均1.5s，Fast R-CNN（VGG-16）花费320ms，针对于2000个proposals，使用SVD在FC层分解，花费降低到223ms。我们的方法（VGG16）总共只花费198ms，因为共享了卷积层，RPN只需要10ms来计算，我们的proposal更少（300左右），也使得花费更少，我们使用ZF网络可以达到17fps。

**Sensitivities to Hyper-parameters。**表8中，我们探究anchor的设置。我们的默认设置是3尺度，3个长宽比，取得了69.9%mAP。如果每个位置只使用一个anchor，mAP大概会下降3-4%。使用3个尺度，一个长宽比，或者3个长宽比，一个尺度，都会提升效果，这证明了使用多尺度的anchors是有效的。在这个数据集上，使用3尺度1长宽比取得了与3尺度3长宽比相当的效果。但是我们仍使用三个长宽比来保持我们网络的灵活性。

在表9中，我们对比了不同的 $\lambda$ 值对结果的影响。我们默认设为10，这使得两个任务的在归一化之后权重大致相等。表9表明结果在很大范围内对 $\lambda$ 不敏感。

**Analysis of Recall-to-IoU。**下面我们计算与ground truth有不同IoU的proposal的recall。值得注意的是Recall-to-IoU尺度与最后的检测准确率仅仅是松散关联。更适合用这个来分析proposal方法而不是评估效果。

图4中，我们展示了使用300,1000,2000个proposals，的结果。我们比较了SS和EB以及N proposal根据评分排序。图中展示出RPN方法当proposal数量从2000到300中表现很好。这也就解释了RPN可以在只有300proposal还可以取得好的结果，根据我们之前的分析，这主要由于RPN的cls项。当proposal数量较少时，SS和EB的召回率下降更快。

One-Stage Detection vs. Two-Stage Proposal + Detection。

OverFeat提出的检测方法是在卷积特征图上使用regressors和classifiers进行滑窗。**OverFeat是一个one-stage，class-specific的检测pipeline，我们的方法是two-stage，级联的流程，包括class-agnostic proposal和class-specific检测。**在OverFeat中，基于区域的特征来自于一个对金字塔进行一个固定长宽比的滑窗。这些特征用来同时决定定位和目标的种类。在RPN中，特征是来自3 * 3的滑窗，然后使用不同尺度和长宽比的anchors来预测proposal。尽管两种方法都使用了滑窗，但是proposal 任务只是Faster R-CNN的第一阶段，之后还会使用Fast R-CNN对proposal进行微调。在我们方法的第二阶段，region-based的特征通过RoI pooling从第一步生成的proposal中生成，更加可信。

为了对比one-stage和rwo-stage的系统，我们使用one-stage的Fast R-CNN仿真了OverFeat系统。在这个系统中，proposals是dense滑窗，三个尺度（128,256,512）和三个长宽比（1:1,1:2,2:1）。Fast R-CNN训练来预测class-specific的分数，对这些滑窗来回归box位置。因为OverFeat系统使用了图像金字塔，我们也可以使用从5个尺度提取的卷积特征进行评价。

表10比较了two-stage的系统和两个one-stage系统的效果。使用ZF模型，one-stage系统取得53.9%的mAP。这比two-stage的58.7%要低。实验证明了级联的proposal和检测是更有效的。我们也注意到这里的one-stage方法更慢，因为需要考虑更多的proposals。

4.2 Experiments on MS COCO

我们在COCO数据集上进行了进一步测试，数据集包含80类目标，80k图像训练，40k验证集，20k测试集。我们评估mAP使用IoU{0.5:0.05:0.95}平均求得mAP。（这是COCO的标准评估尺度mAP@[.5,.95]，PSACAL VOC的评估尺度为[email protected]）

在这个数据集上，我们对系统进行了一些小的调整。我们使用8个GPU训练模型，这样mini-batch就是对于RPN是8（1 per GPU），对于Fast R-CNN是16（2 per GPU）。RPN和Fast R-CNN都是使用0.003学习率训练240k迭代，然后使用0.0003学习率训练80k迭代。我们修正了学习率（使用0.003而不是0.001）是因为mini-batch的尺寸变了。对于anchors，我们使用3个长宽比和4个尺度（增加了64），主要是考虑到数据集中可能有较小的目标。另外，在我们的Fast R-CNN检测中，负样本定义为与groundtruth的IoU在[0,0.5)区间内，而不是[0.1,0.5)，因为我们注意到在之前的Fast R-CNN中，[0,0.1)这部分样本一直没有使用。

其他的应用细节与在PASCAL VOC 上的应用一一致，我们仍保持单尺度s=600,300个proposals。测试时间每张图像大约是200ms。

Faster R-CNN in ILSVRC & COCO 2015 competitions。我们已经证明了Faster R-CNN得益于更好的特征，多亏了RPN是通过神经网络来学习proposal生成。这个结果甚至在网络增加到100层以上也是存在的，我们使用ResNet-101来替代backbone VGG-16，COCO上的mAP提升到了48.4%/27.2%。使用了一些提升手段，He等人获得了单个模型55.7%/34.9%以及组合模型59.0%/37.4%，获得了COCO2015检测竞赛的第一名。同样的系统也取得了ILSVRC2015的第一名。

4.3 From MS COCO to PASCAL VOC

对于提升深度神经网络来说，大尺度数据是十分关键的。下面我们探究MS COCO数据如何提升在PASCAL VOC 上的检测效果。

如表12所示，我们可以看到，增加了COCO上的训练，可以提升网络在VOC上的表现。

5. Conclusion

我们提出RPN网络用于有效且准确的生成region proposal，通过共享卷积特征，这步的时间花费几乎可以忽略不计。我们的方法是一个整合的、基于深度学习的目标检测系统，可以接近实时检测。学习到的RPN提升了region proposal的质量，因此总体上提升了目标检测的准确率。

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
C语言手写简易 DNS 客户端（接收部分）（Charon） c语言开发语言
本文通过纯C语言手动构造DNS请求报文，使用UDP协议发送到公共DNS服务器，并接收响应，完整演示DNS请求流程。主流程：dns_client_commit()这是整个流程的核心函数，下面我们按顺序拆解每一步的逻辑，尤其突出发送sendto与接收recvfrom的设计思路和实现。第一步：创建UDP套接字intsockfd=socket(AF_INET,SOCK_DGRAM,0);if(sockfd
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
Java多线程吴鹰飞侠 java 开发语言
多线程是指一个程序中有多个执行路径（线程），每个线程并发运行，彼此独立，执行不同的任务。一个线程是程序中的基本执行单位。创建和启动线程1.通过继承Thread类classMyThreadextendsThread{@Overridepublicvoidrun(){System.out.println("线程正在执行...");}}publicclassMain{publicstaticvoidma
OpenCV图像数据处理:convertTo,normalize和scaleAdd luofeiju OpenCV函数实战 opencv
在OpenCV图像处理的世界里，有几个函数进行一些基本数据变换：cv::convertTo()：类型转换与线性缩放；cv::normalize()：归一化处理；cv::scaleAdd()：加权叠加运算。cv::addWeighted():与scaleAdd相似，进行加权叠加运算；一、cv::convertTo()：线性变换+数据类型转换voidcv::Mat::convertTo(OutputA
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
用Python和OpenCV从零搭建一个完整的双目视觉系统（三） presenttttt 双目立体视觉数码相机
本系列文章旨在系统性地阐述如何利用Python与OpenCV库，从零开始构建一个完整的双目立体视觉系统。本项目github地址：https://github.com/present-cjn/stereo-vision-python.git在上一篇文章中，我们为项目设计了清晰的架构。现在，我们将深入第一个，也是整个双目视觉系统最关键的模块——相机标定(CameraCalibration)。如果说双目
（一）OpenCV——噪声去除（降噪）
高斯滤波器（针对高斯噪声）高斯噪声是指它的概率密度函数服从高斯分布（即正态分布）的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。高斯滤波(Gaussianfilter)包含许多种，包括低通、带通和高通等，我们通常图像上说的高斯滤波，指的是高斯模糊(GaussianBlur)，是一种高斯低通滤波，其过滤调图像高频成分（图像细节部分），保留图像低频成分（图像平滑区域），所以对图
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
多线程在Java项目中的使用案例(笔记) 车车不吃香菇 java基础 java
多线程在Java项目中的使用案例(笔记)实现runnable接口@OverridepublicBooleanaddMeetingExpertIds(MeetAddExpertDtomeetAddExpertDto,LonguserId){//会议关联到专家//如果需要发给专家newThread(newRunnable(){@Overridepublicvoidrun(){try{if(meetAd
Dart 语言知识点总结小李飞飞砖 javascript 开发语言 ecmascript
Dart语言知识点总结Dart是Flutter框架的编程语言，是一种面向对象的、强类型的、支持垃圾回收的语言。以下是Dart语言的核心知识点：一、基础语法1.变量与常量//变量声明varname='Alice';//类型推断Stringname='Alice';//显式类型dynamicdynamicVar='String';//动态类型//常量finalfinalVar='不可修改';//运行时
NodeJS VM2沙箱逃逸漏洞分析【CVE-2023-29199】 R3s3arcm NodeJS漏洞分析 node.js 安全安全威胁分析
NodeJSVM2沙箱逃逸漏洞分析【CVE-2023-29199】简介Node.js是一个基于V8引擎的开源、跨平台的JavaScript运行环境，它可以在多个操作系统上运行，包括Windows、macOS和Linux等。Node.js提供了一个运行在服务器端的JavaScript环境，使得开发者可以编写并发的、高效的服务器端应用程序。Node.js使用事件驱动、非阻塞I/O模型来支持并发运行。它
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016

文章目录

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文阅读笔记2016

Abstract

1. Introduction

2. Related Work

3. FASTER R-CNN

3.1 Region Proposal Networks

3.1.1 Anchors

3.1.2 A Loss Function for Learning Region Proposals

3.1.3 Training RPNs

3.2 Sharing Features for RPN and Fast R-CNN

3.3 Implementation Details

4. Experiments

4.1 Experiments on PASCAL VOC

4.2 Experiments on MS COCO

4.3 From MS COCO to PASCAL VOC

5. Conclusion

你可能感兴趣的:(CV论文阅读,计算机视觉,神经网络,深度学习)