Shadownow

目标检测学习笔记1

文章目录

一.前言
- 1. 目标检测目的
- 2. 如何定位？
- 3. 目标检测方法
- 4. 一些概念介绍：
二、滑动窗口检测
- 1.识别流程
- 2.方法缺点
三、R-CNN模型
- 1.算法流程
- 2.如何选出候选区域？
- 3.如何分类？
- 4.非极大抑制（NMS）
- 5.修正候选区域
- 6.目标检测评估指标
- 7.RCNN缺点
四、SPP-Net
- 1.为什么要输入固定尺寸？
- 2.算法流程
- 3.SPP-Net优缺点
五、Fast-RCNN
- 1.算法流程
- 2.改进部分
- 3.模型性能对比
六、Faster-RCNN
- 1.RCNN三者对比
- 2.网络结构
- 3.算法流程
- 4.区域生成网络（RPN）原理
- 5.Faster-RCNN的训练
- 6.Faster-RCNN效果对比
- 7.Faster-RCNN总结
七、Yolo（You Only Look Once）
- 1. 网络结构
- 2.单元格（grid cell）
- 3.训练过程
- 4.与Faster-RCNN比较
- 5.YOLO总结
八、SSD
- 1.网络结构
- 2. 算法流程
- 3. PriorBox 层
- 4. 训练和测试过程
- 5. 总结

一.前言

计算机视觉有四大基本任务，分别是：分类、定位、检测、分割。其中分类任务是所有任务的基础。因为对于一幅图像，可能含有多个物体。所以分类任务是对图像中主体事物类别的判断。定位任务也是单目标任务，和分类任务唯一的不同是，不仅需要分类还需要把判别出的主体事物的边界框出来。目标检测是多目标任务，是对图像中各种需要检测的物体如果出现用边界框框住，并判别其类别。分割任务和检测任务的区别就在于是框的形状是物体的边界形状。

1. 目标检测目的

从图像或视频流中，检测出其中一个或多个物体的类别与其位置 其任务简而言之即：对一个或多个物体分类+定位

任务	输入	输出	评判标准
分类	图	标签	准确率
定位	图	坐标	IoU

2. 如何定位？

x,y,w,h：中心点位置(x,y)，中心点距离两边的长和宽(w,h)
xmin,ymin,xmax,ymax:左上角坐标(xmin,ymin)，右下角坐标(xmax,ymax)

3. 目标检测方法

两步走：区域推荐—>分类，先推荐图像中可能具有目标物体的区域，然后对这些区域进行分类。（典型网络：RCNN,SPP-Net,Fast-RCNN,Faster-RCNN)
端到端：采用一个网络一步到位（典型网络：Yolo,SSD）

4. 一些概念介绍：

Ground-truth bounding box:图片中真实标记的物体位置的框
Predicted bounding box:预测的框
如下图所示，绿色的框为正确标记的物体位置，红色的框为模型预测的物体位置。

对于多个目标，无法提前预测图片中到底有多少个物体出现，因此就没有固定个数的输出。接下来对目标检测的一些方法进行简要说明。

二、滑动窗口检测

这是一种暴力解法。定义一个滑动窗口，沿着图片从左往右，从上到下滑动，形成子图片，识别子图片是否包含所识别物体，并进行分类。

需设定一个固定大小的窗口，可使用不同大小的宽高比多次滑动。

1.识别流程

首先定义若干个尺寸的窗口。假设K个。
每种尺寸的窗口分别去滑动（如上图所示滑动流程）。假设每个窗口滑动M次。
因此生成了K×M个子图片去分类。

2.方法缺点

暴力穷举，计算量十分大。

因此为我们提供了一种思路，有没有不暴力穷举的方法呢？

三、R-CNN模型

为了解决滑动窗口方法暴力穷举带来的缺点，提出了一种思路：

候选区域方法（Region Proposal Method)：从初始图片中找出可能存在物体的候选区域，然后对候选区域进行分类。

1.算法流程

此算法识别流程如上图所示：

找出图片中可能存在的候选区域(ROI,Region of Interest)，默认找2000个候选区域。
此处以AlexNet网络为基准，将候选区域调整图像比例，以适应AlexNet网络的输入要求227×227。对每个候选区域进行卷积提取特征，每个候选区域输出提取到的特征4096，因此输出2000×4096。
将2000×4096维特征输入至SVM分类器进行分类（假设有20种分类，SVM是二分类，因此此处有20个SVM分类器）。获得2000×20维矩阵。
分别对2000×20维矩阵进行非极大抑制（NMS:Non-Maxinum Suppression），以剔除重叠的、不好的区域，剩下结果相对较好的框。
修正bbox，对其做回归微调。

2.如何选出候选区域？

Selective Search算法，简称SS。
1、首先以像素为单位划分图像，分为组。
2、计算每组的相似度，将最接近的两个组进行合并。
3、重复操作2，直到图像合并完。
4、以上合并操作产生的区域都成为候选区域。
如下图所示。

由于产生的每个候选框尺寸不同，但CNN提取特征向量时需要接受固定长度的输入，因此需要对候选区域作尺寸上的修改。

所提取到的特征会存于磁盘中（这些特征才是真正要训练的数据）。

3.如何分类？

2000×4096维的特征向量：每张图片提取了4096特征，共有2000张图像。
针对每张图像，需要分别输入到20个分类器中。

如：
1.猫分类器
2.狗分类器
.
.
.
20.鸟分类器

因此输出2000×20的分数：每张图片有20个分数，共有2000张图片。分数代表分类为某类别的概率，值在0-1之间。

4.非极大抑制（NMS）

目的：筛选候选框，以为可能有的候选框位置很接近，就没有必要都保留。最理想的情况是，每个目标物体仅留一个最优的候选框。

迭代过程：

假设有2个目标物体
则最理想是从2000个框中最终筛选出2个候选框

依据每个候选框的分类得分，根据阈值对2000个候选框进行筛选（假设阈值0.5）。如图所示，蓝色的框就被筛选掉了，留下了红色的框（此处的框数量仅仅举例，实际上有2000个框参与判断）
计算每个GT bbox与每个候选框的IoU（何为IoU在文章后面会有补充说明），选出每个GT bbox所对应的最高IoU值的候选框（假设经过1筛选后有5个候选框，则此处计算了2×5=10个IoU值，选出来2个候选框(A1,A2)。如图所示，两个黄色的框是GT bbox目标物体，计算五个蓝色框分别与两个黄色框的IoU值，假设与左黄IoU最高的是A，与右黄IoU最高的是B。
计算与A1,A2预测同一物体的剩余候选框（N）的IoU值，高于阈值的N就舍弃掉（这就代表重合度很高的框就没必要保留了）。如图，计算C与A的IoU（假设=0.8）,以及D和E与B的IoU（假设=0.6和0.5）,高于阈值的0.5的就删掉，那么CDE就被删掉了，最终剩下了A,B两个候选框。

5.修正候选区域

由上述结果可看到，候选区域A与左黄的位置还有一些差异，B与右黄也是如此，因此希望通过一定的操作可以使候选区域与GT bbox更吻合，更准确。

使用方法：建立一个bbox regressor。回归用于修正筛选后的候选框，使之回归于GT bbox。默认认为这两个框具有线性关系。
修正过程：
1、已知候选区坐标(px,py,pw,ph)与GT bbox坐标(tx,ty,tw,th)，回归训练学习参数使得pxwx=tx,pywy=ty,pwww=tw,phwh=th)
2、则下一次预测时，候选区坐标×参数，得到预测值。
3、如图，A是候选区，G是GT，每次得到A后，先×参数，得到预测狂G’。

因此，RCNN的输出：一张图片预测候选框x，x ×w=y_locate

y_locate才是真正的算法输出位置。

6.目标检测评估指标

6.1 评估位置

使用IoU交并比（Intersection over Union）

其值在0~1之间。IoU值越大，代表位置重合度越高。
预测框与真实框IoU值越大，则代表预测位置越准确。

6.2 评估分类

训练样本的标记：候选框标记

与每个GT bbox的IoU最大的候选框标记为正样本

剩余候选框与任何GT bbox的IoU大于阈值（假设0.7）的记为正样本；IoU小于阈值（假设0.3）的记为负样本。

使用平均精确率（mean Average Precision,mAP)

mAP=所有类别的AP之和/类别总个数

AP：Average precision

多个类别目标检测中，每个类别都可以根据recall（召回率）和percision（准确率）绘制一条曲线。AP就是该曲线下的面积，mAP意思是对每一类的AP再求平均。

True positives(TP): 被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数；
False positives(FP): 被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；
False negatives(FN):被错误地划分为负例的个数，即实际为正例但被分类器划分为负例的实例数；
True negatives(TN): 被正确地划分为负例的个数，即实际为负例且被分类器划分为负例的实例数。

6.3 方法步骤

1、对于其中一个类别C，首先将算法输出的所有类别C的预测框，按照预测的分数排序;
2、设定不同的k值，选择top k个预测框，计算FP和TP，计算Precision和AP;
3、将得到的N个类别的AP取平均值，即得到了mAP；AP是针对单一类别的，mAP是所有类别的AP求和，再取平均。

RCNN在VOC2007数据集上的mAP达到66%

7.RCNN缺点

虽然RCNN解决了滑动窗口暴力穷举的缺点，但也存在缺陷。

训练阶段多；训练网络、SVM、bbox回归器。还不能一起训练，SVM是离线训练的，回归器也是离线训练
训练耗时。因为分别要对每一个候选区域都要特征提取。
占用磁盘空间大，因为提取的特征都要保存到磁盘中，用于训练。5000张的图片的特征文件就达到了几百G；
处理速度慢（论文中，使用GPU处理识别一张图片要47s）；
图片形状变化。因为候选区域要经过crop/warp进行固定大小，无法保证图片不变形。

改进：提出SPP-Net，减少卷积运算。

四、SPP-Net

在此之前，所有的神经网络都是需要输入固定尺寸的图片，比如224224（ImageNet）、3232(LenNet)、96*96等。这样对于我们希望检测各种大小的图片的时候，需要经过crop，或者warp等一系列操作，这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。

1.为什么要输入固定尺寸？

卷积层的参数和输入大小无关，它仅仅是一个卷积核在图像上滑动，不管输入图像多大都没关系，只是对不同大小的图片卷积出不同大小的特征图，但是全连接层的参数就和输入图像大小有关，因为它要把输入的所有像素点连接起来,需要指定输入层神经元个数和输出层神经元个数，所以需要规定输入的feature的大小。
因此，固定长度的约束仅限于全连接层。

而SPP-Net解决了这个问题。SPP-Net在最后一个卷积层后，接入了SPP金字塔池化层，使用这种方式，可以让网络输入任意的图片，而且还会生成固定大小的输出。

2.算法流程

对整个输入图像进行特征提取，得到feature map；

SS算法对输入图像提取候选区域；

将所得候选区域映射到feature map对应位置，得到候选区域的特征向量；

所得候选区域特征向量经过SPP层，输出固定大小的特征向量，输送给全连接层。

2.1 如何映射

映射关系如上图所示，计算公式如下：

左上角：x1=[x/s]+1
右下角：y1=[y/s]-1
s是CNN中所有strides的乘积（包含了池化、卷积的步长，论文中s=2222=16

2.2 如何转换为固定大小特征向量

假设原图224*224，原图经过卷积后输出13×13×256，其中某个候选区域12×10×256
SPP Layer将候选区域划分成1×1，2×2，4×4三个子图，对每个子图的每个区域进行max pooling，得到（1+4+16）×256=21×256=5376个结果
再全给全连接层。

因此，无论什么尺寸输入的候选区域，都可以得到相同尺寸5376的输出。

3.SPP-Net优缺点

优点：速度提升（但提升不多）
缺点：训练速度还是过慢，效率低，特征也是需要写入磁盘，分阶段训练。

五、Fast-RCNN

希望在SPP-Net的基础上，整合模型的训练，可以提升训练速度。

1.算法流程

对输入图像进行卷积，提取特征feature map；

SS算法提取候选区域；

RoI Projection操作将候选区域映射到feature map，得到候选区域的特征向量；

RoI pooling layer 提取一个固定长度的特征向量，每个特征会输入到一系列的全连接层，得到一个RoI特征向量（对每个候选区域都做一样的操作）

进行softmax分类和bbox regressor。

2.改进部分

废弃了SVM和SPP layer；
换用RoI Pooling 和 softmax多任务分类。

2.1RoI Pooling

在这部分，为了在得到固定长度的向量的同时，还减少计算时间，只使用4×4的盒子划分（SPP-Net中用了三种尺寸1×1，2×2，4×4的盒子）可以减少计算量和计算时间，快很多。实际上是简单版本的SPP。
经过此部分改进，可以节省很多时间，准确率没有突出得提升很多。

2.2End-to-End model

从输入端到输出端直接使用一个神经网络相连，整体优化目标函数。

为什么这整个网络可以统一训练？
特征提取CNN的训练和SVM分类器的训练在时间上是先后顺序，且训练方式相互独立，因此去掉了SVM分类这一过程，而使用softmax分类。
所有特征都存储在内存中，不占用硬盘空间，形成End-to-End模型。（proposal除外，end-to-end在Faster-RCNN中得以完善）

2.3多任务损失
两个loss:

对于分类的loss，是N+1路的softmax输出（N个种类，1为背景），使用交叉熵损失计算；
对于位置回归loss，是4*N路输出的regressor，对每个类别都单独训练一个regressor。使用平均绝对误差损失计算。

2.4fine-tuning训练

在微调时，调整CNN+RoI pooling+softmax
调整bbox,regressor回归中的参数

2.5总结

经过卷积得到特征图
候选区域经过映射后，通过RoI pooling 后传输给全连接层，经过Linear softmax 和 Linear 计算多任务损失，再返回。

3.模型性能对比

参数	R-CNN	SPPNet	Fast R-CNN
训练时间(h)	84	25	9.5
测试时间/图片	47.0s	2.3s	0.32s
mAP	66.0	63.1	66.9

缺点：使用SS提取候选区域，没有实现真正意义上的端对端，操作也十分耗时。

六、Faster-RCNN

在Fast-RCNN的基础上，Faster-RCNN将候选区域筛选融合到网络当中。

Faster-RCNN可简单看作是区域生成网络+Fast-RCNN的模型，使用区域生成网络（Region Proposal Network,RPN）来代替SS

1.RCNN三者对比

2.网络结构

输入图像提取到的feature map供区域生成网络和全连接层共用。

3.算法流程

输入图像，经过CNN网络提取feature map。
区域生成网络RPN。RPN网络用于生成候选区域，称作anchors。
-通过softmax判断anchors属于物体（foreground）还是背景（background）；
- 利用bbox regression 修正属于物体的anchors，获得精确的候选区，输出TOP-N（默认为300）的区域给RoI pooling；
后续进行Fast-RCNN的操作。

4.区域生成网络（RPN）原理

RPN网络的主要作用是得出比较准确的候选区域。

用n×n（默认3×3=9）的大小窗口去扫描特征图，每个滑窗位置映射到一个低维的向量（默认256维），并为每个滑窗位置考虑k种（在论文中设计k=9）可能的参考窗口（论文中称为anchors）

如图，假设feature map 为2020256，用3×3的滑动窗口去滑动，每一个位置有9种窗口比例，因此最终生成了20 * 20 * 9 * 256
3*3卷积核的中心点对应原图上的位置，将该点作为anchor的中心点，在原图框出多尺度、多种长宽比的anchors，三种尺度{128，256，512}，三种长宽比{1:1,1:2,2:1}，这样每个特征图中的像素点都有9种框。
如下图所示，得到了51399个候选框，再进行分类（判断是否是背景）和bbox回归（回归位置）。目的是得到更好的候选区域提供给RoI pooling 使用。
然后进行Fast-RCNN部分。

5.Faster-RCNN的训练

5.1 RPN的训练

目的：从众多的候选区域中提取出score分数较高的，并且经过regression调整的候选区域。
- 分类：二分类，softmax,logistic regression
- 候选框的调整：均方误差作修正

5.2 Fast-RCNN的训练

Fast-RCNN classification（over classes）：所有类别分类N+1，得到候选区域的每个类别概率；softmax；
Fast-RCNN regression（bbox regression）：得到更好的位置。均方误差损失。

5.3 候选区域的训练

训练样本anchor标记
-每个GT bbox 有最高IoU的anchor为正样本；
- 剩下anchor和任何GT bbox的IoU大于0.7为正样本，IoU小于0.3为负样本
- 剩余样本忽略
正负样本比例1：3

三个误差：RPN中置信度误差和坐标误差、Faster-RCNN最后softmax分类的误差和坐标误差。

候选区域的训练是为了得出正确的候选区域，并且候选区域经过了回归微调，在这基础上作Fast-RCNN的训练是得到特征向量做分类预测和回归预测。

6.Faster-RCNN效果对比

	R-CNN	Fast R-CNN	Faster R-CNN
Test time/image	50.0s	2.0s	0.2s
mAP(VOC2007)	66.0	66.9	66.9

由此可见，提升的速度很大，准确率没有什么提升。

7.Faster-RCNN总结

优点：提出RPN网络，形成端到端模型
缺点：训练参数过大
改进需求
- RPN部分可以选择更多尺度去识别一些小目标
- 速度提升

七、Yolo（You Only Look Once）

Faster-R-CNN利用RPN网络与真实值调整了候选区域，然后再进行候选区域和卷积特征结果映射的特征向量的处理，来通过与真实值优化网络预测结果。

Yolo系列算法将这两个步骤合成一个步骤，直接网络输出预测结果进行优化。

接下来对比一些网络（FPS和mAP越大越好）

由上图可看出，Yolo的速度在Faster-RCNN上有了很大提升，但是准确率打折。

1. 网络结构

一个网络搞定一切！GoogleNet+4个卷积层+2个全连接层

流程理解：

原始图片resize到448×448，经过前面的卷积网络之后，将图片输出成一个7 7 30的结构。

于是将图片分为7*7的单元格，每个单元格负责去检测那些中心点落在该格子内的目标，检测出框的位置和置信度。如下图所示（此图用3 * 3的网格来演示），假设一个单元格预测2个候选框，那么就预测出来了18个候选框。
-所谓置信度其实包含两个方面，一是这个边界框含有目标的可能性大小，二是这个边界框的准确度。前者记为a ，当该边界框是背景时（即不包含目标），此时a=0 。而当该边界框包含目标时，a=1 。边界框的准确度可以用预测框与实际框（ground truth）的IOU（intersection over union，交并比）来表征，记为b。因此置信度可以定义为a * b。

候选框经过NMS筛选，筛选概率以及IoU

2.单元格（grid cell）

每个单元格负责预测一个物体类别，并且直接预测物体的概率值
每个单元格预测两个（默认是两个）bbox的位置，两个bbox置信度（confidence）
输出30个值（4+1+4+1+20），4是坐标信息，1是置信度，20代表20类类别的概率。（只用其中一个比较好的候选框去预测类别概率，至于用哪个，通过置信度来决定）

不同意Faster RCNN中的anchors，yolo的框坐标、概率值都是由网络直接得出的，而Faster RCNN是认为设定的一个值，然后利用RPN网络对其优化到一个更准确的坐标和是否背景类别。

非极大抑制：先过滤掉低于某一阈值的bbox，然后对每个类别过滤IoU。就得到了最终检测结果。

3.训练过程

3个部分的损失，损失相加，然后去更新前面的网络

4.与Faster-RCNN比较

Faster-R-CNN利用RPN网络与真实值调整了候选区域，然后再进行候选区域和卷积特征结果映射的特征向量的处理，来通过与真实值优化网络预测结果。而这两步在yolo算法中合成了一个步骤，直接网络输出预测结果进行优化。

所以经常会YOLO算法为直接回归法代表。YOLO的特点就是快。但准确率会下降一些。

5.YOLO总结

优点：速度快
缺点：1. 准确率打折扣； 2. YOLO对相互靠得很近的物体（挨在一起且中点落在同一个格子的情况），还有很小的物体效果不好。因为在YOLO中，每个网格仅仅预测一种物体，且框太少。

八、SSD

SSD：Single Shot MultiBox Detector

结合了Faster RCNN的anchor机制和YOLO回归思想，以达到准和快的目的。

SSD核心：在不同尺度的特征图上采用卷积核来预测一系列Default Bounding Boxes的类别以及坐标偏移。

1.网络结构

上图是SSD和YOLO的网络结构，通过对比可以发现，SSD的优点就是它生成的 default box 是多尺度的，这是因为SSD生成default box 的 feature map 不仅仅是CNN输出的最后一层，还有利用比较浅层的feature map 生成的default box。

以VGG16为基础，使用VGG的前5个卷积，后面增加从conv6开始的5个卷积结构。输入图片要求300*300。

2. 算法流程

图片输入；
经过VGG网络后，输出38 * 38 * 512的特征图1；
再经过卷积结构，输出19 * 19 * 1024的特征图2；
再经过卷积结构，输出10 * 10 * 512的特征图3；
再经过卷积结构，输出5 * 5 * 256的特征图4；
再经过卷积结构，输出3 * 3 * 256的特征图5；
再经过卷积结构，输出1 * 1 * 256的特征图6；
对于特征图1，经过归一化，每一个像素点预测4个default box，则预测了38 * 38 * 4=5776个框；
对于特征图2，每一个像素点预测6个default box，则预测了19 * 19 * 6=2166个框；
对于特征图3，每一个像素点预测6个default box，则预测了10 * 10 * 6=600个框；
对于特征图4，每一个像素点预测6个default box，则预测了5* 5 * 6=150个框；
对于特征图5，每一个像素点预测4个default box，则预测了3* 3 * 4=36个框；
对于特征图6，每一个像素点预测4个default box，则预测了1* 1 * 4=4个框；
则一共预测了5776+2166+600+150+36+4=8732个框。这些框经过Fast NMS 得到最终预测框。

论文中将Detector & classifier 称作 PriorBox 层。

3. PriorBox 层

做什么：

得到default box；（按照不同的长宽比）
吸取Yolo的优点，在网络直接输出每个框的4个位置和预测类别概率；

生成默认候选框default box；（对标Faster-RCNN中anchor）生成后会利用设定的4个variance做位置微调，回归调整候选框；

Conv3 ×3：生成location，4个位置偏移；

Conv3×3：confidence，21个类别置信度（要区分出背景）。

location和confidence
-用来过滤和训练。
Detector & classifier的作用
- SSD的核心是在不同尺度的特征图上进行Detector & classifier 容易使得SSD观察到更小的物体。

4. 训练和测试过程

4.1 训练过程

输入 -> 输出 -> 结果与GT bbox标记样本回归损失计算 -> 反向传播，更新权值

样本标记：
先将prior box 与 ground truth box做匹配进行标记正负样本，每次并不训练8732张计算好的default boxes，先进行置信度的筛选，并且训练指定的正样本和负样本，如下规则
- 正样本：1.与GT重合度最高的boxes 2.与GT的IoU超过一定阈值的
- 负样本：其他样本
- 比例正：负=1：3

损失：置信度softmax，位置回归Smooth L1 Loss

4.2 测试过程

输入 -> 输出 -> NMS -> 输出

5. 总结

基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
横幅检测数据集-1500张图片智慧城市管理活动现场管理商业广告分析
横幅检测数据集-1500张图片已发布目标检测数据集合集（持续更新）️横幅检测数据集介绍数据集概览检测目标类型应用场景数据样本展示使用建议1.数据预处理优化2.模型训练策略3.实际部署考虑4.应用场景适配5.性能优化建议数据集特色商业价值技术实现路径模型选择建议特殊技术考虑集成方案建议应用效果评估性能指标建议业务价值指标YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
旋转目标检测：Deep Spatial Feature Transformation for Oriented Aerial Object Detection【方法解析】沉浸式AI 《AI与SLAM论文解析》人工智能计算机视觉旋转目标检测
DeepSpatialFeatureTransformationforOrientedAerialObjectDetection目录DeepSpatialFeatureTransformationforOrientedAerialObjectDetection摘要关键词引言相关工作旋转对齐模块特征对齐方法旋转对齐模块特征选择模块摘要航空图像中的目标检测在计算机视觉领域引起了广泛关注。不同于自然图像
Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

目标检测学习笔记1

文章目录

一.前言

1. 目标检测目的

2. 如何定位？

3. 目标检测方法

4. 一些概念介绍：

二、滑动窗口检测

1.识别流程

2.方法缺点

三、R-CNN模型

1.算法流程

2.如何选出候选区域？

3.如何分类？

4.非极大抑制（NMS）

5.修正候选区域

6.目标检测评估指标

7.RCNN缺点

四、SPP-Net

1.为什么要输入固定尺寸？

2.算法流程

3.SPP-Net优缺点

五、Fast-RCNN

1.算法流程

2.改进部分

3.模型性能对比

六、Faster-RCNN

1.RCNN三者对比

2.网络结构

3.算法流程

4.区域生成网络（RPN）原理

5.Faster-RCNN的训练

6.Faster-RCNN效果对比

7.Faster-RCNN总结

七、Yolo（You Only Look Once）

1. 网络结构

2.单元格（grid cell）

3.训练过程

4.与Faster-RCNN比较

5.YOLO总结

八、SSD

1.网络结构

2. 算法流程

3. PriorBox 层

4. 训练和测试过程

5. 总结

你可能感兴趣的:(目标检测,计算机视觉,机器学习)