qq_34767784

目标检测简介

文章目录

目标检测简介

1 引言
2 目标检测分类

2.1 传统的目标检测算法
2.2 基于深度学习的目标检测算法
2.2.1 基于two stage的目标检测
2.2.2 基于one stage的目标检测

3 Faster RCNN目标检测算法及其实现

3.1 Faster RCNN算法原理
3.2 实验结果与分析

4 小结

目标检测简介

1 引言

目标检测与跟踪是从复杂的背景中检测出目标，并进行跟踪预测等，为后续的分析处理提供信息。因此，目标检测与跟踪技术是单摄像机多目标跟踪技术的基础，这个模块的性能将会对后续单摄像机多目标跟踪系统的性能产生巨大的影响。

2 目标检测分类

目标检测是指从复杂的图像（视频）背景中定位出目标，并分离背景，对目标进行分类，找到感兴趣的目标，从而更好地完成后续的跟踪、信息处理与响应等任务。目标检测在很多领域都有应用，比如对于脸部、行车、路人等物体的检测，以及一些交叉领域的应用，比如自动驾驶领域交通标志的识别、工程领域里材质表面的缺陷检测，农作物病害检测和医学图像检测等等，所以对目标检测的研究很有实际价值。
目标检测按照是否将深度学习的思想应用于检测又可以分为传统检测方法和基于深度学习的检测方法。本文以最后一种划分标准来介绍主要的目标检测算法，进行对比分析，并结合现在的研究状况，对目标检测方法的研究作出合理展望。

2.1 传统的目标检测算法

由于深度学习诞生之前缺乏有效的特征表达，而且计算资源匮乏，传统的目标检测算法大多数是基于手工特征所构建的精巧的计算方法，其思路流程如下图2.1所示：

而且传统的目标检测算法众多，不宜一一介绍，但是其主体思路方法大致可以分为几类，主要有帧差法、背景减除法和光流法等，其它许多方法都是由它们衍生而来。
（1）帧差法
摄像机采集的视频序列具有很强的帧之间的时空联系，即时间上连续的帧的图像区域，如果是目标会呈现明显的变化，否则变化很微弱。帧差法就是基于上述原理发展而来的，具体来说就是对时间上连续的图像帧，然后进行判断。按照选取帧数的区别，帧差法又分为两帧差分法和三帧差分法。
两帧差分法公式如下：

两帧差分法能够能够粗略地分离目标与背景，但是仅适用于目标静止或运动缓慢的情况，而且还存在空洞现象与重影现象。为此，人们在其基础上进一步改进提出了三帧差分法。三帧差分法由于选取三帧图像两两差分处理取逻辑与，能够更好地适应运动较快的目标场景。
三帧差分法公式如下：

如下图是帧差法的效果图，可以看出，三帧差分法能更好地处理空洞和重影问题。
两帧差分法实现效果图如下：

三帧差分法实现效果图如下：

从上面的论述可以看出，帧间差分法对于光照鲁棒性高，原理简单好实现，但是检测目标不完整，可能存在重影和黑洞现象，所以帧间差分法一般是与其它算法结合使用。

（2）背景减除法
背景减除法的原理是将当前帧与背景图像差分比较来判别目标与背景。其关键在于建立一个可靠的背景模型，本文选取均值模型基础模型。这个模型首先对视频序列连续N帧同一位置处像素点求均值，建立背景模型；将当前帧与背景模型进行差分，然后通过阈值比较判断，进一步处理更新，从而将目标于背景区分开来。该过程涉及以下公式：

背景减除法流程如下图2.6：

背景减除法效果如下图：

综上所述，背景差值法检测目标速度快，不受运动目标速度的限制，易于实现；但是由于实际应用中可靠的背景模型很难建立，所以应用范围有限。

（3）光流法
光流简单来说就是运动物体的瞬时运动速度。光流法就是利用很短时间内视频序列中同一位置处连续几帧图像像素之间的瞬时速度保持不变，同时也可转化为瞬时移动距离不变，从而根据上一帧与当前帧这一距离不变关系作计算，预测物体的运动。
基于光流法的目标检测方法就是对采集的图像信息进行初步处理后，根据光流法公式推算出图像中各点的光流场，然后通过阈值判断将目标与背景分离，接着进一步处理，输出二值图像。

用OpenCV在其示例视频剪取片段实现光流法，得到结果如下图2.8：

图中箭头标示了目标物体运动的方向，由图可以看出，光流法能够大致预测标示出物体运动的轨迹，但准确性还有待提高，而且不适合多目标同时检测。
综上所述，光流法能够很好地适应于运动场景中的运动目标检测。光流法前提条件要求过高，适应性有限。

（4）小结
综上所述，传统目标检测途径主要有帧差法、背景减除法、光流法，三者的比较分析如下表2.1：

总的来说，传统的目标检测算法相对容易实现，提取的特征都是人工选定的很有针对性的直观特征，但不能够很好地进行推广，而深度学习能够很好地弥补这些缺点，所以逐渐占据主导地位。

2.2 基于深度学习的目标检测算法

2012 年，Alex Net取得了ILSVRC竞赛第一名的好成绩，使得深度学习在CV领域大放异彩，之后便有学者尝试应用深度学习来改进传统的目标检测算法。2014年，DeepFace和DeepID的出现，使得深度学习在人脸识别领域大放异彩。2017年，谷歌DeepMind团队推出的AlphaGo与李世石的世纪之战使得深度学习广为人知。近年来，深度学习发展劲头更加猛烈，得到广泛应用。
深度学习相对于传统目标检测算法能够提取更加高层和更好的表达目标的特征，还能将特征的提取、选择和分类集合在一个模型中。
深度学习算法先后出现两种主要类型，即两阶段目标检测算法与单阶段目标检测算法，这依据的是处理流程以及网络架构的设置。其中two stage的目标检测算法分两步进行；而one stage的目标检测算法一步直接对预测的目标物体进行判定识别。下图本文对常见的基于深度学习的目标检测算法进行了分类概括，如下图2.9所示。

2.2.1 基于two stage的目标检测

基于two stage的目标检测分两步进行目标检测：首先生成可能区域（Region Proposal）并且用卷积神经网络（CNN）提取图像特征；然后放入分类器分类并修正位置。
(1) RCNN算法
Ross Girshick[10]在2014年的CPVR顶会中的论文中提出了RCNN算法，这种方法突破了传统的用滑动窗口进行候选窗口选择的模式，采用选择性搜索来选取候选框，并且一直被后续的two stage算法沿用。
实验表明，RCNN效果较之前的算法有了很大提升，但是RCNN算法仍有许多不足之处：候选区域大量重复造成算法速度缓慢；算法耗费的时空资源相当大等。
(2) SPP-NET
2015年微软研究院的何恺明等[11]提出一种SPP-Net算法一次性对整张图片提取特征。
由于CNN的全连接层要求输入图片的大小一致，所以必须对输入的图片进行归一化处理，之前的算法大多采用不同位置的裁剪，但是该算法采用了SPP进行图像维度归一化，提供特定维度的图像数据给CNN，从而消除了归一化所带来的资源消耗问题，提高了算法速度；但是这种图像处理仍旧会导致图像信息的不完整。
(3) Fast RCNN
2015年Ross Girshick等[12]在对RCNN进行改进下提出了Fast RCNN算法。该算法使用RPN来代替选择性搜索来获取候选框，大大提升了算法效率。
该算法大致可以分为如下几个阶段：
i) 在初始图像中确认候选框，输入整张图片到CNN获取图片的特征层；
ii) 通过RPN网络从图片信息获取候选框以及特征图，然后输入ROI池化层进行尺度归一化；
iii) 利用softmax分类器进行多分类目标识别，并用边界框回归对各个类的候选框进行微调。
Fast RCNN算法将线性分类器SVM替换成softmax进行多分类预测，极大地提升了分类的准确性；将边界框回归与区域分类合并成一个多任务模型，实现了卷积网络的权重共享；使用Rol pooling来保持多尺度的输入，能够直接传播梯度，大大节省了空间。但是仍然是用选择性搜索算法来提取特征，会耗费大量时间，所以还存在着诸多不足。
(4) Faster RCNN
2015年何恺明等人[13]提出了Faster RCNN算法，该算法真正实现了two stage的全网络结构。
该算法大致可以分为以下三个步骤：
i) 对图像信息进行预处理操作并输入网络，利用卷积神经网络得到图片的特征图；
ii) 将卷积特征输入到RPN，获取候选框及其特征图；
iii) 用Softmax网络进行分类，用回归网络进行Bbox回归，然后输出实验结果。
Faster RCNN使用的RPN网络使得候选区域、分类、回归一起共享卷及特征很大程度上提高了算法效率。但是，该算法由于处理繁琐，计算复杂，系统开销较大。
(5) R-FCN
为了解决上述问题，2016年的NIPS顶会中，Jifeng Dai等[14]发表了R-FCN算法，该算法使用全卷积网络（Fully Convolutional Network, FCN）来实现计算共享，大大提高了速度。
该算法大致可以分为三个步骤：
i) 将图片输入到预训练网络，得到RPN网络相应的TOI，图片特征层的用于分类的位置敏感得分图；
ii) 使用RPN来生成候选框；
iii) 利用RPN获得的特征与位置敏感得分图进行分类，遴选候选框，然后分类别进行回归微调。
FCN应用于Faster RCNN使得整个网络的计算共享，使得R-FCN检测速度比Fast RCNN提高了2.5-20倍；同时该算法提出了位置敏感得分来平衡平移不变性（translation-invariance）和平移可变性（translation-variance）之间的矛盾。但是该算法只是在一个特征尺度上进行，不能够完整地展现目标的特征。
(6) Mask RCNN
一年后，何恺明[15]团队再一次改进Faster RCNN，提出了Mask RCNN，该算法用ROI对齐代替ROI池化，能够很好地聚集图像特征，而且该算法还增加了一个mask层用来候选框识别。
该算法大致可以分为三个步骤：
i) 将图片进行预处理，然后通过预训练好的ResNet网络处理图片信息来获取图片特征图；
ii)生成候选ROI并输入RPN网络进行分类
iii)对处理过的ROI进行ROI Align操作，并进行分类回归。
Mask RCNN的精髓就是设计出了RoI对齐层，以及添加了一个额外的分支来预测分割层来处理候选框，所以是一个多任务的训练过程，这也提高了目标检测的准确率。但是其检测速度仍然达不到实际应用的实时性要求。
综上所述，基于two stage的目标检测算法大多聚焦于分类问题，用RPN(region proposal network)获取候选框，而且大多使用RCNN进行分类确定目标，采用“图片特征CNN生成分类提取特征+分类器分类并进行回归微调”的思路。该类算法由于复杂的结构与候选框的反复遴选使得算法的速度受到很大限制。

2.2.2 基于one stage的目标检测

由于two stage算法的网络结构特点使得其速度存在瓶颈，于是一些研究人员开始转换思路，直接将目标检测转化到回归上，一步完成特征提取、分类回归，判定识别步骤，因此以YOLO为代表的one stage算法逐渐发展起来。
(1) OverFeat算法
OverFeat[16]是最早将深度学习应用于目标检测的算法之一，并在2013获得了ImageNet定位任务的冠军。
搞懂OverFeat算法首先要明白OverFeat就是类似于传统算法中的特征提取算子，该算法大致可以分为以下三个步骤：
i) 利用滑动窗口选择出不同尺度的候选框，并用CNN进行提取特征图；
ii) 将图像信息输入后续处理网络，以便多尺度滑动窗口对候选框筛选和分类；
iii) 利用回归模型预测每个对象的位置并进行边框合并。
该算法第一次系统阐述了CNN是如何应用于定位与检测的，使用了一个CNN来集成处理分类、定位和预测三个任务，功能强大，另外该算法提出了一个多尺度、滑动窗口的方法，而且是通过累积预测来求标记框，相比于传统算法大大提高了效率，但错误率较高，准确性有待提高。
(2) YOLO（You Only Look Once）算法
为了解决OverFeat等算法面临的困境，2016年Redmon[17]等人提出了YOLO算法。根据其英文全称，可以看出该算法把目标判定和识别结合在一起，即one stage思想，这在很大程度上提升了算法的速度。
YOLO算法大致可以分为三个步骤：
i) 输入预处理好的图片，并将其归一化到固定尺寸；
ii) 将i)处理好的图片输入卷积神经网络运行；
iii) 根据阈值判定，得到目标位置与类别。
这里需要解释一下，输入图片归一化固定尺寸是指将卷积后提取的特征图划分为一个固定为S×S的网格（cell），将检测任务分配到每个独立的网格自主对本网格区域进行分类检测，并输出检测结果及其置信度。
YOLO将判定与检测结合在一起，简化了目标检测流程，使得算法的速度提升很大，但是YOLO还存在对小物体、多目标检测效果不理想；精准度都有待提升等问题。
(3) SSD算法（Single Shot MultiBox Detector）
YOLO发布同年之后一段时间，Wei Liu[18]等提出了SSD算法改进了YOLO检测精度不足的问题。该算法在YOLO的基础上借鉴了Faster RCNN中RPN的思路，兼顾了检测速度和精度。
SSD算法创造性地引入了RPN的思想，使得one stage算法的准确度得到很大提升；而且引入了多尺度（scale）预测的思想，更好地体现了目标的特性；设置了先验框，增加了检验的准确性。
综上所述，two stage的深度学习目标检测主要倾向准确性，one stage的目标检测主要倾向于速度，两者侧重点不同。前者的方法和后者方法两者相互借鉴，不断融合，取得了很好的效果。尽管深度学习的应用极大提升了目标检测算法的效果，但是仍旧存在一些问题：如深度学习需要大量的数据以及强大的计算与硬件资源，无法对小目标做出准确检测等。

3 Faster RCNN目标检测算法及其实现

如前文所述，Faster RCNN目标检测算法是RCNN系列的最为先进的一种算法，正处于深度学习目标检测算法从two stage到one stage转换的临界阶段。

3.1 Faster RCNN算法原理

Faster RCNN使用RPN来代替选择性搜索来获取特征图，并将其与Fast RCNN网络结合到一起，其具体的流程如下图所示：

为了更深层次地理解Faster RCNN算法，下面结合其流程图对其网络结构进行进一步的探究。

如图2.11所示，预处理的图像信息输送给一个卷积神经网络来提取特征图，这个CNN由1个input layer（输入层），13个conv（卷积层），13个激活函数RELU，13个pooling（池化层）组成。然后将提取的特征图一方面送给候选框提取网络，一方面送给ROI池化层。候选框提取网络先是将由特征提取网络获取的特征图进行处理分流，这个功能由33的卷积层与全连接层组成；然后分流的信息流分别经过一个11的卷积层流进候选框获取网络与候选框回归网络；在候选框获取网络中图片信息先是被重塑为固定大小尺寸，然后经过Softmax网络进行分类，然后在被重塑为特定大小尺寸，然后提交候选框。而流入候选框回归网络的图片信息直接作用于候选框，用于校正。然后选出的候选框以及图片信息流以及特征图信息一起输入ROI池化层，对候选框进行非极大值抑制筛选，并将其池化为固定尺度输出。然后图片信息流流入一个RELU激活函数与全连接层混合的网络进行处理，然后分流，分别经过一个全连接层后，一个进行Bbox回归，对输出的图像框进行修正；另一个经过Softmax进行分类，获取检测物体的类别与置信度信息。然后输出结果，即在输出图像中标出图相框，物体类别与置信度信息。

3.2 实验结果与分析

实验采用自己拍的照片作为实验对象，使用最为常用的评价算法精确度与速度的指标。
Faster RCNN检测算法效果如下所示：

由图2.12中可以看出，Faster RCNN检测效果很好，标记框很好地标出物体的范围，而且能够检测出图片中各类物体给出物体标签并给出置信度分数，可以看出，在成功识别物体类别的情况下越是明显的物体置信度分数越高（如图中的大象、熊猫、鸟，露出耳朵以及身体的人），而相对来说露出一部分形体却特征不明显的物体置信度不高（如图中只露出头发的人以及部分身躯的鸟）。

由图2.13可以看出Faster RCNN算法也存在不足，如图中将热气球误判为kite，将兔子和花棉裤误判为cat，将比V的手指误判为tie。
将Faster RCNN系列算法进行性能指标的对比如下表所示：

其中mAP代表均值平均精度，FPS代表在单位时间（1秒）内识别的帧数。其中mAP的计算公式如下：

根据单类别物体在单张图上的精度定义，经测试数据集上所有该类物体精度加权平均即可得到均值平均精度mAP。

Faster RCNN算法较其之前的RCNN系列算法有了很大的提升，但是其缓慢的速度导致其无法应用于实时性实践活动中；在其之后提出的以YOLO为代表的one stage算法明显性能更为优越，特别是速度得到了很大提升。

4 小结

传统的目标检测算法多是人工提取的图像特征，后来深度学习的引入使得卷积网络提取的图像特征更具有代表性，所以目标检测效果获得了巨大提升，但是目标检测仍然面临着诸多困难，如光照变化影响、遮挡、阴影、背景扰动等。同时人们不断追求目标检测算法的精确性、速度与普适性，具体的目标有优良的模板、高效的算法、较好的特征表达等。传统的目标检测算法较为简单、实现起来较为容易，但是精准度不够；深度学习的检测算法难以实现，但是较为准确。由此可以看出目标检测朝着多维度信息融合，基于深度学习的特征表达，多种方法交叉融合的方向前进。
Faster RCNN目标检测算法检测效果很好，标记框很好地标出物体的范围，而且能够检测出图片中各类物体给出物体标签并给出置信度分数，相较于其系列之前的算法在精确度和速度上都有了很大改观。

《Integer缓存池原理及应用》猿究院--王升缓存 java servlet
1.通过代码说明Integer缓存池的存在在Java中，Integer类有一个缓存池机制，用于缓存一定范围内的Integer对象。package包装;publicclassDemo3{publicstaticvoidmain(String[]args){//只要有new就会开辟空间Integeri1=newInteger(127);Integeri2=newInteger(127);System.
spring--事务失效原因你我约定有三数据库 sql java 后端 spring
✅一、事务失效的常见原因及对应场景1.方法不是public的✅原因：SpringAOP默认使用基于代理的方式（JDK或CGLIB），只能拦截public方法。❌错误示例：@TransactionalvoidsaveData(){//非public，事务无效...}✅正确写法：@TransactionalpublicvoidsaveData(){...}2.同类中方法调用，导致自调用（SelfInv
《深入浅出Spring》控制反转（IoC）与依赖注入（DI）
举例说明引出spring有2个类，A和B，如下：publicclassA{publicvoidsayHello(){}}publicclassB{publicvoidsayHello();}上面2个类都有同样的sayHello方法。现在我们调用B的sayHello方法完成一些事情，而B中的sayHello方法需要调用A中的sayHello方法才可以完成这个事情，所以B的代码变成了下面这样：publ
初识opencv
文章目录1.什么opencv，它的优势点2.opencv安装和环境配置3.了解数字图像的基本概念：像素、彩色图像、灰度图像、二值图像、图像算数操作4.练习numpy中array的基本操作5.练习图像的加载、保存、以及算术操作参考文献1.什么opencv，它的优势点OpenCV是Intel®开源计算机视觉库。它由一系列C函数和少量C++类构成，实现了图像处理和计算机视觉方面的很多通用算法。OpenC
牛客 - 倒置字符串(java)
题目解题思路解题代码题链接题目解题思路解题代码importjava.util.*;publicclassMain{//定义翻转字符数组的方法publicstaticvoidreverse(char[]arr,intstart,intend){while(start
牛客-游游的水果大礼包小张0.0 OJ算法题题目心得动态规划算法
1.题目描述2.题目链接游游的水果大礼包_牛客题霸_牛客网3.代码解答publicclassMain{publicstaticvoidmain(String[]args){Scannerin=newScanner(System.in);longn=in.nextInt();longm=in.nextInt();longa=in.nextInt();longb=in.nextInt();longre
牛客-倒置字符串小张0.0 OJ算法题题目心得算法 leetcode 动态规划
1.题目描述2.题目链接倒置字符串_牛客题霸_牛客网3.代码解答importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscanner=newScanner(System.in);Strings=scanner.nextLine();//按空格分割单词（处理多个连续空格的情况，split("
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
植物病害识别：YOLO甘蔗叶片病害识别分类数据集
YOLO甘蔗叶片病害识别数据集,包含尾孢菌叶斑病，眼斑病，健康，红腐病，锈病，黄叶病6个常见病类别，3300多张图像，yolo标注完整，全部原始图像，应用数据增强。适用于CV项目，毕设，科研，实验等需要此数据集或其他任何数据集请私信
48Days-Day03 | 删除公共字符，两个链表的第一个公共结点，mari和shiny TinaAmber 笔试训练48Days 链表 java 算法
删除公共字符删除公共字符_牛客题霸_牛客网算法思路直接哈希，把第二个字符塞集合里面，遍历第一个，只要在集合里面有的就跳过代码importjava.util.HashSet;importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscan=newScanner(System.in);Strin
execve 继承了什么？映射、信号、文件描述符、优先级、ptrace Kira Skyler linux linux
文章目录简介execve一次简单的跟踪入口ftrace流程bprm加载elfload\_elf\_binarybegin\_new\_exec最后总结简介execvesyscall做了什么重要参考Linux进程启动execve系统调用内核源码解析execve一次简单的跟踪入口SYSCALL_DEFINE3(execve,constchar__user*,filename,constchar__us
注释Wordle游戏小飞LOVE霞游戏 java 深度优先
packagecsdn005;importjavax.swing.*;importjava.awt.*;importjava.util.Locale;/***@authorwangfei*/publicclassWorldleGameextendsJFrame{privateintcount=0;publicstaticvoidmain(String[]args){newWorldleGame()
WD5032是一款集成多个USB专用充电协议的高效、单片同步降压DC/DC转换器，32V，3.1A车充芯片，支持快速充电协议 F13729801557 DC-DC降压单片机嵌入式硬件 51单片机 stm32
WD5032是一款性能出色的电源管理芯片，以下是根据你提供的信息整理的详细介绍：基本特性：宽输入电压范围：能在8.5V至32V的输入电压范围内稳定工作。大电流输出：可提供高达3.1A的连续负载电流，满足多种设备的供电需求。高效率转换：转换效率高达93%，可有效减少能量损耗，提高电源利用率。控制模式：支持CC/CV（恒流/恒压）模式控制，确保充电过程的稳定性和安全性。占空比：具备100%最大占空比，
c++读取文件中图像信息并用opencv展示送分童子笑嘻嘻
#include#include#include#include#include#include#include//usingnamespacestd;usingnamespacecv;//字符串分割函数,std::vectorsplit(std::stringstr,std::stringpattern){std::string::size_typepos;std::vectorresult;s
编译源代码形式的CVE为二进制.o文件需要先使用GPT补全 Che_Che_ 网络二进制代码相似度
#include#include#include#defineVLC_EGENERIC-1#defineVLC_SUCCESS0#defineMMS_BUFFER_SIZE1024//定义access_sys结构体typedefstruct{charbuffer_tcp[MMS_BUFFER_SIZE];//存储TCP数据的缓冲区inti_buffer_tcp;//缓冲区大小inti_comman
喷丝板检测软件上位机开发深圳市由你创科技上位机开发 c#qt
一、核心功能模块1、硬件控制运动控制：通过Modbus/RS485/EtherCAT控制高精度电移台（需±1μm精度），实现喷丝板XY轴扫描定位。光源控制：调节环形LED/同轴光源亮度（支持PWM或0-10V模拟信号），优化成像对比度。相机控制：支持GigE/USB3Vision相机（建议500万像素以上），触发采集、参数调节（曝光/增益）。2、机器视觉检测孔洞识别：使用OpenCV的HoughC
pytorch图像分类全流程（二）前人栽树,后人乘凉 datawhale pytorch pytorch 分类 python
本次使用的是ImageNet1000类别信息，resnet18预训练模型。记录一些一坑和知识点。在传入图片或视频之前我们都会对其进行预处理，归纳下来为四个字母RCTN：缩放、裁剪、转Tensor、归一化，可以使用transforms.Compose()函数打包对应四个函数进行预处理，当然这里有个小坑，transforms.Compose()只接受pillow格式的图像，不能拿opencv传入图片。
【CVPR 2025】低光增强RT-X Net（红外辅助结构引导）--part2代码讲解 BOB_BOB_BOB_ 低光增强LLIE transformer 深度学习人工智能神经网络计算机视觉
【CVPR2025】本文参考论文RT-XNET:RGB-THERMALCROSSATTENTIONNETWORKFORLOW-LIGHTIMAGEENHANCEMENTTransformerDesign下面对方法论部分进行详细分析论文提出网络类似Retinexformer/SG-LLIE，感兴趣的可以在我的主页进一步学习论文地址：arxiv代码地址：github文章目录**代码段1:导入与辅助函数
如何使用 OpenCV 打开指定摄像头
在计算机视觉应用中，经常需要从特定的摄像头设备获取视频流。例如，在多摄像头环境中，当使用OpenCV的cv::VideoCapture类打开摄像头时，如果不指定摄像头的ID，可能会随机打开系统中的某个摄像头，或者按照设备连接的顺序打开第一个可用的摄像头。比如： //打开两个摄像头 cv::VideoCapture cap0(0); if (!cap0.isOpened()){ c
JavaWeb 文件上传和下载 dawsonenjoy
一、文件上传步骤前端部分1.提供一个post方法的表单，并设置enctype属性（设置请求内容的MIME类型）为multpart/from-data，代表该表单支持文件上传2.提供一个文件上传框：举例：后端部分将内容通过流读取进来，举例：publicvoiddoGet(HttpServletRequestrequest,HttpServletResponseresponse)throwsServl
设计模式入门：抽象工厂模式 happyJared
UML类图抽象工厂模式代码示例定义苹果类接口，包含一个描述方法/***苹果抽象类*/publicinterfaceIApple{/***具体描述*/voiddescribe();}红苹果，实现了接口苹果和定义的方法/***红苹果*/publicclassRedAppleimplementsIApple{@Overridepublicvoiddescribe(){System.out.println
Java数据结构之用双向链表实现栈的入栈和出栈操作
packageLinkList;//使用双链表定义栈的基本操作publicclassStackByDoubleLinkextendsDoubleLinkList{//栈继承自双链表//DoubleNodehead=null;//双链表压栈操作---向双链表插入一个元素publicvoidpush(inta){HeadInsertLinkList(a);//返回压栈后的链表}//双链表出栈操作---
Spring Cloud Gateway远程代码执行CVE-2022-22947漏洞分析及复现长白山攻防实验室
0x01漏洞描述SpringCloudGateway是基于SpringFramework和SpringBoot构建的API网关，它旨在为微服务架构提供一种简单、有效、统一的API路由管理方式。据公布的漏洞描述称，当SpringCloudGateway执行器端点启用、公开且不安全时，使用SpringCloudGateway的应用程序容易受到代码注入攻击。远程攻击者可以发出含有恶意代码的请求，从而允许
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
java学习 leetcode31 下一个排列冬夜戏雪 java 学习 leetcode
1.排列方法（按照全排列，数组，整数来回转换的思路）packagecom.hmdp.leetcode;importjava.util.*;publicclassbacktracking31{publicvoidnextPermutation(int[]nums){//1.将当前数组转为字符串表示StringBuildersb=newStringBuilder();for(intnum:nums){
WPF PRISM 绑定事件及拖拽研究 zhs1931 C#WPF
publicRelayCommandWindowSizeChangedCommand{get{if(WindowSizeChangedCommand==null)WindowSizeChangedCommand=newRelayCommand(param=>WidowSizeChanged(param));returnWindowSizeChangedCommand;}}publicvoidWin
最简单控制台版输入框学生信息处理平台
功能实现支持添加、删除、修改、查询、排序功能。使用并行数组nos,names,scores，学生信息统一下标。使用Scanner交互输入。使用冒泡排序实现成绩排序。packagecom.xiangmu.day04;importjava.util.Scanner;publicclassTest01{publicstaticvoidmain(String[]args){Scannersc=newSca
THCV241A和THCV242A实现MIPI CSI-2摄像头串行接口专门设计用于聚合高速图像数据方案THCV241 Shang13113048791 单片机图像处理信息与通信
THCV241A的主要用途是实现MIPICSI-2摄像头串行接口的高速图像数据聚合。‌THCV241A和THCV242A芯片组专门设计用于聚合高速图像数据，‌包括高速图像数据通道和低速双向控制通道。‌这些芯片支持通过单根双绞线或同轴电缆传输的带嵌入式时钟的1080p60未压缩图像信号，‌适用于高速数据传输应用。‌此外，‌双向控制链路支持与I2C/GPIO接口进行通信，‌进一步扩展了其应用范围。‌T
【技术工具】python人员照片简介批量对照（千人级） Allen_Lyb 医疗高效编程研发 python 开发语言自然语言处理健康医疗语言模型
要实现根据照片上的工号批量添加人员姓名和工号到照片上，可以按照以下步骤操作（使用Python+PIL/Pillow+OpenCV+pytesseract）：解决方案步骤准备数据创建人员信息表（CSV格式）：姓名,工号确保所有照片文件名包含工号（如工号.jpg），或照片中有清晰可见的工号文本安装依赖库pipinstallpillowopencv-pythonpandaspytesseract#额外安
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

目标检测简介

文章目录

目标检测简介

1 引言

2 目标检测分类

2.1 传统的目标检测算法

2.2 基于深度学习的目标检测算法

2.2.1 基于two stage的目标检测

2.2.2 基于one stage的目标检测

3 Faster RCNN目标检测算法及其实现

3.1 Faster RCNN算法原理

3.2 实验结果与分析

4 小结

你可能感兴趣的:(CV)