小哥谈

第1篇目标检测概述 —（1）目标检测基础知识

前言：Hello大家好，我是小哥谈。目标检测是计算机视觉领域中的一项任务，旨在自动识别和定位图像或视频中的特定目标，目标可以是人、车辆、动物、物体等。目标检测的目标是从输入图像中确定目标的位置，并使用边界框将其标记出来。为了让大家能够牢固地掌握目标检测基础知识，本系列文章就对目标检测进行详细介绍，希望大家学习之后能够有所收获！

1.简介

1.1 什么是目标检测？

1.2 目标检测算法难点

1.3 目标检测主流目标检测技术

1.4 目标检测算法未来趋势

1.5 目标检测算法应用

2.目标检测发展历程与现状

2.1 目标检测算法发展历程

2.2 目标检测算法分类

3.目标检测原理

3.1 候选区域产生

3.2 数据表示

3.3 效果评估

3.4 非极大值抑制

4.目标检测常用的数据集

4.1 PASCAL VOC

4.2 MS COCO

4.3 Google Open Image

4.4 ImageNet

4.5 DOTA

5.目标检测常用标注工具

5.1 LabelImg

5.2 labelme

5.3 Labelbox

5.4 RectLabel

5.5 CVAT

5.6 VIA

5.7 其他标注工具

6.目标检测常用术语表

1.简介

1.1 什么是目标检测？

目标检测是计算机视觉领域中的一个任务，其目的是在图像或视频中确定和定位感兴趣的物体。目标检测模型不仅可以识别物体的类别，还能够提供每个物体的边界框位置。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测⼀直是计算机视觉领域最具有挑战性的问题。目标检测通常涉及两个主要步骤：分类（判断物体类别）和定位（确定边界框位置）。

目标检测的位置信息一般由两种格式（以图片左上角为原点(0,0)）：

（1）极坐标表示：(xmin, ymin, xmax, ymax)

xmin，ymin：x,y坐标的最小值
xmin，ymin：x,y坐标的最大值

（2）中心点坐标：(x_center, y_center, w, h)

x_center，y_center：目标检测框的中心点坐标
w，h：目标检测框的宽、高

在深度学习领域，目标检测通常使用卷积神经网络（CNN）模型来实现。常见的目标检测方法包括：

R-CNN系列：包括R-CNN、Fast R-CNN、Faster R-CNN等，这些方法使用候选区域提取技术（如选择性搜索）来生成感兴趣区域，然后通过分类器和回归器对这些区域进行分类和定位。

YOLO系列：包括YOLO、YOLOv2、YOLOv3等，这些方法将目标检测问题转化为一个回归问题，并将物体位置和类别同时预测出来，具有较快的速度和较高的精度。

SSD（Single Shot MultiBox Detector）：SSD将目标检测问题转化为一个多尺度检测问题，通过在不同层次上预测不同尺度的边界框和类别信息来实现目标检测。

等等......

计算机视觉中关于图像识别有四大类任务：

分类-Classification：解决“是什么？”的问题，即给定⼀张图⽚或⼀段视频判断里面包含什么类别的目标。

定位-Location：解决“在哪里？”的问题，即定位出这个目标的的位置。

检测-Detection：解决“是什么？在哪里？”的问题，即定位出这个⽬标的的位置并且知道目标物是什么。

分割-Segmentation：分为实例的分割（Instance-level）和场景分割（Scene-level），解决“每⼀个像素属于哪个目标物或场景”的问题。

除了图像分类之外，目标检测要解决的核心问题是：

目标可能出现在图像的任何位置。
目标有各种不同的大小。
目标可能有各种不同的形状。

1.2 目标检测算法难点

目标检测算法的主要难点和挑战：

待检测目标尺寸很小，导致占比小，检测难度大。
待检测目标尺度变化大，网络难以提取出高效特征。
待检测目标所在背景复杂，噪音干扰严重，检测难度大。
待检测目标与背景颜色对比度低，网络难以提取出具有判别性的特征。
各待检测目标之间数量极度不均衡，导致样本不均衡。
检测算法的速度与精度难以取得良好平衡。

等等......

1.3 目标检测主流目标检测技术

目前国内主流的目标检测技术：

YOLOX：由中国的旷视科技研发，是目前国际上运行速度最快的一种深度学习模型。
YOLOV1-V5：Yolov1-yolov3由Joseph Redmon研发，yolov4-yolov5则是由yolo团队内部成员完成的。
Transformer：原来是做为语音识别的一个模型，现在用在图像的目标识别上面也有不俗的表现。
ViT：当考虑预训练模型的计算成本时，ViT的性能非常好，以较低的预训练成本在大多数识别基准上达到了最先进的水平。

等等......

1.4 目标检测算法未来趋势

随着技术的发展和成熟应用，目标检测算法未来的发展趋势主要有：

轻量型目标检测
与AutoML结合的目标检测
领域自适应的目标检测
弱监督目标检测
小目标检测
视频检测
信息融合目标检测

等等......

1.5 目标检测算法应用

目标检测具有巨大的实⽤价值和应⽤前景。

（1）人脸检测

智能门控
员工考勤签到
智慧超市
人脸支付
车站、机场实名认证
公共安全：逃犯抓捕、走失人员检测

（2）行人检测

智能辅助驾驶
智能监控
暴恐检测（根据面相识别暴恐倾向）
移动侦测、区域入侵检测、安全帽/安全带检测

（3）车辆检测

自动驾驶
违章查询、关键通道检测
广告检测（检测广告中的车辆类型，弹出链接）

（4）遥感检测

大地遥感，如土地使用、公路、水渠、河流监控
农作物监控
军事检测

2.目标检测发展历程与现状

2.1 目标检测算法发展历程

过去的 20 年，目标检测的发展历程大致经历了两个历史时期：传统的目标检测时期（2014 年以前）和基于深度学习的检测时期（2014 年以后）。

传统的目标检测算法可以概括为以下几个步骤：

首先，采取滑动窗口的方式遍历整张图像，产生一定数量的候选框；

其次，提取候选框的特征；

最后，利用支持向量机（SVM）等分类方法对提取到的特征进行分类，进而得到结果。

由于当时缺乏有效的图像表示，人们只能设计复杂的特征表示，并通过各种加速技能来充分利用有限的计算资源。该时期主要的检测方法有：

Viola Jones检测器： Viola Jones检测器由三个核心步骤组成，即Haar特征和积分图、Adaboost分类器以及级联分类器。
HOG检测器：HOG检测器利用了方向梯度直方图（HOG特征描述子，通过计算和统计局部区域的梯度方向直方图来构建特征）。HOG特征与SVM分类器算法的结合，在行人检测任务中应用广泛且效果显著。然而，HOG检测器的缺点是始终需要保持检测窗口的大小不变，如果待检测目标的大小不一，那么HOG检测器需要多次缩放输入图像。
基于部件的可变形模型（DPM）：DPM所遵循的思想是“分而治之”，训练过程中学习的是如何将目标物体进行正确地分解，而推理时则是将不同的部件组合到一起。比如说，检测“汽车”问题可以分解为检测“车窗”、“车身”和“车轮”等。

早期的目标检测任务提取特征时，主要的方式是人工提取，具有一定的局限性，手工特征的性能也趋于饱和。2012 年起，卷积神经网络的广泛应用使得目标检测也开启了新的征程。2014年R-CNN算法横空出世，目标检测开始以前所未有的速度快速发展。深度学习时代，目标检测算法根据检测思想的不同通常可以分为两大类别：两阶段（two-stage）检测和一阶段（one-stage）检测。

两阶段检测算法基于提议的候选框，是一个“由粗到细”的过程。首先产生区域候选框，其次提取每个候选框的特征，最后产生位置框并预测对应的类别，特点是精度高但速度慢。最早期的R-CNN算法利用“选择性搜索”方法产生候选框、卷积神经网络提取特征、支持向量机分类器进行分类和预测。虽然R-CNN算法具有一定的开创性，但生成的候选框大量重叠，存在计算冗余的问题。

2014年提出的SPPNet算法利用空间金字塔池化层对不同尺度的特征图进行池化并生成固定长度的特征表示，减少反复缩放图像对检测结果造成的影响。然而，SPPNet的缺点是：模型的训练仍然是分多步的；SPPNet很难对SPP层之前的网络进行参数微调，导致效率降低。2015 年提出的Fast R-CNN算法，对R-CNN与SPPNet算法做出进一步改进，提出感兴趣区域池化层（ROI），使得检测的速度和精度大大提升。随后又出现的Faster R-CNN算法，实现了端到端地训练，用RPN网络代替选择性搜索，大大减少了训练和测试的时间。

一阶段检测算法基于边界框的回归，是一个“一步到位”的过程。一阶段检测网络在产生候选框的同时进行分类和边界框回归，特点是速度快但精度稍逊。2016年YOLO算法提出，该算法将图像分割成 S×S 个网格，基于每个网格对应的包围框直接预测类别概率和回归位置信息。随后有出现了SSD 算法，该算法借鉴YOLO算法的思想，并利用多尺度特征图进行预测。

2.2 目标检测算法分类

基于深度学习的⽬标检测算法主要分为两类：

（1）Two stage目标检测算法

先进行区域生成（region proposal，RP）（⼀个有可能包含待检物体的预选框），再通过卷积神经网络进行样本分类。

任务：特征提取—>生成RP—>分类/定位回归。

常见的two stage目标检测算法有：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。✅

（2）One stage目标检测算法

不用RP，直接在网络中提取特征来预测物体分类和位置。

任务：特征提取—>分类/定位回归。

常见的one stage目标检测算法有：OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等。✅

两阶段算法和一阶段算法对比：

算法类别	机制	优势	局限性	适用场景
两阶段算法	先生成候选区，再对候选区进行分类和回归。	算法精确度高	实时性差，检测小目标效果差。	高精度目标检测
一阶段算法	不生成候选区直接进行分类和回归	实时性高	成群目标和小目标检测精度低	实时目标检测

3.目标检测原理

目标检测主要分为两大系列——RCNN系列和YOLO系列，RCNN系列是基于区域检测的代表性算法，YOLO是基于区域提取的代表性算法。

3.1 候选区域产生

很多目标检测技术都会涉及候选框（bounding boxes）的生成，物体候选框获取当前主要使用图像分割与区域生长技术。区域生长(合并)主要由于检测图像中存在的物体具有局部区域相似性(颜色、纹理等)。目标识别与图像分割技术的发展进一步推动有效提取图像中信息。

（1）滑动窗口

通过滑窗法流程图可以很清晰理解其主要思路：首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分类器是事先训练好的)。如果当前窗口得到较高的分类概率，则认为检测到了物体。对每个不同窗口大小的滑窗都进行检测后，会得到不同窗口检测到的物体标记，这些窗口大小会存在重复较高的部分，最后采用非极大值抑制(Non-Maximum Suppression, NMS)的方法进行筛选。最终，经过NMS筛选后获得检测到的物体。

滑窗法简单易于理解，但是不同窗口大小进行图像全局搜索导致效率低下，而且设计窗口大小时候还需要考虑物体的长宽比。所以，对于实时性要求较高的分类器，不推荐使用滑窗法。

说明：♨️♨️♨️

滑动窗口法中，事先规定一个固定大小的窗口，使用这个窗口在原图中滑动，滑动到每个位置，那么窗口与图像重合的部分就是一个候选区域，候选区域用来后续的检测任务（滑动窗口法类似于卷积神经网络中的卷积过程）。如果图片尺寸很大，会导致一张图片就能产生数量极多的候选区域。滑动窗口的尺寸设置需要与物体的尺寸相匹配才能带来好的效果，因此对于检测任务来说，滑动窗口法效率很低并且性能不优。

（2）选择性搜索

滑窗法类似穷举进行图像子区域搜索，但是一般情况下图像中大部分子区域是没有物体的。学者们自然而然想到只对图像中最有可能包含物体的区域进行搜索以此来提高计算效率。选择搜索（selective search，简称SS）方法是当下最为熟知的图像bounding boxes提取算法，由Koen E.A于2011年提出。

选择搜索算法的主要思想：图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。因此，选择搜索基于上面这一想法采用子区域合并的方法进行提取bounding boxes。

首先，对输入图像进行分割算法产生许多小的子区域。

其次，根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并，不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形)，这些子区域外切矩形就是通常所说的候选框。

选择性搜索流程：

step0：生成区域集R
step1：计算区域集R里每个相邻区域的相似度S={s1, s2,…}
step2：找出相似度最高的两个区域，将其合并为新集，添加进R
step3：从S中移除所有与step2中有关的子集
step4：计算新集与所有子集的相似度
step5：跳至step2，直至S为空

选择性搜索优点：

计算效率优于滑窗法；
由于采用子区域合并策略，所以可以包含各种大小的疑似物体框。
合并区域相似的指标多样性，提高了检测物体的概率。

3.2 数据表示

经过标记后的样本数据如下所示：

预测输出可以表示为：

其中， $p_{c}$ 为预测结果的置信概率， $b_{x}$ ， $b_{y}$ ， $b_{w}$ ， $b_{h}$ 为边框坐标， $C_{1}$ ， $C_{2}$ ， $C_{3}$ 为属于某个类别的概率。通过预测结果、实际结果，构建损失函数。

3.3 效果评估

使用IoU（Intersection over Union，交并比）来判断模型的好坏。所谓交并比，是指预测边框、实际边框交集和并集的比率，一般约定0.5为一个可以接收的值。

3.4 非极大值抑制

预测结果中，可能多个预测结果间存在重叠部分，需要保留交并比最大的、去掉非最大的预测结果，这就是非极大值抑制（Non-Maximum Suppression，简写作NMS）。

如下图所示，对同一个物体预测结果包含三个概率0.8/0.9/0.95，经过非极大值抑制后，仅保留概率最大的预测结果。

说明：♨️♨️♨️

置信度：置信度是介于0-1（或100%）之间的数字，它描述模型认为此预测边界框包含某类别目标的概率。

IoU（Intersection over Union，IoU）：即两个边界框相交面积与相并面积的比值，边界框的准确度可以用IoU进行表示；一般约定，在检测中，IOU>0.5，则认为检测正确，一般阈值设为0.5。

总结就是置信度和IoU一起用来计算精确率。

4.目标检测常用的数据集

4.1 PASCAL VOC

VOC数据集是⽬标检测经常⽤的⼀个数据集，⾃2005年起每年举办⼀次⽐赛，最开始只有4类，到2007年扩充为20个类，共有两个常⽤的版本：2007和2012。

学术界常⽤5k的train/val 2007和16k的train/val 2012作为训练集，test 2007作为测试集，⽤10k的train/val 2007+test 2007和16k的train/val 2012作为训练集，test2012作为测试集，分别汇报结果。

4.2 MS COCO

COCO数据集是微软团队发布的⼀个可以⽤来图像recognition+segmentation+captioning 数据集，该数据集收集了⼤量包含常见物体的⽇常场景图⽚，并提供像素级的实例标注以更精确地评估检测和分割算法的效果，致⼒于推动场景理解的研究进展。依托这⼀数据集，每年举办⼀次⽐赛，现已涵盖检测、分割、关键点识别、注释等机器视觉的中⼼任务，是继ImageNet Chanllenge以来最有影响⼒的学术竞赛之⼀。相⽐ImageNet，COCO更加偏好⽬标与其场景共同出现的图⽚，即non-iconic images。这样的图⽚能够反映视觉上的语义，更符合图像理解的任务要求，⽽相对的iconic images则更适合浅语义的图像分类等任务。

COCO的检测任务共含有80个类，在2014年发布的数据规模分train/val/test分别为80k/40k/40k，学术界较为通⽤的划分是使⽤train和35k的val⼦集作为训练集（trainval35k），使⽤剩余的val作为测试集（minival），同时向官⽅的evaluation server提交结果（test-dev）。除此之外，COCO官⽅也保留⼀部分test数据作为⽐赛的评测集。

4.3 Google Open Image

Open Image是⾕歌团队发布的数据集。最新发布的Open Images V4包含190万图像、600个种类，1540万个 bounding-box标注，是当前最⼤的带物体位置标注信息的数据集。这些边界框⼤部分都是由专业注释⼈员⼿动绘制的，确保了它们的准确性和⼀致性。另外，这些图像是⾮常多样化的，并且通常包含有多个对象的复杂场景（平均每个图像 8 个）。

4.4 ImageNet

ImageNet是⼀个计算机视觉系统识别项⽬，是⽬前世界上图像识别最⼤的数据库。ImageNet是美国斯坦福的计算机科学家，模拟⼈类的识别系统建⽴的。能够从图⽚识别物体。Imagenet数据集⽂档详细，有专门的团队维护，使⽤⾮常⽅便，在计算机视觉领域研究论⽂中应⽤⾮常⼴，⼏乎成为了⽬前深度学习图像领域算法性能检验的“标准”数据集。Imagenet数据集有1400多万幅图⽚，涵盖2万多个类别；其中有超过百万的图⽚有明确的类别标注和图像中物体位置的标注。

4.5 DOTA

DOTA是遥感航空图像检测的常⽤数据集，包含2806张航空图像，尺⼨⼤约为4kx4k，包含15个类别共计188282个实例，其中14个主类，small vehicle 和 large vehicle都是vehicle的⼦类。其标注⽅式为四点确定的任意形状和⽅向的四边形。航空图像区别于传统数据集，有其⾃⼰的特点，如：尺度变化性更⼤；密集的⼩物体检测；检测⽬标的不确定性。数据划分为1/6验证集，1/3测试集，1/2训练集。⽬前发布了训练集和验证集，图像尺⼨从800x800到4000x4000不等。

5.目标检测常用标注工具

5.1 LabelImg

LabelImg 是⼀款开源的图像标注⼯具，标签可⽤于分类和⽬标检测，它是⽤ Python 编写的，并使⽤Qt作为其图形界⾯，简单好⽤。注释以 PASCAL VOC 格式保存为 XML ⽂件，这是 ImageNet 使⽤的格式。此外，它还⽀持 COCO 数据集格式。

5.2 labelme

labelme 是⼀款开源的图像/视频标注⼯具，标签可⽤于⽬标检测、分割和分类。灵感是来⾃于 MIT 开源的⼀款标注⼯具 LabelMe。

labelme 具有的特点是：

⽀持图像的标注的组件有：矩形框，多边形，圆，线，点（rectangle, polygons, circle, lines, points）
⽀持视频标注
GUI ⾃定义
⽀持导出 VOC 格式⽤于 semantic/instance segmentation
⽀出导出 COCO 格式⽤于 instance segmentation

5.3 Labelbox

Labelbox 是⼀家为机器学习应⽤程序创建、管理和维护数据集的服务提供商，其中包含⼀款部分免费的数据标签⼯具，包含图像分类和分割，⽂本，⾳频和视频注释的接⼝，其中图像视频标注具有的功能如下：

可⽤于标注的组件有：矩形框，多边形，线，点，画笔，超像素等（bounding box, polygons, lines, points，brush, subpixels）
标签可⽤于分类，分割，⽬标检测等
以 JSON / CSV / WKT / COCO / Pascal VOC 等格式导出数据
⽀持 Tiled Imagery (Maps)
⽀持视频标注（快要更新）

5.4 RectLabel

RectLabel 是⼀款在线免费图像标注⼯具，标签可⽤于⽬标检测、分割和分类。具有的功能或特点：

可⽤的组件：矩形框，多边形，三次贝塞尔曲线，直线和点，画笔，超像素
可只标记整张图像⽽不绘制
可使⽤画笔和超像素
导出为YOLO，KITTI，COCO JSON和CSV格式
以PASCAL VOC XML格式读写
使⽤Core ML模型⾃动标记图像
将视频转换为图像帧

5.5 CVAT

CVAT 是⼀款开源的基于⽹络的交互式视频/图像标注⼯具，是对加州视频标注⼯具（Video Annotation Tool）项⽬的重新设计和实现。OpenCV团队正在使⽤该⼯具来标注不同属性的数百万个对象，许多 UI 和 UX 的决策都基于专业数据标注团队的反馈。具有的功能

关键帧之间的边界框插值
⾃动标注（使⽤TensorFlow OD API 和 Intel OpenVINO IR格式的深度学习模型）

5.6 VIA

VGG Image Annotator（VIA）是⼀款简单独⽴的⼿动注释软件，适⽤于图像、⾳频和视频。 VIA 在 Web 浏览器中运⾏，不需要任何安装或设置。页⾯可在⼤多数现代Web浏览器中作为离线应⽤程序运⾏。

⽀持标注的区域组件有：矩形，圆形，椭圆形，多边形，点和折线

5.7 其他标注工具

liblabel：⼀个⽤ MATLAB 写的轻量级语义/⽰例(semantic/instance) 标注⼯具。

ImageTagger：⼀个开源的图像标注平台。

Anno-Mage：⼀个利⽤深度学习模型半⾃动图像标注⼯具，预训练模型是基于MS COCO数据集，⽤ RetinaNet 训练的。

当然还有⼀些数据标注公司，可能包含更多标注功能，例如对三维⽬标检测的标注（3D Bounding box Labelling），激光雷达点云的标注（LIDAR 3D Point Cloud Labeling）等。

6.目标检测常用术语表

英文全写	英文简写	中文名称
one stage	—	一阶段检测
two stage	—	两阶段检测
region proposal	RP	候选区域（一个有可能包含待检物体的预选框）
bounding boxes	bb	候选框
Non-Maximum Suppression	NMS	非极大值抑制
selective search	SS	选择搜索
Regions with CNN features	R-CNN	—
You Only Look Once	YOLO	—
region of interest	RoI	感兴趣区域（候选区域）
frame per second	fps	帧/每秒
High Resolution Classifier	—	高分辨率分类器
Batch Normalization	BN	批量正则化
Mean Average Precision	mAP	平均精度均值
Intersection over Union	IoU	交并比（“预测的边框” 和 “真实的边框” 的交集和并集的比值）
Fine-Grained Features	—	细粒度特征
Feature Pyramid Network	FPN	特征金字塔网络

你可能感兴趣的:(目标检测：从入门到精通,目标检测,人工智能,计算机视觉,深度学习,python)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

第1篇 目标检测概述 —（1）目标检测基础知识

1.简介

1.1 什么是目标检测？

1.2 目标检测算法难点

1.3 目标检测主流目标检测技术

1.4 目标检测算法未来趋势

1.5 目标检测算法应用

2.目标检测发展历程与现状

2.1 目标检测算法发展历程

2.2 目标检测算法分类

3.目标检测原理

3.1 候选区域产生

3.2 数据表示

3.3 效果评估

3.4 非极大值抑制

4.目标检测常用的数据集

4.1 PASCAL VOC

4.2 MS COCO

4.3 Google Open Image

4.4 ImageNet

4.5 DOTA

5.目标检测常用标注工具

5.1 LabelImg

5.2 labelme

5.3 Labelbox

5.4 RectLabel

5.5 CVAT

5.6 VIA

5.7 其他标注工具

6.目标检测常用术语表

你可能感兴趣的:(目标检测：从入门到精通,目标检测,人工智能,计算机视觉,深度学习,python)

第1篇目标检测概述 —（1）目标检测基础知识