Computer Vision Tasks

Computer Vision Tasks:

图像分类、目标检测、语义分割、实例分割;

只有目标检测和实例分割是实现了实例级别的识别的,就是把每一个单独的物体拎出来识别的;目标检测是画框框,而实例分割是抠图。

Computer Vision Tasks_第1张图片

 实例识别:就是把图片中的每一个物体都单独进行识别出来;

目标检测:是输入图像,输出每一个物体;(就是多个类别的多个框)

Computer Vision Tasks_第2张图片

图像分割:

(1)Semantic Segmentation语义分割:我对每一个像素分类,我不管这个像素是属于哪几个物体的,只管他是属于什么类别的;(并不区分不同物体的像素)(把同一个目标的物体扣到一起,并不区分每一个物体,而实例分割需要区分每一个物体)

(2)Instance Segmentation实例分割:把同一个类别的不同实例给他区分出来;(需要区分同一类别不同物体的像素)

在无人驾驶中还有全景分割:要把它看到的所有像素都做实例分割;

 下面几张图比较有说服力:Computer Vision Tasks_第3张图片

 Computer Vision Tasks_第4张图片

 计算机视觉还有其他的解决问题:

除了图像检测、定位、目标检测、语义分割、实例分割之外还有关键点检测;

Computer Vision Tasks_第5张图片

综述:里边把目标检测里边的代表性的模型、发展过程,还有著名的一些数据集都写出来了;都

 

 目标检测分为两个流派:

(1)单阶段模型:不提取候选框,我直接把全图喂到模型里边,喂到算法里边,算法能够直接输出出来目标检测的结果,一步到位他是一个统一的端到端的系统,所以是单阶段;

(2)两阶段模型:先从图像中提取若干候选框,再逐一的对这些候选框进行分类、甄别以及调整他们的坐标,最后得出结果,(就是先提取候选框,再逐一的进行甄别,这是两个阶段,所以称作两阶段模型)

两阶段一般是比较准确的,因为他要筛选出很多个候选框,比较准确但是比较耗时;而单阶段呢虽然比较快一步到位,但是准确率不是很高;但是现在YOLO发展到V5在速度和准确度(小目标识别)都已经很好了;

Computer Vision Tasks_第6张图片

 

你可能感兴趣的:(Deep,learning,html5,java,html)