目标检测和跟踪面试复习

面试官可能会问到的相关目标检测的问题:

1.简述一下目标检测的原理,如何进行画框的:

         目标检测:分为单目标检测和双目标检测,大部分 实际应用都是单目标检测,什么SSD,yolov3,yolov3-tiny,yolov4,yolov5;目标检测的原理就是特征提取让后进行回归与预测;将图像分为多个graid_cell,对每个cell进行类别的回归,对每一个类别的物体都会有自己大概的anchor,就是事先设定好的框,会产生三个预测框;再通过NMS非极大值阈值进行删除没必要的框;得到最终的结果;

2.如果检测到多框如何进行处理的?

   每个输出结果的维度都是(位置坐标+类别+类别分数),非极大值抑制中会有置信度阈值和iou阈值,这两个值有什么用呢?在计算过程中先选择一个分数较高的框,首先通过IOU阈值删除大于阈值的框,大于阈值说明表示的是一个物体就没必要重复表示,剩下的就是距离较远的目标框,再通过置信度阈值,来删除预测目标是该类物体框的分数,低于阈值的就删除;

3.如何判定一个网络检测的性能或者准确率?

  通过map,简述一下map是什么?首先提到一个正样本和负样本的概念,类别分数大于自己设定的置信度阈值则为正样本,其余的为负样本,这里提到一个靳准率和召回率,通过不断移动置信度阈值,iou不动回得到一个一个的pr点,链接这些点就会获得一个PR曲线,曲线的下的面积就是AP;m是多类别的平均AP;

4.阐述一下yolov3和yolov3-tiny的区别以及特点?

 yolov3在yolov2的基础上加入了dropblock,以及数据拼接,以及图像空间金字塔特征,由于网络深度越深神经元的感受野越大,关注的是大目标,而浅层网络更加关注的是小目标,将多特征进行融合而不是拼接,再次基础上加入了多尺度预测框,网络中分为大中小三个尺度框,每个尺度有三个anchor值;yolov3-tiny为了减少数据量和增加速度设置了两个尺度而不是三个自然而然降低了检测的精度;

5.阐述一下yolov4和yolov5的区别?

     yolov4在大体网络架构上和yolov5差不多,主干网络都是CSP结构进行特征提取,NECK网络进行特征融合,同样使用spp和PANET进行上采样和双下采样进行特征融合,最后就是检测头负责输出预测框和类别;

      yolov4使用mosic增强,四张图片堆叠,加入了自对抗噪音,

     yolov5加入了自适应苗框;

     yolov5s权重37M,yolov4的权重200多M,训练耗时不一样;

6.如何增加网络的MAP值?

    增加图片样本数量,增加空标签,

7.如果在训练时样本不均衡怎么办?

     什么是正负样本?增加少类别的权重,训练时会有参数调整,类别图片多的权重会较低,图片较少的会重复采样;预测框与实际狂的长宽比超过4;则认定为负样本,保留下的为正样本;

8.如何解决小目标的检测精度?

   增加小目标的分辨率提取到更多特征,以及类别损失时,使得三个尺寸中,大尺寸的是小感受野

二.跟踪算法综述

跟踪算法主要复习KCF\卡尔曼滤波,和sort\deepsort;

  

你可能感兴趣的:(目标检测,面试,深度学习)