【计算机视觉】NMS详细工作机制(代码实现)-Bbox voting-Softnms

问题

看到一句话:NMS都不懂,还做什么Detection ! 虎躯一震……懂是大概懂,但代码能写出来吗???

在目标检测网络中,产生 proposal 后使用分类分支给出每个框的每类置信度,使用回归分支修正框的位置,最终会使用 NMS 方法去除同个类别当中 IOU 重叠度较高且 scores 即置信度较低的那些检测框。

下图就是在目标检测中 NMS 的使用效果:emmm大概就是能让你更无遮挡地看到美女的脸吧hhhh

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QB4zf027-1673360779619)(null)]

背景知识

NMS (Non-maximum suppression) 非极大值抑制,即抑制不是极大值的检测框,根据什么去抑制?在目标检测领域,当然是根据 IOU (Intersection over Union) 去抑制。下图是绿色检测框与红色检测框的 IOU 计算方法:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-av19U00J-1673360779596)(null)]

NMS 原理及示例

注意 NMS 是针对一个特定的类别进行操作的。例如假设一张图中有要检测的目标有“人脸”和“猫”,没做NMS之前检测到10个目标框,每个目标框变量表示为: [ x

你可能感兴趣的:(深度学习,计算机视觉,计算机视觉,深度学习,python)