吴恩达深度学习3.7-非最大值抑制

今天要讲的概念是关于如何在多个检测出来的方框当中选取我们要的方框。

首先,我们还是依照前几课所讲的方法,将图片分成19x19个方框,然后进行卷积的中心检测。

为了方便起见,今天的课程当中我们就先不分成行人、车几类了,就只先关注我们所需要的车辆类型。

在训练好了我们的模型之后,我们会拿图片经过模型进行一些检测,那么在检测的过程当中,19x19的每个格子当中都有可能是包含目标中心的那个方框。

具体这个可能性是多少,我们可以通过Pc,也就是一开始判断这个方框当中有没有目标的这个值来观察。

图中的蓝色方框就是指我们的bxbybwbh画出来的方框,上面的黑色数字就是它的Pc,Pc越高则代表它的概率越高。

首先我们会对所有方框进行一个筛选,保留Pc值大于一定阈值的方框(0.6),然后再进行非最大值抑制。

我们的选取标准是,从最高的开始,把它变成一个确定的方框,然后计算它跟其他方框的IoU比,当这个IoU比大于某一个数值(0.5)时,我们就判断这两个方框重合,就把另外一个方框去掉。

然后再重复重复,知道图片当中没有不确定的方框为止。

那么经过了这整个过程之后,整个图片的当中就不会存在对于同一个物体的重复的方框了,就可以得到每一个物体精确的大小和位置。

如果要对多个物体进行比较的话,比如说三个。

那么就要分别进行三次最大值抑制,不同物体的方框要分开来比较。

你可能感兴趣的:(吴恩达深度学习3.7-非最大值抑制)