deeplearning.ai 总结 - YOLO算法输出维度的计算方法

deeplearning.ai 总结 - YOLO算法输出维度的计算方法

flyfish

pc p c 表示矩形区域是目标的概率,数值在0~1之间
bx,by b x , b y 表示目标中心位置坐标
bh,bw b h , b w 表示目标所在矩形区域的高和宽
c c 表示表示类别,有多少个类别就有多少个 c c

图片左上角为原点 (0,0) ( 0 , 0 ) ,右下角为 (1,1) ( 1 , 1 )

输出内容的列向量中先要包含以下6个部分
(pc,bx,by,bh,bw,c) ( p c , b x , b y , b h , b w , c )
deeplearning.ai 总结 - YOLO算法输出维度的计算方法_第1张图片

如果要同时检测两个目标,就设置两个Anchor Boxes
例如Anchor box 1检测人,Anchor box 2检测车。

计算方法

例如我们将图片分割成3*3的网格,算法可以识别3类目标(pedestrian, car, motorcycle),我们有两个Anchor Boxes

那么输出维度是
3*3*(5+3)*2

deeplearning.ai 总结 - YOLO算法输出维度的计算方法_第2张图片
按照上图计算
就是
19*19*(5+80)5

你可能感兴趣的:(深度学习,TensorFlow)