YOLO学习笔记3——训练阶段

训练阶段(反向传播)

拟合物体

深度学习、监督学习:通过梯度下降、反向传播方法迭代的微调神经元中的权重,使损失函数最小化。
YOLO检测速度非常快,标准版本的YOLO可以每秒处理 45 张图像
YOLO学习笔记3——训练阶段_第1张图片

YOLO学习笔记3——训练阶段_第2张图片
当有ground truth的中心点落在某一个grid cell中
对于该grid cell产生的2个bbox,由其中与ground truth(人工标注的真实标注框)IOU最大的那个bbox,来负责拟合物体。

当没有ground truth的中心点落在某一个grid cell中
对于该grid cell 产生的两个bbox,只需要让这两个bbox的置信度越接近于0。

损失函数

YOLO学习笔记3——训练阶段_第3张图片

回归问题:
预测出一个连续的值,将该值与标注值进行比较。
第一项:负责检测物体的bbox中心点定位误差,定位误差比分类误差更大,所以增加对定位误差的惩罚,λcoord=5
第二项:负责检测物体的bbox宽高定位误差,带根号:同样的偏差,小框造成的损失函数会更大,大框造成的损失函数会更小。相比于大bounding box预测偏一点,小box预测偏一点更不能忍受。上图中带上标的是标注值,不带的是预测值,λcoord=5。
第三项:负责检测物体的bbox的confidence误差,其中的标签值是bbox与ground truth的iou,预测出的置信度应该和iou越接近越好。
第四项:不负责检测物体的bbox的confiden误差(包括1:负责检测物体的grid cell中不要的那个bbox,2:不负责检测物体的grid cell),训练时就会把这些网格里的框的“置信度”分数推到零,这往往超过了包含目标的框的梯度。从而可能导致模型不稳定,训练早期发散。因此要减少不包含目标的框的置信度预测的损失,使λnoobj=5 。
第五项:负责检测物体的grid cell分类误差越接近1越好

学习的视频地址:https://www.bilibili.com/video/BV15w411Z7LG?p=6

你可能感兴趣的:(yolo,darknet,深度学习,计算机视觉,人工智能)