Mask-RCNN中的损失函数

对每个ROI来说,多任务损失函数如下:

这里写图片描述

mask分支对于每个RoI有Km2 维度的输出。K个(类别数)分辨率为m*m的二值mask。
因此作者利用了a per-pixel sigmoid,并且定义 Lmask 为平均二值交叉熵损失(the average binary cross-entropy loss).
对于一个属于第k个类别的RoI, Lmask 仅仅考虑第k个mask(其他的掩模输入不会贡献到损失函数中)。这样的定义会允许对每个类别都会生成掩模,并且不会存在类间竞争。

Mask-RCNN中的损失函数_第1张图片

附录:
sigmoid函数解释如下:
http://blog.163.com/liyanhua_08/blog/static/1172002772009927111741738/

softmax函数解释如下:
https://www.zhihu.com/question/23765351

交叉熵损失函数的解释如下:
http://blog.csdn.net/u012162613/article/details/44239919

各种损失函数的解释如下:
http://blog.csdn.net/u014114990/article/details/47802993

你可能感兴趣的:(mask-rcnn)