TextBoxes++

TextBoxes++是基于SSD和TextBoxes的。论文:https://arxiv.org/pdf/1801.02765.pdf

前言

文本检测和其他物体检测的区别:

(1) 文本检测有比较大的长宽比;

(2) 一半的convolutional filter无法全部检测到;

可能的解决方案:

(1) 长的卷积核;

(2) inception convolutional kernels;

(3) part detection and grouping.

textboxes

与SSD区别:

(1) 把SSD的defaultbox的比例改成(1,2,3,5,7,10)的长矩形。

(2) 如下图所示,把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。

TextBoxes++_第1张图片

(3) 从多尺度变换成单尺度(textboxes系列算法对尺度的严重依赖性,对于不同尺度的图片,要调整不同的尺度效果才好)。

TextBoxes++_第2张图片

textboxes网络结构

TextBoxes++_第3张图片

SSD网络结构

TextBoxes++

代码:https://github.com/MhLiao/TextBoxes_plusplus




参考:

[1] https://zhuanlan.zhihu.com/p/34131821

你可能感兴趣的:(深度学习)