【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

这篇文章主要的贡献点主要有两个:

1)在RROI 阶段,多尺度的pooling (7x7,3x11,11x3).

2)除了坐标对齐的bbox坐标回归,添加了inclined box的坐标回归(x1,y1,x2,y2,h)。[注:x1,y1,x2,y2分布是bbox按顺时针方向定义的两个角点]

网络结构如下:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection_第1张图片

该方法的训练集:1000(icdar15_trainingset)+ 2000(focused scene text images that authors collected)+data-augmentation=39000

在ICDAR15上的性能:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection_第2张图片

PK其它方法:

ICDAR15:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection_第3张图片

ICDAR13:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection_第4张图片

你可能感兴趣的:(Text,Detection,and,Recognition)