【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection
这篇文章主要的贡献点主要有两个:1)在RROI阶段,多尺度的pooling(7x7,3x11,11x3).2)除了坐标对齐的bbox坐标回归,添加了inclinedbox的坐标回归(x1,y1,x2,y2,h)。[注:x1,y1,x2,y2分布是bbox按顺时针方向定义的两个角点]网络结构如下:该方法的训练集:1000(icdar15_trainingset)+2000(focusedscenet