论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection

论文名称: Sliding Line Point Regression for Shape Robust Scene Text Detection
论文原文:原文链接

创新点

针对曲文检测,基于Faster R-CNN/R-FCN框架,增加了水平和竖直的均匀滑动线与文本的多边形的交点的纵/横坐标的回归(14个点,仅回归x或y坐标),最后把点串起来得到多边形。

算法概览

第一步:利用区域建议网络(RPN)生成包含文本的最小矩形框
第二步:使用垂直和水平滑动线等距回归文本边缘上的点。

需要说明的是:以竖直的滑动线为例,为了充分利用信息并减少冗余,我们通过矩形框位置计算目标点的x坐标,然后利用网络回归对应的y坐标。 从而,我们减少系统的参数

论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第1张图片

第三步:重构出文本多边形,即为检测结果。

SLPN网络框架

模型可以应用于任何2-step物体检测框架,例如Faster R-CNN和R-FCN。 我们的系统同时回归最小矩形,包括文本行和文本行边界上某些特定点的坐标。

更具体地说,以Faster R-CNN为例,我们首先使用RPN得到一些感兴趣的区域,然后我们不仅回归矩形的位置,而且还回归文本行边缘点的坐标,最后 我们可以得到任意形状的文字区域。
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第2张图片

多边形重构

在经过SLPR模型之后,得到回归的14个交叉点和4个最小矩形顶顶点,有两种方法利用得到的点来重构多边形。

1)Only Using Points in Long Side (PLS)

仅使用长边中的点(PLS)

我们首先通过回归矩形来判断文本行是水平还是垂直,然后通过相应方向的点恢复多边形。

以图3中为例,由于我们没有回归矩形边界上的交点,我们首先将边界附近的四条线延伸,找到四个与矩形的交点,然后我们连接四个新点和其他交叉点生成多边形。
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第3张图片

2)Using Both of Horizontal and Vertical Points (BHVP)

同时使用水平点和垂直点(BHVP)

事实上,如果我们同时使用水平点和垂直点来恢复多边形,我们可以计算出大致如图4所示通过这些点的多边形或四边形。 [27]中的方法。通过这种方式,我们可以在水平和垂直方向上获得足够密集的点,并且我们不需要像PLS方法那样计算与矩形的交点。然而,我们观察到BHVP对于多边形情况不如PLS有效。因此我们仅在四边形数据集(ICDAR2015附带场景文本)上使用此方法。
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第4张图片

多任务损失函数

论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第5张图片
L-SLPRB如下:
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第6张图片
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第7张图片

实验结果

表一是不同实验设置的实验结果对比。
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第8张图片
表二为NMS和PNMS设置不同的阈值的实验结果对比
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第9张图片
表三为CTD和SLPR的实验对比
在这里插入图片描述
图5为SLPR在ICDAR2015数据集上的实验结果
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第10张图片
图6为CTD和SLPR的实验对比
论文阅读SLPR-Sliding Line Point Regression for Shape Robust Scene Text Detection_第11张图片

你可能感兴趣的:(论文阅读,曲文检测,场景文本检测)