synthetic data for text localisation in natural images

简单概括:

本文贡献:

1. 提出了一个针对文本检测和识别任务的数据扩增方法。该方法合成的图片相当真实,可以以假乱真,极大提高了准确率。其他任务可以借鉴。

2. 借鉴YOLO,提出了一个端对端的文本检测模型,可以看做EAST、wordsup、DeepDirect方法的雏形。

3. 为了提高性能,采用了cascade结构,把 2 的 结果作为proposal,用传统方法二次过滤,用神经网络二次回归。对发表论文、刷比赛库有启发。

你可能感兴趣的:(synthetic data for text localisation in natural images)