[TextDetection]Text Detection方法总结

版权声明:本文为博主原创文章,未经博主允许不得转载。

目前,文本检测的方法主要分为3种:sliding-window、connected component、end-to-end(输入待检测图像,给出文本的定位结果)。

1.sliding-window:

paper:Deep Features for Text Spotting
paper link:http://www.robots.ox.ac.uk/~vgg/publications/2014/Jaderberg14/jaderberg14.pdf
code link:https://bitbucket.org/jaderberg/eccv2014_textspotting

2.connected component

基于connected component的方法,主要是利用fast low-level filter和字符图像的特性,将图像中可能是text的区域提取出来。常用的方法有SWT、MSER。
这里,主要介绍2篇基于MSER+CNN的paper。

paper 1:

paper:Robust Scene Text Detection with Convolution Neural Network Induced MSER Trees
paper link: https://pdfs.semanticscholar.org/829f/22449ba04809ff0dccda9c86bc16a05029c4.pdf

paper 2:

paper:a fast and robust text spotter
paper link:https://users.soe.ucsc.edu/~siqin/papers/TextSpotting_WACV2016.pdf

3.end-to-end

该方法完全不同与上述方法,没有经过上述复杂的步骤,给定一幅输入的图像,就可以得到图像中的bounding box。由于其速度快和易于优化的特点,可以成为后续检测研究的方向。
目前,只尝试了将SSD的方法用于文字检测,取得了较好的结果。这里暂时只列举一些关于SSD的参考资料。
paper:SSD: Single Shot MultiBox Detector
paper link:https://arxiv.org/pdf/1512.02325v4.pdf
code link:https://github.com/weiliu89/caffe/tree/ssd
blog:http://blog.csdn.net/u010167269/article/details/52851667

你可能感兴趣的:([TextDetection]Text Detection方法总结)