计算机视觉 自然场景下文字检测,基于YOLOv3 与CRNN的中文自然场景文字检测与识别...

原标题:基于YOLOv3 与CRNN的中文自然场景文字检测与识别

52CV君曾经分享过多篇关于文字检测与识别的文章:

华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter

华科新开源文本识别算法:ASTER与DeepLesion数据集百度云下载

开源OCR文字识别软件Calamari

OpenCV深度学习文本检测示例程序(EAST text detector)

AdvancedEAST高效场景文本检测(附Github地址)

ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)

(以上链接如果打不开,请进入“我爱计算机视觉”查看本文原文)

基本都遵循“有价值有深度”的原则,希望它们能对大家真实的有帮助。

但以上文章及其对应的开源工程并没有专门针对中文自然场景文本检测与识别一整套解决方案的。

对于那些在实际的工程项目中使用中文文字识别功能的朋友来说,则非常希望能有一套检测与识别功能均包含的开源库。

现在好了,Github上新出的OCR工程chineseocr就是这样的一套较好的整体解决方案。

该工程chineseocr使用今年新出的通用目标检测系统YOLOv3进行文本检测,使用华中科技大学白翔老师团队2015年的结合了CNN, RNN 与 CTC loss 的CRNN文本序列识别方案。请看chineseocr原作者给出的一些识别结果示例:

对于上面的印刷体文字的检测和识别还是很不错的!

工程Github地址:

https://github.com/chineseocr/chineseocr

YOLOv3论文地址:

YOLOv3: An Incremental Improvement

https://arxiv.org/abs/1804.02767

CRNN论文地址:

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

https://arxiv.org/abs/1507.05717

对于想对文字识别尤其是中文识别有更深入了解和研究的朋友,我想紧跟前沿是当然是非常好的,但系统的学习了解经典也是必不可少的,推荐你们购买清华大学丁晓青教授团队2017年出版的新书《文字识别:原理、方法和实践》。文字识别方向相关的书并不多,而这本书是该领域既全面又权威且最新的著作。返回搜狐,查看更多

责任编辑:

你可能感兴趣的:(计算机视觉,自然场景下文字检测)