OCR:ASTER-基于空间变换的自然场景的文本识别算法

白翔老师团队开源了 ASTER,一种基于空间变换的自然场景的文本识别算法,最开始出现于CVPR2016的论文,登上了PAMI。
它是文本识别算法,不包括文本检测,对于输入的检测到的文本图像块,识别出相应字符。

OCR:ASTER-基于空间变换的自然场景的文本识别算法_第1张图片

该代码值得推荐的理由:
1.高精度。
2.高速度。
3.已经申请了专利。并获得了专利授权,说明作者充分肯定了其商业化潜力。
4.包含训练代码。可以训练自己的数据集。

代码主页:https://github.com/bgshih/aster

 

方法概述

本文方法主要解决不规则排列文字文字识别问题,论文为之前一篇CVPR206的paper(Robust Scene Text Recognition with Automatic Rectification,方法简称为RARE)的改进版(journal版)。

1. 主要思路

  • 针对不规则文字,先矫正成正常线性排列的文字,再识别;
  • 整合矫正网络和识别网络成为一个端到端网络来训练;
  • 矫正网络使用STN,识别网络用经典的sequence to sequence + at

你可能感兴趣的:(OCR)