OCR算法

OCR算法可以分为两阶段算法和端到端的算法。两阶段OCR算法分为文本检测和识别算法,文本检测算法从图像中得到文本行的检测框,然后识别算法识别文本框中的内容。端对端OCR算法使用一个模型同时完成文字检测和文字识别,因此端对端模型更小,速度更快。
深度学习技术在端到端文本识别方向具有代表性的方法。这些方法大致可以分为两类:
1)端到端规则文本识别(平直文本或倾斜文本);
2)端到端任意形状文本识别(弯曲、变形、平直、倾斜文本)。

类别 论文
端到端规则文本识别 FOTS(2018)、TextSpotter(2018)
端到端任意形状文本识别 Mask TextSpotterv1、Mask TextSpotter2(2019)、Mask TextSpotterv3、TextDragon(2019)、CharNet、TUTS、ABCNet、ABCNetV2(2021)、Text Perceptron、PGNet、PAN++(2021)

参考链接:
《动手学OCR》系列课程之:端到端算法

你可能感兴趣的:(人工智能)