OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错
调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;
合合通用多语言:
https://www.textin.com/experience/text_recognize_3d1

OCR多语言识别模型构建资料收集_第1张图片百度的通用模型:
https://ai.baidu.com/tech/ocr/general?p=%E5%8A%9F%E8%83%BD%E6%BC%94%E7%A4%BA&from=experience
OCR多语言识别模型构建资料收集_第2张图片
版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

你可能感兴趣的:(ocr)