OCR相关

参考文章:OCR软件哪个好?
OCR目前的发展现状综述
论文合集

尝试体验了以下几个OCR工具。

1、小程序:openAI接口

技术特点:调用了openAI的接口
OCR相关_第1张图片

OCR相关_第2张图片
OCR相关_第3张图片

小结: 名片识别功能基本可以,对电话、QQ、地址等结构化信息识别较好,对非结构化信息(如业务范围、标语等)识别不好。能一定程度降低工作量,需要手动对识别结果做一定的调整

2、百度 OCR接口

对于中文名片中的常识理解更好。
对英文支持差一些。
OCR相关_第4张图片

识别结果:
‘NAME’: [‘信洪坡’],
‘TITLE’: [‘维修技师’],
‘MOBILE’: [‘15864179712’, ‘15864179712’],
‘COMPANY’: [‘德州市岔河小区(二部)修’],
‘ADDR’: [‘德州市万佳科技市场C-36(一部)’]}}

3、开源离线OCR程序

https://github.com/myhub/tr
TrWebOCR连接:https://github.com/alisen39/TrWebOCR

建议:
1、OCR技术相对成熟,通用场景下巨头林立。
2、专用场景下的定制化开发和训练,有比较多的需求。

开源OCR

不支持自训练的开源OCR

TrWebOCR—支持中英文,支持端侧部署
chineseocr-lite—中英文,支持端侧部署
easyOCR—多语言,不支持端侧部署

支持自训练的开源OCR

百度开源OCR

采用paddle框架。
支持中英文。
支持自定义训练,支持端侧部署。

计划

第一步:先用开源的TrWebOCR实现接口调用,做成小程序界面
第二步:消化chineseocr-lite或TrWebOCR的源代码,测试是否可以自训练
第三步:尝试使用百度的框架和源码,进行自训练,并转换为onnx(推理模型)

博世OCR 铭牌数据
http://www.csrobo.com:5060/sharing/3BO42FiZE
密码:147258

你可能感兴趣的:(深度学习,ocr)