GitHub 热榜:文字识别神器,超轻量级中文 OCR!一个超级厉害的开源库


光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题 App 用来识别书本上的试题。

近期,这个叫做 chineseocr_lite 的 OCR 项目开源了,这是一个超轻量级中文 ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。

目前,这个开源项目已在 GitHub 上标星 2400+。

这个项目基于 chineseocr 与 psenet 实现中文自然场景文字检测及识别,环境是 linux/macos。

以下为可实现的功能:

  • 提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense 识别(ocr-dense 和 ocr-lstm 是搬运 chineseocr 的)

  • 支持竖排文本识别

  • ncnn 实现 psenet(未实现核扩展)

  • ncnn 实现 crnn_dense (改变了全连接为 conv1x1)

  • ncnn 实现 shuuflenev2 角度分类网络

  • ncnn 实现 ocr 整个流程

最近,项目作者对更新了可实现的功能。

  • nihui 大佬实现的 crnn_lstm 推理

  • 升级 crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转 90 度的字体)

字体样式

生成的竖排文本样例

识别效果展示:

ncnn 检测识别展示 (x86 cpu 单进程)

项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

猜你喜欢

1、GitHub 标星 3.2w!史上最全技术人员面试手册!FackBoo发起和总结

2、如何才能成为优秀的架构师?

3、从零开始搭建创业公司后台技术栈

4、程序员一般可以从什么平台接私活?

5、37岁程序员被裁,120天没找到工作,无奈去小公司,结果懵了...

6、滴滴业务中台构建实践,首次曝光

7、不认命,从10年流水线工人,到谷歌上班的程序媛,一位湖南妹子的励志故事

8、15张图看懂瞎忙和高效的区别!

你可能感兴趣的:(GitHub 热榜:文字识别神器,超轻量级中文 OCR!一个超级厉害的开源库)