GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!_第1张图片

大家好,我是小 G。

近几年,各类线上办公软件层出不穷,OCR (Optical Character Recognition,光学字符识别)技术也开始被大部分人所知晓与应用。

此中,OCR 被应用最为广泛的,应该要属将图片、或纸质文件扫描成可编辑的电子版文件了。

之前我曾在网上找过不少工具,但大部分都是要收费的。作为一枚喜欢分享 GitHub 开源项目的博主,还是想尽力给大家找一些免费开源,用户友好度比较好的可替代软件。

上个月曾给大家推荐过百度在 GitHub 上开源的一款 OCR 文字识别工具 Panddle OCR,对于想研究具体技术底层原理的同学,这个项目值得一看。

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!_第2张图片

https://github.com/PaddlePaddle/PaddleOCR

不过,今天我想另外推荐一款,相对比较成熟,也更偏向于小白用户的 OCR 工具:PandaOCR。

相较于其他工具,这个开源项目的功能要显得更为齐全与强大。

除了我们日常使用的图片、截图、剪切识别的功能之外,它还拥有智能翻译、朗读、弹窗预览、公式整合等功能。

界面相对于小白用户来说,也显得更为友好:

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!_第3张图片

而除了集成上述功能之外,API 配置灵活也是其最大亮点之一。

例如,在文字识别一项,Panda OCR 便整合了百度飞桨、腾讯、搜狗、有道、阿里、网易等多个平台的接口。

在公式与表格识别、翻译及朗读引擎等位置,也同样可配置多方平台接口。

公式识别:

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!_第4张图片

在此需要多说一句的是,部分平台的接口可能是收费的,大家可按自身需求来定制方案。

最后,放下该项目的 GitHub 地址,大家感兴趣的可前往查看。工具使用教程,可看作者提供的 wiki:

https://github.com/miaomiaosoft/PandaOCR/

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!_第5张图片

你可能感兴趣的:(人工智能,ocr,github,编程语言,百度)