前言
工程实践选题为脱机手写汉字识别,可广泛应用于拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别(Optical Character Recognition, OCR)图像识别系统以及手写文字输入设备中。
Web APP
讯飞开放平台(https://www.xfyun.cn/services/wordRecg)
需要自己预选识别英文、中文、还是中英混合,手写文字识别的识别率达到90%,说自己是遥遥领先,我感觉也就是平均水平吧;支持扫描体以及复杂自然场景下的文字识别;提供restful API接口,可供开发者进行跨平台调用。
中文识别这一块目前使用的用户还不多,较多的能推广的场景也就几个,比如将图片资料中的文字进行提取,为后续的数据后处理提供(如检索,翻译等)基础;将学生的作业/练习的文字转化成可编辑文字,供老师进行阅读和批改;将学生的答题卡的文字转化成计算机可编码的文字,为人工智能评阅打分提供基础。
用户不多,所以现在还在做一些推广,可以看一下价格:
可以先用来体验,讯飞给的体验量完全够了,后面收费的套餐有点看不懂???我为什么要付费???
讯飞的目标还是用来盈利,只是现在的用户量比较小,还在努力做推广的阶段,不知现在用户提交的一些数据是否可以用来训练提高准确率,但是具体什么时间出现不太清楚,官网也没有给出时间,但是应该在最近2~3年之内。
同款的产品还有腾讯云的通用文字识别
腾讯通用文字识别 General OCR(https://cloud.tencent.com/product/generalocr)
同样是基于深度学习技术,现在基本都是这个,,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
腾讯主打的应用场景为:纸质文档电子化,内容审核与管理,随手拍扫描。
腾讯的产品区分与 讯飞不同,讯飞是按照英文、中文、中英混合来提供不同的专业服务,而腾讯是提供了几个不同功能价位的版本:
通用印刷体识别(高精度版):支持图像整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,准确率和召回率更高。
通用印刷体识别(精简版)(免费公测版):支持多场景、任意版面下整图文字的识别。相较于“通用印刷体识别”接口,精简版接口在准召率有一定损失的情况下,耗时更短。适用于对接口耗时较为敏感的客户。
通用印刷体识别(高速版):支持图像整体文字的检测和识别,返回文字框位置与文字内容。暂未支持多语种识别,推荐使用通用印刷体识别接口。
然后计费模式为:
客服还提供7X24小时的服务,还提供了价格计算器,看起来比讯飞的复杂,但是感觉更专业一点,这当然是以营利为目的,但是不像讯飞一样,给人感觉推广更明显,腾讯的看上去更像针对大客户,有大量需求的人,也有多种的计费方式,可以根据自己的不同需求来选择,但是讯飞一向以语音为傲,不应该做的那么不专业,不是说不专业,起码要比同类产品强吧。
Mobile Apps
汉王识文
汉王的核心主要是做识别的,包括人脸识别,笔迹识别,有很多博物馆,医院都用汉王的识别技术识别古文和病例。
这种手机APP的识别率肯定没有讯飞、腾讯做的好,但是好在比较方便,适合轻度使用的用户,如果是企业、大用户的话,肯定选择PC端的讯飞与腾讯了,量比较大的话用手机一张张上传也不现实,小用户的话,手机直接拍照上传就出结果了也比较方便。手机APP也是以盈利为目的,盈利的方式可能限制每天的上传数量,超出后需要付费才能使用,然后就是在APP启动的界面加入目标人群相关的广告,或者在APP内植入一些广告。
当然,手机端有很多相似的软件,大同小异,只是使用体验有所不同,不想下载软件的话,微信小程序也有很多相同功能的产品,都可以去体验试用。