深延科技:基于深度学习的智能OCR识别技术大有可为

智能OCR技术作为人工智能领域的重要原子能力之一,在行业转型过程中发挥作用。近年来,移动互联、大数据等新技术飞速发展,倒逼传统行业向智能化、移动化的方向转型。这一大趋势也促使传统OCR技术不断向智能OCR升级,以满足更复杂、更高要求的任务需求。

随着深度学习的融入,实现了OCR对复杂文本的识别,即智能OCR识别。同时配合其他信息化手段的综合应用,使智能OCR具备移动端适配、多任务检测、整行识别、图像分割定位和分类等功能,应用场景更加广泛,在图书情报领域中的图书文本和卡证识别会更高效。

01 传统OCR识别技术缺陷渐露

光学字符识别(Optical Character Recognition,OCR)指自动识别图像中的文字内容,属于人工智能机器视觉领域的一个重要的分支,即把文本、卡证等载体上的文字通过光学等技术手段转化为计算机认识的电子化数据。传统OCR识别采用统计模式,处理流程较长,包括图像的预处理、二值化、连通域分析、版面分析、行切分、字切分、单字符识别和后处理等步骤。典型的传统OCR识别流程如图1所示。

图1 传统OCR识别技术流程

传统OCR识别方法存在诸多弊端,汇总如下:a)在进行版面分析时,使用大量的规则,导致程序维护成本很高。b)行业域分析完全依靠图像二值化得到的二值图,对于扫描文档效果尚可,面对手机拍摄和高拍仪取图时,难取得效果良好的二值化图,造成二值化过程中大量信息的丢失。c)传统OCR技术包含8个模块,如图1所示,其中任何一个模块的不完善都会产生误差,误差的累积将导致识别率大幅下降。d)传统OCR识别灵活性差,对于自然场景下拍摄的复杂样本基本无法处理,没有修改提升空间,可用性不高。e)传统的方法将OCR系统割裂成过多的环节,倚重人工规则,需要在每个环节上引入人工干预并根据场景设定方法参数,难做到端到端的训练。

而深度学习算法可以有效地规避传统OCR识别的不足,通过组合低层特征形成更加抽象的高层表示属性类别或特征,挖掘数据的分布式特征表示。借助神经网络来模拟人脑进行分析、学习和训练,即模仿人脑机制来分析图像、声音和文本等数据,被广泛应用于人工智能的模型构建和处理中。

02 基于深度学习的智能OCR大有可为

基于深度学习的智能OCR技术是一次跨越式的升级,深度学习算法实现整行识别,提升了OCR的识别率和识别速度,人工需要几分钟才能录入的文本,智能OCR技术可以秒速进行精准识别。智能OCR识别技术对识别流程进行了优化,优化后的识别流程包括检测、识别和后处理3个主要步骤,如图2所示。

深延科技:基于深度学习的智能OCR识别技术大有可为_第1张图片

图2 智能OCR识别技术流程

深延科技智能一站式OCR服务平台基于深度学习的OCR定位与识别,通过卷积神经网络CNN、循环神经网络RNN、长短期记忆网络LSTM技术实现,可在灰度图像上实现文字区域的自动定位和整行文字的识别,解决了传统OCR技术中单字识别无法借助上下文来判断形似字的问题。

此外,智能OCR识别技术在低质量图片的容忍能力和识别准确率方面得到了显著的提升,可在印刷体低分辨率与模糊字符识别、印刷体复杂或者非均匀背景识别、印刷体多语言混合识别、印刷体艺术字体识别、手写小写数字识别、手写大写金额识别、手写通用文本识别等场景下实现高效的识别和分类。

深延科技智能一站式OCR服务平台基于深度学习的智能OCR识别技术支持移动设备拍摄的图像识别,可适用于对焦不准、高噪声、低分辨率、强光影等复杂背景

除了在卡证识别、票据识别、表单识别、文档识别,智能OCR可应用于互联网广告推荐系统、UCG图片视频过滤、医学影像识别、街景路牌识别等。智能OCR识别属于多类分类问题,场景复杂、挑战性大;尤其是中文识别,字符集达到20000类,而英文数字加字母只有62类。

深延科技智能一站式OCR服务平台可提供多场景、多语种、高精度的文字检测与识别服务,广泛适用于身份证、户口本、银行卡、名片、财税票据、文档、表格、车牌等具体识别对象,全面辅助企业智能化办公,实现降本增效。

深延科技:基于深度学习的智能OCR识别技术大有可为_第2张图片

深延科接智能OCR一站式服务平台功能

深延科技智能一站式OCR服务平台行业解决方案

保险

利用OCR技术全面赋能保费代扣、投保、财产保险等业务,为保险行业各细分领域提供个性化服务和技术支持。

  • 手机移动端投保

通过手机拍摄身份证、驾驶证、行驶证等证件信息,并将姓名、身份证号、车牌号码、号牌类型、初登日期,使用性质、车辆种类等信息分门别类自动录入。投保更加方便,提升客户转化率。

  • 客户保费代扣

业务员可通过手机或平板拍摄自动识别客户的银行卡对投保人账户的银行卡信息进行核实,降低手动输入的错误率,方便操作、节省时间,提高业务效率。

  • 车险现场勘查

业务员现场采集信息时,使用移动端设备(手机、平板电脑等)拍摄,通过部署OCR技术自动识别录入当事人的身份证、驾驶证、行驶证等信息。节省业务时间,提高客户满意度。

银行

为银行开户业务、内部流程、贷款等业务创造全新的服务生态,降低服务成本,增强用户体验,创造新的收入流。

  • 线上开户

提供ocr线上识别身份证、银行卡等开户证件服务,随时随地录入信息,更便捷、高效的满足用户需求。

  • 贷前企业背调

赋能企业投资、企业带贷款等银行主营业务,利用ocr技术识别、录入企业三证信息进行校验。

  • 内部流程优化

通过手机或平板实现企业年报、各类表单、文档及工单文本电子化,自动录入。

证券

协助证券开户,账户认证,移动支付业务,利用精准的OCR识别技术,为金融机构提供更加智能化、精准化和专业化的服务,用智能变革业务模式。

  • 线上开户认证

移动端开户认证、Web开户认证。支持身份证识别、人脸识别、银行卡识别,精准的OCR识别技术和生物识别技术,提升金融服务体验。

  • 实名认证

投资理财客户拍摄身份证,即可自动识别获得用户的姓名、身份证号码、身份证有效期、所在地区等信息。同时绑定银行卡时,也可通过拍摄银行卡识别,进行自动识别卡号,轻松完成绑定,操作更渐变。

  • 移动支付

结合OCR证件识别技术与人脸识别技术,为移动支付身份认证的安全性提供保障,避免手机盗用同时减少流程时间以提高转化率。

供应链

准确把握产业链的布局,辅助风险管理、营销拓客或者招商引资,为产业研究提供强有力的数据支撑。利用OCR技术,识别录入各种运输流程文件及单据,优化流程提高效率。

移动设备

从移动支付、身份认证、车辆认证,到37个维度的企业信用数据查询,给使用带来新体验。

  • 移动端文档扫描

利用ocr技术,可使移动端(手机或平板电脑)设备成为移动扫描仪,扫描纸质文档、PPT、各类票据,生成PDF或JPG格式文件。

  • 银行卡号等信息识别

手机拍照即可录入银行卡号,在手机移动支付,银行卡管理。而且深延OCR识别技术,不仅支持识别卡号,还能同时录入持卡人姓名、卡片到期日期。

智慧政务、社区

运用大数据,以及OCR技术,推进政府和社区的移动化、信息化,优化信息采集管理、访客登记、证件办理等流程,形成高效、敏捷、便民的智慧政务&智慧社区。

  • 政务移动办公

企业OA系统,CRM系统等办公系统,利用ocr识别快速录入人员信息、证件信息、名片信息管理。

  • 信息服务平台优化

利用ocr技术,只需手机拍照,就能自动识别录入,完成居民身份认证,银行卡绑定,证件申请、换证等诸多便民服务。

相比于传统OCR,基于深度学习的智能OCR技术具有识别准确率更高、速度更快、无格式依赖、支持私有化快速部署等优势,深度学习算法和模型构建也是OCR应用的关键。随着智能OCR技术不断演进,深延科技将继续细化业务需求,和已有的信息化系统相结合,打造智能OCR创新服务模型,解决实际生产中的痛点问题。

|关于深延科技|

深延科技成立于2018年1月,中关村高新技术企业,是拥有全球领先人工智能技术的企业AI服务专家。以计算机视觉、自然语言处理和数据挖掘核心技术为基础,公司推出四款平台产品——深延智能数据标注平台、深延AI开发平台、深延自动化机器学习平台、深延AI开放平台,为企业提供数据处理、模型构建和训练、隐私计算、行业算法和解决方案等一站式AI平台服务。

你可能感兴趣的:(OCR识别,深度学习,人工智能,计算机视觉,ocr)