来源:ATYUN AI平台
计算机视觉在过去的几年里迅速发展。从单词镜头到谷歌图像搜索,在任何设备上快速识别文本和物体的能力与扫描文档和耗时的OCR的日子相去甚远。
文件和内容采集公司ABBYY昨天宣布了新的实时识别SDK(RTR SDK)的发布,该SDK承诺将文本采集提高到一个新的水平。
我在伦敦的“人工智能欧洲(AI Europe )”看到了解决方案,这令人印象深刻。
通过使用智能手机摄像头拍摄的视频直播,该解决方案可以立即从最复杂的文档和对象中提取文本和数据。例如,如果你正在开发一个应用程序,要求用户提供认证数据,ABBYY的RTR SDK允许直接从认证中采集所有文档细节。
ABBYY声称RTR SDK是实时的,这并没有错。我亲眼目睹了从ID、银行声明、驾驶执照等即时采集信息的解决方案。更令人印象深刻的是,它可以用63种语言来实现这一目标——这一数字使谷歌目前的图像翻译语言群相形见绌。
“通过实时识别,应用程序用户可以毫不费力地输入来自输出来源、文档和银行卡的数据,”ABBYY的CMO Jupp Stoepetie说,“换句话说,实时识别改变了移动用户体验和客户与品牌的互动。”
SDK帮助开发人员将真实文档数据合并到应用程序中。
“事实上,任何需要从输出源中输入数据的应用程序都能从更快、更准确、更轻松的文本识别和分类中获益。”Stoepetie说,“集成到金融、保险、物流、电子商务、消费者或政府应用程序中,实时识别SDK大大加速了复杂识别、注册或登录过程,比如开立账户、申请贷款或输入银行卡信息、IBAN或promo代码。”
重要的是,它没有任何安全隐患。
Stoepetie说:“这项技术非常适合那些需要遵守安全和隐私规则的流程,因为没有图像被发送到服务器或存储在设备上。”
那么RTR SDK的下一步是什么,应用程序开发人员可以期待什么呢?
“目前,我们正在研究神经网络,以进一步提高识别的准确性。”Stoepetie说,“我们也在研究移动设备中新的人工智能芯片所提供的机遇。iPhone的神经引擎,华为Mate 10的神经处理单元,以及其他新一代人工智能设备和机器学习上的移动处理器,这与我们基于用户的反馈持续改进的设备智能捕捉同步。”
ABBYY实时识别SDK可以集成到新的或现有的iOS和Android应用程序中。包含集成代码示例和快速启动指南的开发工具包也从昨天开始使用。
本文转自ATYUN人工智能媒体平台,原文链接:超越谷歌!ABBYY又有新动作
CES 2019:英特尔与阿里巴巴在人工智能领域展开合作
优必选悟空机器人获创新奖,Walker 新一代将亮相
三星展示护理机器人Bot Care,旨在帮助用户监控健康状况
神策数据CEO的一篇论文 | 华为,伟大的背后都是苦难