[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用

目       录

1..... 应用概述... 2

2..... 免费下载试用... 2

3..... 视频介绍... 2

4..... iNeuLink.Ocr图像数据采集应用... 2

5..... 数据上传到iNeuOS工业互联网操作系统... 4

6..... Ocr基本概念... 7

1.   应用概述

  在工业、军工或航天等领域,有些设备及软件系统比较陈旧,但是更换的成本比较高,在实验或生产过程中不能够完整的记录数据,给数据应用和分析造成了很大的障碍,更无法解决实验和生产人员的劳动强度

  通过OCR图像识别的技术可以很好的解决上述问题,但是没有一个完整的产品化的软件实现操作级应用。尽管OCR技术相对比较成熟,除特定应用场景使用外,普及使用率并不高。

  iNeuKernel.Ocr图像数据采集软件,实现了实时自动获得屏幕截图或是应用程序截图、动态增加数据识别标签信息、后台任务自动切片采集数据以及实时转发数据,与iNeuOS工业互联网操作系统互联互通,完整数据采集、传输、存储、视图建模、分析等应用过程。示意如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第1张图片

2.   免费下载试用

  链接:https://pan.baidu.com/s/1joGfBefaBKiFJ1l08N3KZg

  提取码:v242

3.   视频介绍

   视频介绍:iNeuKernel.Ocr 图像数据识别与采集

4.   iNeuLink.Ocr图像数据采集应用

(1)运行的主界面,应用相对简单。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第2张图片

  (2)配置图源,可以使用快捷键,全屏截图或是程序截图,以便定位数据标签的坐标的相对位置,进行数据提取。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第3张图片

  (3)增加或编辑识别标签,单击【数据识别】可以用红色方框在图源上标注要误别的数据位置信息,在【数据识别结果】中可以看到识别数据的结果,并且填写数据标签名称。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第4张图片

  (4)转发数据,可以把识别的数据结果转发给其他系统,填写站点编号、远程IP、远程Port转发周期和是否启用等信息。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第5张图片

5.   数据上传到iNeuOS工业互联网操作系统

  下载iNeuOS离线安装包,安装过程参见:一键部署。进入系统后,选择桌面【设备模型】,单击左上角小加号图标,增加一个新的设备。选择【服务实例】后面的【编辑】按钮链接,配置【基本设置】和【Socket】,【Socket】默认侦听端口为6699,其他信息一般不需要修改,如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第6张图片

     选择配置好的【服务实例】,并且配置通讯类型、应用协议和选择驱动等,配置如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第7张图片

     选择左上角旋转图标,会重新启动后台服务,应用当前配置好的信息。硬件网关与iNeuOS平台第一次通信时会同步网关的设备和数据点信息,会在当前iNeuOS设备驱动下生成子设备,在子设备上会有iNeuKernel硬件网关的数据点信息。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第8张图片

    iNeuOS工业互联网试用:试用地址

6.   Ocr基本概念

 (1)OCR的应用场景

   根据OCR的应用场景而言,我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR。就前者而言,证件识别以及车牌识别就是专用OCR的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR就是使用在更多、更复杂的场景下,拥有比较好的泛性。在这个过程中由于场景的不确定性,比如:图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲、字体多样等等问题,会带来极大的挑战。

 (2)OCR的技术路线

   典型的OCR技术路线如下图所示:

   其中OCR识别的关键路径在于文字检测和文本识别部分,这也是深度学习技术可以充分发挥功效的地方。PaddleHub为大家开源的预训练模型的网络结构是Differentiable Binarization+ CRNN,基于icdar2015数据集下进行的训练。

   首先,DB是一种基于分割的文本检测算法。在各种文本检测算法中,基于分割的检测算法可以更好地处理弯曲等不规则形状文本,因此往往能取得更好的检测效果。但分割法后处理步骤中将分割结果转化为检测框的流程复杂,耗时严重。因此作者提出一个可微的二值化模块(Differentiable Binarization,简称DB),将二值化阈值加入训练中学习,可以获得更准确的检测边界,从而简化后处理流程。DB算法最终在5个数据集上达到了state-of-art的效果和性能。参考论文:Real-time Scene Text Detection with Differentiable Binarization

   下图是DB算法的结构图:

 

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第9张图片

 

  接着,我们使用 CRNN(Convolutional Recurrent Neural Network)即卷积递归神经网络,是DCNN和RNN的组合,专门用于识别图像中的序列式对象。与CTC loss配合使用,进行文字识别,可以直接从文本词级或行级的标注中学习,不需要详细的字符级的标注。参考论文:An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition

   下图是CRNN的网络结构图:

 

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用_第10张图片


物联网&大数据技术 QQ群:54256083
物联网&大数据项目 QQ群:727664080
QQ:504547114
微信:wxzz0151
博客:https://www.cnblogs.com/lsjwq
微信公众号:iNeuOS

你可能感兴趣的:([免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用)