如何提高OCR准确度(Acc)

 

 

 

说到文字识别--OCR技术,当下已被人们广泛使用, 许多公司通过采用OCR技术,将现有的工作流程和业务流程进行了极大的改进。人们在开源对技术上,不断推陈出新,OCR识别技术准确率也不断提升,在生产力方面取得效果也越来越突出。虽然提高OCR准确度不是一夜之间可以做到的事情,但人们肯定会在适当的时候尝试这样做。

那么如何来微调(finetune)他们的OCR模型呢?嗯,有不同的方法来实现这一目标。我们Infrrd请记住以下提示:

准确度可以在字符(字)级别实现。 ->character level准确度可以在单词(词语)级别获得。 ->word level在字符级别的准确性上,OCR能力判断依据是: 它识别正确字符的频率,而不是识别错误字符的频率。类似地,字级准确度意味着OCR识别正确字的频率。Infrrd OCR对于扫描的不同类型的文档具有不同的准确度水平,但我们使其至少达到 >70% 的准确度。

为了提高我们的OCR引擎的现有准确性,我们遵循以下步骤:

1.检查源图像质量:

我们的专家确保原始源图像足够可见,以便它们可以获得更好的OCR结果。首先扫描模糊图像是没有意义的。OCR应该能够识别高对比度,字符边界,像素噪声和对齐字符。

2.选择最好的OCR模型:

众所周知,OCR主要负责理解给定图像中的文本,因此有必要选择能够以更好的方式预处理图像的正确图像。我们的软件做得很好。尽管如此,我们仍然不断更新它,以使结果更准确。

3.将图像缩放到合适的大小:

我们尝试将图像缩放到大约300 dpi的标准尺寸。任何低于此尺寸的图像都会产生不清晰的结果,而高于600 dpi的图像会使输出文件变大而质量不高。

4.增强图像对比度:

在OCR中扫描图像之前,对比度和密度是需要考虑的重要因素。我们处理图像以增强这些因素以获得更清晰的输出。

5.消除图像中的噪音:

如果图像中存在背景或前景噪声,我们会将其删除,以便我们获得高质量的数据提取。

6.正确准备和处理文件:

我们确保可以将任何大小的文档加载到扫描仪中。此外,我们的捕获软件减少了文档准备时间,因为它们被送入这些扫描仪。

7.纠正和分析页面布局:

在预处理阶段,重要的是校正页面以使字线是水平的。我们尝试降低页面布局的复杂性,以帮助OCR以更准确的方式识别文本边界。

8.分析角色边缘:

捕获工具和光学字符识别软件必须能够优化字符边缘,以便在提取结果时所需的劳动力最少。

9.使用过滤器,数据库和同义词库:

应特别注意减少错误。这就是为什么我们使用语言过滤器,数据库和同义词库,以便提取的结果有意义,不需要进一步检查。

我们一直在尝试和测试新方法,以便在提取后获得更准确的结果。然而,这不是一夜之间的过程,它需要彻底了解预处理步骤才能获得动力。首先,了解必须扫描的文档的缺陷是非常重要的。只有这样才能采取必要的措施来提高OCR的准确性。

你可能感兴趣的:(文本检测)