2019独角兽企业重金招聘Python工程师标准>>>
任何一款OCR文字识别软件都无法确保100%识别准确,更何况诸多因素的存在,都有可能直接或间接影响识别质量。在使用ABBYY FineReader 12识别或者转换文档的时候也存在同样的状况,今天来给大家盘点一下哪些因素会影响ABBYY FineReader 12的识别质量,学会对症下药才能提高软件识别结果的质量。
哪些因素会影响ABBYY FineReader 12的识别质量?
1、原始图像质量大大影响识别次数和质量。
无论你的原始图像是扫描文件,还是照片形式,如果像素太低,照片模糊不清晰,都会直接导致软件识别不出或者出错,因此在选择ABBYY FineReader 12识别或转换图像文件时,要先确保原始图像质量足够好,才能体验软件的价值。或者你也可以使用软件中的“图像编辑器”功能处理文档图像,具体操作请参阅详解ABBYY FineReader 12的图像编辑器功能。
2、文档语言影响ABBYY FineReader识别质量。
ABBYY FineReader 12可以识别单语言文本和多语言文本。如果文档使用多种语言(包括复杂的脚本语言,如中文、日文)编写,应指定文档所用的语言。
在FineReader 12语言编辑器(工具 > 语言编辑器)对话框中,可以自动选择语言,也可手动指定语言,如果经常使用特定的语言组合,还可为这几种语言新建语言组。
3、文档打印类型影响ABBYY FineReader识别质量。
ABBYY FineReader 12可以自动检测多数文档的打印类型,如果要自动检测打印类型,必须选中选项对话框(工具> 选项 > 文档)中文档类型下的‘自动’选项,在全彩色或黑白模式中处理文档,当然也可以根据需要选取手动选择打印类型。
4、文档布局影响ABBYY FineReader识别质量。
ABBYY FineReader识别结果的质量会受到文档布局的影响。如果文档的结构复杂且元素(如表格、条码)众多,则应检查程序检测到的区域,并手动调整这些区域,这样才能获得更好的识别效果。
此外,ABBYY FineReader在识别书籍的对开页,或者在无法检测到页面方向时,会报出识别错误。
注意:ABBYY FineReader会监测以下操作:图像加载、结构分析、识别和导出。如果出现可能会影响识别质量的情况,应用程序会显示警告或错误消息。