ABBYY FineReader 14之如何选择正确的OCR选项

在使用ABBYY FineReader 14识别文档时,要想获得快速准确的结果,选择正确的OCR选项很重要,决定好要使用的选项之后,还应该考虑文档的类型和复杂性,以及如何去使用识别结果。

OCR选项位于ABBYY FineReader‘选项’对话框的OCR选项卡上(点击工具 > 选项…打开此对话框)。

ABBYY FineReader 14可以自动识别添加到OCR项目的任何页面,当前选定的选项将用于OCR过程,你也可以在图像处理选项卡上关闭最新添加的图像的自动分析和OCR。

注意:如果在文档识别之后修改OCR选项,需再次运行OCR过程,通过新选项识别文档。

1、PDF识别模式

这些设置仅适用带有文本层和图片的PDF文档,这种PDF文档通常从可编辑格式的文档创建,其他类型的PDF文档,比如可搜索的PDF文档和仅图像PDF文档,通常在‘使用OCR’模式中处理,处理这种类型的PDF文档无需额外的设置。

有三种识别模式可以使用:

•自动在OCR和PDF中的文字之间选择

程序会检测文本层,如果它包含高质量的文本,便使用现有的高质量文本层,OCR将用于创建新的文本层。

•使用OCR

OCR将用于创建新的文本层,这种模式花费的时间更多,但更适用于文本层质量较差的文档。

•仅使用PDF中的文字

这是带有文本层PDF文档的默认模式,程序会使用原始文本层,无需运行OCR。

2、在OCR速度和准确度之间平衡

ABBYY FineReader 14可以让你:

•通篇识别

在这种模式下,FineReader 14既可以分析和识别简单的文档,也可以分析识别布局复杂的文档。这种识别需要更多时间,但最终的效果也更好。

•快速识别

这种模式建议用于处理布局简单且图像质量较好的较大文档。

3、检测结构元素

选择你希望程序检测的结构元素:页眉和页脚、脚注、目录以及编号列表,保存文档之后,选中的元素将可点击。

4、条码

如果你的文档包含条码,你希望将它们转化为字符串和数字,而不是保存为图片,则勾选‘转化条形码为字符串’,该功能通常是默认禁用的。

有关ABBYY FineReader 14的更多内容,请点击访问ABBYY教程了解更多信息。

你可能感兴趣的:(ABBYY文字识别)