市场上热门文档识别性能测评对比

经济日益繁荣,随之而来的是多如牛毛的合同、文件、表单和票据。数字时代,如何效率保存、处理和分享这些纸质文件是当下办公日常主要工作之一。

随着人工智能识别技术的普及应用,这一问题得到了解决,市面上相继出现了不少文档识别OCR工具,这些OCR工具各有长短侧重,选择一款适合自己的OCR工具,在日常工作学习中,必能事半功倍。

对于用户来说,一款文档识别OCR工具好不好用,关键在于是否准确,是否快速。下面我们挑了市面上三款比较火热的OCR识别软件(云脉、文通和ABBYY)的测试数据,来看看他们各自的优缺点。

测试版本:
云脉_安卓_20181222_V9.2.7.1
ABBYY_安卓_1.9.1
云脉_PC_20160711
ABBYY_PC_FineReader 12
文通-翔云web端文档识别20190416

测试内容:分别测试中文、英文、欧文以及不同类型的文档识别率

测试样本:文档测试图像共85张

市场上热门文档识别性能测评对比_第1张图片

从测试结果中,我们发现:

①不论是云脉还是ABBYY,在中文和欧文的识别上,两者PC端的表现都优于安卓移动端,两者对欧文的识别率整体要高于中文识别率;

②在中文识别上,云脉的识别率要高于ABBYY识别率(不论是500W还是800W);但是在英文和欧文识别上,ABBYY优势明显,高达99.54%;

③在欧文识别上,ABBYY安卓移动端识别率要高于云脉安卓移动端的识别率;云脉PC端识别率略高于ABBYY PC端识别率,文通欧文识别效果不佳;

在测试过程中,我们还发现:

云脉、文通ABBYY,三者在光线暗、模糊和小字体等情况下容易出现乱码或是识别错误。环境光线问题和原文件的文字模糊仍然会影响到识别结果,其中,ABBYY在模糊图片的中间部分,容易整行漏识别。

测试版本:
云脉_20190831_深度学习(导入)
ABBYY FineReader 14_20190821
文通_web_20190831

测试内容:模糊图片、清晰图片(不同状态下的识别准确率)和所需要的识别时间

测试样本:8张清晰、中等模糊

市场上热门文档识别性能测评对比_第2张图片


从测试结果中,我们发现:

云脉、文通、ABBYY,三者对清晰图片的识别能力相对成熟,均达90%以上,其中云脉对清晰图片的识别更是高达98.33%,识别时间只需3.669秒。

文通和ABBYY对模糊图片的识别效果不佳,文通模糊图片识别率只有46.63%,ABBYY识别率只有50.33%,后者需要花费的平均识别时间更长,达13.13秒,总体上来说识别水平有待提升,识别时间略长。

人工手动录入和OCR录入比起来,不论是速度还是准确率都不是那么尽如人意。选择一款适合自己的OCR工具,可以大大解放从业人员的双手,提升纸质文档电子化效率,提升办公效率。

你可能感兴趣的:(OCR技术,文字识别)