自写项目——实现tesseract-ocr功能_项目规划

自写服务端-客户端 实现tesseract-ocr功能——项目规划

跟据老师需求,我要实现一个可以通过移动端实现一个有一下功能的小项目:



OCR图像识别系统

1.系统介绍:

该系统以识别图片或PDF文件中文字为目标,可以对手写体和打印体进行识别,并具备自我训练的功能,从而提高其识别的正确率。

 

客户端:可用web实现或手机app

服务端:远程服务器

OCR 引擎:谷歌tesseract-ocr引擎

2.系统功能:

系统能够通过客户端接受到所要识别的图片或PDF文件,并对其进行识别,转换成计算机文字将结果返回到客户端。在客户端可以人工对其进行更错,然后将错误的文字返回到服务端,服务端将把错误的文字和相应图像储存到database中,当下次再次遇到该字,可以正确识别,以提高其识别正确率。

 

 

 

3.功能模块架构:

 自写项目——实现tesseract-ocr功能_项目规划_第1张图片

  

4.模块介绍:

文件I/O模块:

通过移动)PC终端(webapp)接受到用户传进的文件,并通过发送到远程的服务器。当文件被处理后,返回其生成的文件,并通过(移动)PC终端显示出来。

 

OCR模块:

对接受到的图片或PDF文件进行处理,图像识别,输出识别出的计算机文字。

 

人工更正错字模块:

将识别出的计算机文字返回到客户端,由客户端人工对OCR模块输出的计算机文字进行更正,保存更正的文字及其对应的图像。

 

训练模块:

对人工更正的错字进行储存整理与分析,并将其图像和其正确的文字储存到database中,一一对应,当该系统再次与遇到该类错字的时候,能保证其再次遇到该字,进行正确转化。当其正确率带到一定程度,就终止训练,允许小程度的错误,以提高程序效率。

 

 

 

 

 

 

 



你可能感兴趣的:(ORC)