基于Tesseract的带位置离线OCR

基于Tesseract的带位置离线OCR


DrGraph QQ:282397369

过年哪里也去不了,尝试研究一下自己的文字识别需求。东折腾西折腾,居然用Tesseract达到一定效果。随便拿一张App Store的屏幕图像进行测试。
基于Tesseract的带位置离线OCR_第1张图片
识别耗时1334毫秒,本地的速度比网络速度还是要快些。具体含位置的识别结果为:


	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	


把识别结果和原图对比一下,就直观很多
基于Tesseract的带位置离线OCR_第2张图片
总的来说,该对的地方都差不多对了。也算是2020年的做第一个小工作。
先自己用,测试得差不多之后再做成一个小工具。

你可能感兴趣的:(基于Tesseract的带位置离线OCR)