python 利用tesseract识别文字报错(内含中文包下载地址)

已安装tesseract-ocr-w32-setup-v4.0.0.20181030.exe(tesseract下载地址),已配置系统环境,python已下载pytesseract模块,

运行程序时仍报错:pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files (x86)\\Tesseract-OCR/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

有可能是你没有安装中文包‘chi_sim’

可以通过tessdata目录查看是否安装中文包,如下图则为未安装

python 利用tesseract识别文字报错(内含中文包下载地址)_第1张图片

各版本语言包下载路径:

https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

由于我安装的tesseract-ocr是4.0版本的,所以这里下载的中文包是4.0的

python 利用tesseract识别文字报错(内含中文包下载地址)_第2张图片

继续往下翻还有别的版本对应的语言包,按需所取

python 利用tesseract识别文字报错(内含中文包下载地址)_第3张图片

下载好以后,把中文包放置在tessdata目录下即可。

python 利用tesseract识别文字报错(内含中文包下载地址)_第4张图片

 

 

你可能感兴趣的:(python 利用tesseract识别文字报错(内含中文包下载地址))