Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果

1,下载安装Tesseract-OCR 安装,链接地址Index of /tesseract

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果_第1张图片

2,安装成功 tesseract -v

注意:安装后,要添加系统环境变量

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果_第2张图片

3,cmd指定目录到 cd C:\Work\BlogsTest\TestPic,要识别图片的文件夹 识别:tesseract test.png result -l chi_sim

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果_第3张图片

识别成功的效果,result.txt文件会自动生成

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果_第4张图片

要注意:Tesseract-OCR的安装目录要包含识别中文的字符集chi_sim.traineddata,可以在GitHub下载GitHub - tesseract-ocr/tessdata: Trained models with support for legacy and LSTM OCR engine

你可能感兴趣的:(Tesseract-OCR,训练数据,中文识别,c#,ocr)