Tesseract-OCR的安装和使用

参考:
Tesseract-OCR的安装和使用
1、Tesseract-OCR安装包的下载:
下载地址:添加链接描述
Tesseract-OCR的安装和使用_第1张图片
Tesseract-OCR的安装和使用_第2张图片
等待下载完成
2、添加语言包:
语言包下载地址:添加链接描述
Tesseract-OCR的安装和使用_第3张图片
语言包下载完成后放入Tesseract-OCR的tessdata中。
3、安装Tesseract-OCR
点击exe可执行文件,进行安装,一直点击next,完成安装。
4、安装完成后配置环境变量
打开此电脑中高级属性设置,
配置环境变量
Tesseract-OCR的安装和使用_第4张图片
5、在path变量中增加自己的Tesseract-OCR安装路径
在这里插入图片描述
6、添加语言包环境变量;
Tesseract-OCR的安装和使用_第5张图片
设置变量名和变量值如下:
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract_OCR\tessdata(自定义的语言包位置)

Tesseract-OCR的安装和使用_第6张图片
配置完成后点击确定。
7、测试安装是否成功
win+R,打开cmd
命令行中输入:tesseract --version
Tesseract-OCR的安装和使用_第7张图片
8、查看可支持的语言:
命令行中输入:tesseract --list-langs
在这里插入图片描述
使用:
1、默认是能识别英文和数字

tesseract 被识别的图片路径 存放识别结果的文本文件路径

2、添加中文语言包后可以识别中文

tesseract 被识别的图片路径 存放识别结果的文本文件路径 -l chi_sim

你可能感兴趣的:(beautifulsoup)