https://digi.bib.uni-mannheim.de/tesseract/
github地址:https://github.com/UB-Mannheim/tesseract
下载地址截图
双击程序运行
一般直接点默认即可
注意这一步可以选择自己语言,这里勾选简体中文
(这里不选的话可以点击上面github网址,在里面进行下载并放在相应的路径即可)
在cmd中输入tesseract -v
检测是否安装成功
在cmd中输入tesseract --list-langs
查看安装的语言
命令行输入 tesseract test.png result -l chi_sim
其中-l chi_sim
代表要识别中文
先在对应的环境下安装包
pip install pytesseract
安装完之后找到安装环境目录下面的 pytesseract.py
文件
我这边直接在pycharm中查找更改,点击External Libraries->site-pactages->pytesseract->pysseract.pu
import pytesseract
from PIL import Image
def demo():
# 打开要识别的图片
image = Image.open('test.png')
# 调用image_to_string方法进行识别,
# 传入要识别的图片,lang='chi_sim'是设置为中文识别
text = pytesseract.image_to_string(image, lang='chi_sim')
# 输入所识别的文字
print(text)
if __name__ == '__main__':
demo()
在py中竟然识别错误,cmd命令识别正确Σ(⊙▽⊙"a