Python使用pytesseract库识别图片文字

在写一个需要用到ORC的小工具,试了一下Tesseract,中文的效果差强人意,已弃坑,转用百度API,但是还是要做一下笔记。

准备

首先需在本机安装Tesseract客户端,然后安装pytesseract库:
pip install pytesseract
没安装过PIL的也要安装一下,因为所调用的第一个参数是由Image类返回:
pip install PILLOW

实例

import pytesseract
from PIL import Image

img = Image.open("D://aa.jpg")
text = pytesseract.image_to_string(img, lang="chi_sim")
print(text)

你可能感兴趣的:(Python)