pytesseract 模块的使用

pytesseract 是一个文字识别模块,现将安装、使用记录如下:

安装模块

pip3 install pytesseract

pip3 install opencv-python # 图形处理软件包

pip3 install pillow # PIL用于打开图片文件

安装程序

安装识别软件,并设置环境参数(tesseract-ocr-w32-setup-v5.3.0.20221214.exe):

安装目录:C:\usr\Tesseract-OCR

设置环境变量:PATH

使用案例

使用白名单可以极大提高识别准确度,从30%提高到95%,请参照以下语句

pytesseract.image_to_string(im_01, config="-c tessedit_char_whitelist=0123456789 --psm 7")

直接识别,不处理截图

参考资料

你可能感兴趣的:(python,python)