python中使用OCR 技术进行《文字识别》

安装tesseract-ocr-setup-3.02.02  并配置环境变量

链接:https://pan.baidu.com/s/1c3vIslq 密码:px5g

打开CMD 键入以下代码 安装依赖模块

pip install pytesseract

pip install pillow


安装 pytesseract 模块

附上python代码

# 导入组件

from uiautomatorimport deviceas d

import pytesseract

from PILimport Image

import os

import time

# 函数入口

def main():

print("脚本初始化")

dinfo=d.info#获取设备信息

    print(d.info)

print(dinfo.get("displayHeight"))

print("设备宽度{}".format(dinfo.get("displayWidth")))

print("设备宽度{}".format(dinfo.get("displayWidth")))

print("屏幕方向为{}".format(d.orientation))

d.click(143,462)

im=Image.open("QQ图片20180125224702.png")

tessdata_dir_config ='--tessdata-dir "C:\\my\develop\\ORC\\Tesseract-OCR\\tessdata"'

    code = pytesseract.image_to_string(im,lang='chi_sim',config=tessdata_dir_config)

print(code)

# or

# 执行代码

main()


注意!注意!注意

tesseract版本与其目录下的训库语言存在版本兼容性  

不同版本 tesseract 请下载  对应的训练库

点击进入最新语言库

你可能感兴趣的:(python中使用OCR 技术进行《文字识别》)