前期准备
tesseract-OCR下载、配置及基本使用
下载地址:
下载源:https://digi.bib.uni-mannheim.de/tesseract/
根据自身硬件情况下载对应版本即可
1.将安装包直接一路安装
2.打开 计算机-->右键-->高级系统设置-->环境变量
在 系统变量-Path中添加tesseract的安装路径
新建系统变量
变量名:TESSDATA_PREFIX
值:D:\Tesseract-OCR\tessdata
验证是否配置成功,可使用cmd命令,如下结果即为成功
C:\XXX\XXX>tesseract --version
tesseract v5.0.0.20190623
leptonica-1.78.0
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
Found AVX2
Found AVX
Found SSE
1.打开cmd命令窗口
2.验证码提取的输入格式:tesseract 图片路径 输出文件(是个TXT文件)
例:tesseract D:\待使用图片路径\image.png D:\待输出文件路径\result.txt
注:图片格式支持JPG、png,其他格式没试过,不清楚
https://github.com/tesseract-ocr/tessdoc
https://tesseract-ocr.github.io/tessdoc/Data-Files
Python安装pytesseract
- 本人使用的pycharm,以pycharm为例
- File–>Settings for New Projects–>Project Interpreter–>右上角"+"
- 在弹出的搜索框中搜索pytesseract,搜索出结果后可点击下方install package进行安装,默认安装最高版本,可通过选中Specify version后进行历史版本选择
开始操作
- 开始前准备工作–确认当前电脑系统的显示比例
- 可通过 设置-显示 进行查看当前的显示比例
- 分辨率是否有影响暂时不明
- 代码实现
from selenium import webdriver
from PIL import Image
import pytesseract
import time
if __name__ == '__main__':
driver = webdriver.Chrome()
driver.maximize_window()
driver.get(url)
time.sleep(3)
driver.save_screenshot('D:\\Study\\img\\printscreen.png')
imgelement = driver.find_element_by_xpath('xpath')
location = imgelement.location
size = imgelement.size
left = location['x']*1.25
top = location['y']*1.25
right = (location['x'] + size['width'])*1.25
botom = (location['y'] + size['height'])*1.25
local = (left, top, right, botom)
i = Image.open("D:\\Study\\img\\printscreen.png")
result = i.crop(local)
result = result.convert('RGB')
result.save('D:\\Study\\img\\save.jpg')
text = pytesseract.image_to_string(Image.open('D:\\Study\\img\\save.jpg'))
print(text)
driver.find_element_by_xpath('xpath').send_keys(text)
- 参考文章及资料
http://www.manongjc.com/detail/6-qexgtqevkuctzzh.html
https://blog.csdn.net/qq_42278240/article/details/90573652
感谢!