环境:Pycharm + python3.7 + opencv
使用Tesseract再Python OCR中使用opencv进行文本检测
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img = cv2.imread('2.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
print(pytesseract.image_to_string(img)) #文本
print(pytesseract.image_to_boxes(img)) #文本框框信息(x,y,w,h)
img = cv2.resize(img, (0,0), fx=0.3, fy=0.3)
# cv2.namedWindow("Result",cv2.WINDOW_FREERATIO)
cv2.imshow('Result', img)
cv2.waitKey(0)
原图:
检测出的文本:
检测出的文本的相关信息(x,y,w,h):