python + opencv 读取视频中的文字(这里读取摄像头的时间)
(经过多次测试 以下代码报错率有些高 可做参考 生产使用还需完善)
import cv2
from PIL import Image
video_filename = 'rtsp://xxxx/xx/xx'
videoCap = cv2.VideoCapture(video_filename)
# 帧频
fps = videoCap.get(cv2.CAP_PROP_FPS)
# 视频总帧数
total_frames = int(videoCap.get(cv2.CAP_PROP_FRAME_COUNT))
# 图像尺寸
image_size = (int(videoCap.get(cv2.CAP_PROP_FRAME_HEIGHT)), int(videoCap.get(cv2.CAP_PROP_FRAME_WIDTH)))
print(fps) # 视频帧频
print(total_frames) # 画面总数
print(image_size) # 视频图片尺寸
sucess, frame = videoCap.read()
for i in range(1200):
sucess, frame = videoCap.read()
# img = Image.fromarray(frame)
# img.show()
im = frame[:, :, 0]
#im = im[45:100, 1400:2000] # 只截取时间位置
im = im[45:100, :] # 确定摄像头时间的范围,索引值注意更换
img = Image.fromarray(im)
# img.show()
#只截取时间位置的话 thresh = 48 为最佳(根据实际情况为定)
thresh = 31
_, im = cv2.threshold(im, thresh, 255, cv2.THRESH_BINARY)
img = Image.fromarray(im)
img.show() # 获取摄像头中的时间
# 保存图片到指定位置(我这里保存到了D盘)
cv2.imwrite('D:/' + 'img' + '.jpg',im)
这是我拿到的时间
然后是从图片中把文字提取出来
这里下载识别引擎tesseract-ocr:
链接:麻烦百忙之中帮我点个赞,能收藏评论一下就更感谢了~
提取码:s3t0
安装包是麻瓜式.exe,一直next就好.
还有一些操作:
将下载的中文库
放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中
将 tesseract_cmd 的值 改为 Tesseract-OCR 的安装路径\tesseract.exe
最后代码只有几行:
import pytesseract
from PIL import Image
# im_en = Image.open('English.png')
im_ch = Image.open(r'D:\img.jpg')
# print('========识别字母========')
# print(pytesseract.image_to_string(im_en), '\n\n')
print('========识别中文========')
print(pytesseract.image_to_string(im_ch, lang='chi_sim'))