python + opencv 读取视频中的文字并提取

python + opencv 读取视频中的文字(这里读取摄像头的时间)
(经过多次测试 以下代码报错率有些高 可做参考 生产使用还需完善)

import cv2

from PIL import Image

video_filename = 'rtsp://xxxx/xx/xx'
videoCap = cv2.VideoCapture(video_filename)

# 帧频
fps = videoCap.get(cv2.CAP_PROP_FPS)
# 视频总帧数
total_frames = int(videoCap.get(cv2.CAP_PROP_FRAME_COUNT))
# 图像尺寸
image_size = (int(videoCap.get(cv2.CAP_PROP_FRAME_HEIGHT)), int(videoCap.get(cv2.CAP_PROP_FRAME_WIDTH)))

print(fps)  # 视频帧频
print(total_frames)  # 画面总数
print(image_size)   # 视频图片尺寸


sucess, frame = videoCap.read()
for i in range(1200):
    sucess, frame = videoCap.read()

# img = Image.fromarray(frame)
# img.show()

im = frame[:, :, 0]
#im = im[45:100, 1400:2000] # 只截取时间位置
im = im[45:100, :]     # 确定摄像头时间的范围,索引值注意更换
img = Image.fromarray(im)
# img.show()

#只截取时间位置的话 thresh = 48 为最佳(根据实际情况为定)
thresh = 31
_, im = cv2.threshold(im, thresh, 255, cv2.THRESH_BINARY)
img = Image.fromarray(im)
img.show()  # 获取摄像头中的时间

# 保存图片到指定位置(我这里保存到了D盘)
cv2.imwrite('D:/' + 'img' + '.jpg',im)

这是我拿到的时间
python + opencv 读取视频中的文字并提取_第1张图片
然后是从图片中把文字提取出来
这里下载识别引擎tesseract-ocr:

链接:麻烦百忙之中帮我点个赞,能收藏评论一下就更感谢了~
提取码:s3t0

安装包是麻瓜式.exe,一直next就好.

还有一些操作:

将下载的中文库
中文库

放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中
python + opencv 读取视频中的文字并提取_第2张图片

然后在你的python安装位置python + opencv 读取视频中的文字并提取_第3张图片

将 tesseract_cmd 的值 改为 Tesseract-OCR 的安装路径\tesseract.exe
python + opencv 读取视频中的文字并提取_第4张图片
最后代码只有几行:

import pytesseract
from PIL import Image

# im_en = Image.open('English.png')
im_ch = Image.open(r'D:\img.jpg')

# print('========识别字母========')
# print(pytesseract.image_to_string(im_en), '\n\n')

print('========识别中文========')
print(pytesseract.image_to_string(im_ch, lang='chi_sim'))

最后结果:
在这里插入图片描述

你可能感兴趣的:(python)