视频入门 OpenCV v4.7.0

目标

  • 学习阅读视频、显示视频和保存视频。
  • 学会从摄像机中捕捉视频并显示它。
  • 你将学习这些函数:cv.VideoCapture(), cv.VideoWriter()

从摄像机中捕获视频

通常情况下,我们必须用摄像机来捕获实时流。OpenCV提供了一个非常简单的接口来做到这一点。让我们从摄像头(我使用的是笔记本电脑上的内置网络摄像头)捕捉一段视频,将其转换成灰度视频并显示出来。只是一个简单的任务就可以开始了。

为了捕捉视频,你需要创建一个VideoCapture对象。它的参数可以是设备索引或视频文件的名称。设备索引只是用来指定哪个摄像机的数字。通常情况下,会有一台摄像机被连接(如我的情况)。所以我只需传递0(或-1)。你可以通过传递1来选择第二台摄像机,以此类推。之后,你就可以逐帧地捕捉。但在最后,不要忘记释放捕获。

Python
import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)
if not cap.isOpened():
    print("Cannot open camera")
    exit()
while True:
    # 逐帧捕捉
    ret, frame = cap.read()
    # 如果帧被正确读取,ret为真
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    # 我们在帧上的操作来自于此
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    # 显示产生的帧
    cv.imshow('frame', gray)
    if cv.waitKey(1) == ord('q'):
        break
# 当一切都完成后,释放捕捉的帧。
cap.release()
cv.destroyAllWindows()

cap.read()返回一个bool(True/False)。如果该帧被正确读取,它将是True。所以你可以通过检查这个返回值来检查视频是否结束。

有时,cap可能没有初始化捕获。在这种情况下,这段代码会显示一个错误。你可以通过**cap.isOpened()**方法检查它是否被初始化了。如果是 “True”,则是OK。否则就用cap.open()打开它。

你也可以使用cap.get(propId) 方法访问这个视频的一些功能,其中propId是一个从0到18的数字。每个数字表示该视频的一个属性(如果它适用于该视频)。完整的细节可以在这里看到:cv::VideoCapture::get()。其中一些值可以用**cap.set(propId, value)**来修改。Value是你想要的新值。

例如,我可以通过cap.get(cv.CAP_PROP_FRAME_WIDTH)cap.get(cv.CAP_PROP_FRAME_HEIGHT)检查帧的宽度和高度。它给我的默认值是640x480。但我想把它修改为320x240。只要用ret = cap.set(cv.CAP_PROP_FRAME_WIDTH,320)ret = cap.set(cv.CAP_PROP_FRAME_HEIGHT,240)
cv.CAP_PROP_FRAME_WIDTH
cv.CAP_PROP_FRAME_HEIGHT

注意
如果你得到一个错误,请确保你的相机使用任何其他相机应用程序(如Linux中的Cheese)工作正常。

从文件中播放视频

从文件中播放视频与从摄像机中捕捉视频是一样的,只是把摄像机索引改为视频文件名。另外,在显示帧的时候,为cv.waitKey()使用适当的时间。如果时间太短,视频就会很快,如果时间太长,视频就会很慢(嗯,这就是你如何在慢动作中显示视频)。在正常情况下,25毫秒就可以了。

Python
import numpy as np
import cv2 as cv
cap = cv.VideoCapture('vtest.avi')
while cap.isOpened():
    ret, frame = cap.read()
    # 如果帧被正确读取,ret为真
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    cv.imshow('frame', gray)
    if cv.waitKey(1) == ord('q'):
        break
cap.release()
cv.destroyAllWindows()

cv.VideoCapture
print
cv.cvtColor
cv.imshow
cv.waitKey
cv.destroyAllWindows

注意事项
请确保安装了正确版本的ffmpeg或gstreamer。有时,使用视频捕捉是一件令人头痛的事,主要是由于错误地安装了ffmpeg/gstreamer。

保存视频

所以我们捕获了一段视频并逐帧处理,我们想保存该视频。对于图像来说,这非常简单:只需使用cv.imwrite()。在这里,需要多做一点工作。

这一次我们创建一个VideoWriter对象。我们应该指定输出文件名(例如:output.avi)。然后我们应该指定FourCC代码(详情见下段)。然后应该传递每秒的帧数(fps)和帧大小。最后一个是isColor标志。如果它是 “True”,编码器就会期待彩色帧,否则就会使用灰阶帧。

FourCC是一个4字节的代码,用于指定视频编解码器。可用代码的列表可以在fourcc.org上找到。它取决于平台。以下编解码器对我来说工作正常。

  • 在Fedora中。divx, xvid, mjpg, x264, wmv1, wmv2。(XVID是更可取的。MJPG的结果是高尺寸的视频。X264提供非常小尺寸的视频)
  • 在Windows中。DIVX (更多有待测试和添加)
  • 在OSX中:MJPG(.mp4),DIVX(.avi),X264(.mkv)。
    FourCC代码传递为cv.VideoWriter_fourcc(‘M’,‘J’,‘P’,‘G’)cv.VideoWriter_fourcc(*‘MJPG’)用于MJPG。

下面的代码从一个摄像机中捕获,在垂直方向上翻转每一帧,并保存视频:

import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)
# 定义编解码器并创建VideoWriter对象
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi', fourcc, 20.0, (640,  480))
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        print("Can't receive frame (stream end?). Exiting ...")
        break
    frame = cv.flip(frame, 0)
    # 写下翻转的帧
    out.write(frame)
    cv.imshow('frame', frame)
    if cv.waitKey(1) == ord('q'):
        break
# 如果工作完成了,就释放所有帧
cap.release()
out.release()
cv.destroyAllWindows()

cv.flip

你可能感兴趣的:(OpenCV,4.7.0,说明文档,opencv,音视频,计算机视觉)