番外2. OpenCV 中摄像头捕获与视频处理与常见问题解决方案

本系列专栏写作方式

本系列专栏写作将采用首创的问答式写作形式，快速让你学习到 OpenCV 的初级、中级、高级知识。

2. OpenCV 中摄像头捕获与视频处理

OpenCV 除了应用在图像处理领域外，还会应用到视频处理领域，接下来我们就将学习到，如何通过Python OpenCV 对摄像头捕获或者视频文件进行处理。

视频文件将从三个方向入手，分别是读取文件，显示视频，保存视频。

本文将为你核心解决以下2个函数：cv2.VideoCapture 与 cv2.VideoWrite，基于这2个函数，会衍生出其它相关函数，具体参照下文。

在 OpenCV 中操作摄像头相关注意事项和解决方案

摄像头相较于视频，差异在一个是实时图像，一个是既定内容。如果想要捕获到视频，用到的是cv2.VideoCapture 函数，该函数的第一个参数是设备的索引号，如果你使用的是笔记本电脑，默认一般是0，表示的内置摄像头，如果链接了外置，可以修改该数字即可。

最简单的测试代码如下：

import cv2
import numpy as np

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()

    # 转变成灰度图
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow("frame", gray)
    if cv2.waitKey() & 0xFF == ord("x"):
        break

# 关闭摄像
cap.release()
cv2.destroyAllWindows()

该代码在运行时，如果你电脑未安装摄像头或者驱动异常，都会导致报错，例如下述BUG

error: (-215:Assertion failed) !_src.empty() in function 'cv::cvtColor'

该问题虽然报错出现在 cv2.cvtColor函数，但是原因是 frame 为空，即cap.read()读取失败导致的。

这里在实际编码过程中，需要增加一个判断，cap.read() 函数会返回一个状态布尔值，如果读取到数据，返回真，否则返回假，测试如下代码（下述代码的停止，需要按键盘上的CTRL+C ）：

import cv2
import numpy as np

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    print(ret)

# 关闭摄像
cap.release()
cv2.destroyAllWindows()

测试完毕之后，我们修改本文一开始的代码，让其更加健壮。

while True:
    ret, frame = cap.read()
    if ret:
        # 转变成灰度图
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        cv2.imshow("frame", gray)
        # pass ...

这里存在一个常见，但是及容易被忽视的问题，就是很多时候，我们并不知道电脑上有没有摄像头，或者摄像头的设备号，该如何进行操作。

你可以按照下述代码进行检测：

import cv2
import numpy as np


for cn_num in range(0, 5):
    cap = cv2.VideoCapture(cn_num)
    if cap.isOpened():
        break

以上代码运行的原理是，按照顺序依次打开设备 0~5，当发现摄像头被成功打开，返回跳出。

上述代码还提及了一个新的函数 cap.isOpened，该函数用来检测摄像头是否初始化（能被打开），初始化成功返回 True。

在 OpenCV 中操作视频文件相关注意事项和解决方案

其实操作视频文件与操作摄像头操作基本一致，唯一修改的就是cv2.VideoCapture 函数设备号即可。

这里将设备号修改为视频文件路径。

接下来，我们先看一段代码，认识基本用法。

import numpy as np
import cv2

cap = cv2.VideoCapture('test.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    # gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    cv2.imshow('frame', frame)
    if cv2.waitKey(25) & 0xFF == 27:
        break

cap.release()
cv2.destroyAllWindows()

其中最需要注意的一个地方，不是 cv2.VideoCapture('test.mp4') 函数读取文件，而是 cv2.waitKey(25)，这个地方需要设置好对应的视频，如果数值特别小，例如 1，视频就会快速播放，设置太高播放又会变慢，一般建议设置为 25。

当然，上述代码注释的部分，如果取消，就会变成一个灰度视频。

甚至可以直接将视频进行翻转，用到函数为：cv2.flip(frame, 0)，

import numpy as np
import cv2 

cap = cv2.VideoCapture('test.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if ret == True:
        frame = cv2.flip(frame, 0)

        cv2.imshow('frame', frame)
        if cv2.waitKey(25) & 0xFF == 27:
            break

cap.release()
cv2.destroyAllWindows()

上述代码运行如下：

a325e56a7c294705a5dbb7475a6fc3a2[1].png

接下来我们用视频来学习一下一些操作属性的方法。

cv2.VideoCapture.get(propId) 可以访问视频的某些功能，其中 propId 是一个从0到18的数字，每个数字表示视频的属性。

取值清单如下（该清单只作为查询参考使用）：

0 - cv2.CAP_PROP_POS_MSEC：视频文件的当前位置（ms）；
1 - cv2.CAP_PROP_POS_FRAMES：从0开始索引帧，帧位置；
2 - cv2.CAP_PROP_POS_AVI_RATIO：视频文件的相对位置（0表示开始，1表示结束）；
3 - cv2.CAP_PROP_FRAME_WIDTH：视频流的帧宽度；
4 - cv2.CAP_PROP_FRAME_HEIGHT：视频流的帧高度；
5 - cv2.CAP_PROP_FPS：帧率；
6 - cv2.CAP_PROP_FOURCC ：编解码器四字符代码；
7 - cv2.CAP_PROP_FRAME_COUNT ：视频文件的帧数；
8 - cv2.CAP_PROP_FORMAT：retrieve()返回的Mat对象的格式；
9 - cv2.CAP_PROP_MODE ：后端专用的值，指示当前捕获模式；
10 - cv2.CAP_PROP_BRIGHTNESS ：图像的亮度，仅适用于支持的相机；
11 - cv2.CAP_PROP_CONTRAST ：图像对比度，仅适用于相机；
12 - cv2.CAP_PROP_SATURATION：图像饱和度，仅适用于相机；
13 - cv2.CAP_PROP_HUE：图像色调，仅适用于相机；
14 - cv2.CAP_PROP_GAIN：图像增益，仅适用于支持的相机；
15 - cv2.CAP_PROP_EXPOSURE：曝光，仅适用于支持的相机；
16 - cv2.CAP_PROP_CONVERT_RGB：布尔标志，指示是否应将图像转换为RGB；
17 - cv2.CAP_PROP_WHITE_BALANCE：目前不支持；
18 - cv2.CAP_PROP_RECTIFICATION：立体摄像机的整流标志。

有了上述清单，可以获取视频较多的属性值了，例如获取宽度与高度。

cap = cv.VideoCapture('test.mp4')
print("宽度：%s,高度：%s" % (cap.get(3), cap.get(4)))

有 get 方法，对应的就存在 set 函数，函数原型如下：

cap.set(propId，value) # 进行修改，value 是修改后的值

但这个地方要注意下，上面 set 函数只对采集摄像头有用，如果读取的是视频文件，上述内容就不在起作用了。

如果你还是希望实现修改视频文件的窗口大小，那可以使用下述方案。

cv2.namedWindow("frame", 0)
cv2.resizeWindow("frame", 800,300)

如果想希望查看视频播放的当前位置、帧率、帧数，可以直接使用下述代码。

time = cap.get(cv2.CAP_PROP_POS_MSEC)
fps = cap.get(cv2.CAP_PROP_FPS)
total_frames = cap.get(cv2.CAP_PROP_FRAME_COUNT)

当然，使用属性值也可以。

time = cap.get(0)
fps = cap.get(5)
total_frames = cap.get(7)

在 OpenCV 中捕获视频并保存

图片的保存使用函数 cv2.imwrite即可实现，但视频保存，需要与cv2.VideoCapture对应着，创建一个 VideoWriter对象，而且还需要确定文件的名称，视频 FourCC 编码，频率，帧大小，isColor标签，该标签如果为 True 则保存彩色图，否则是灰度图。

首先对 FourCC 进行一下说明，该编码是一个4字节码，表示的是视频编码格式。

例如对于 MJPG，它有两种写法。

注意这是 OpenCV 3 写法，网上现在大多数博客都是 OpenCV 2 写法。

cv2.VideoWriter_fourcc('M', 'J', 'P', 'G')
cv2.VideoWriter_fourcc(*'MJPG')

常见编码说明：

MJPG编码器编码的视频非常大；
X264 编码器编码的视频很小；
XVID编码器优先选择，质量较高且体积较小。

cv2.VideoWriter函数原型如下：

cv2.VideoWriter( filename, fourcc, fps, frameSize[, isColor] )