在我的上一篇文章"基于python opencv-python 的录制并保存USB摄像头视频(无声版)"写了无声版的保存视频,总觉得缺少些什么,今天把有声版的也公布出来,供大家一起学习。
先说一下总思路,利用cv2生成视频文件,在利用其它库生成音频文件,最后将两个文件合并,这一操作将用到FFmpeg,就成了带音的视频。
缺点是:需要手动调整声音和视频同步。(修改视频的FPS 帧率)
(安装即可)
opencv-python == 4.2.0.32 视频处理
sounddevice == 0.3.15 声音处理驱动
SoundFile == 0.10.3 声音文件操作
pynput == 1.6.8 按键监视
0.功能:ffmpeg :用于音频和视频的合并操作
1.下载: 下载地址得到的是zip文件,若下载失效,可到其官网下载:
2.环境配置:解压到你需要放置的位置,不需要安装,再者需要把bin下的目录配置的Path环境变量
3.测试:打开cmd命令行,输入“ffmpeg ”,显示如下,则说明安装成功。
在本例中会用到四个独立文件,各自内容如下代码,其中Video_main.py是整个项目的启动文件:
Video_main.py文件
"""
使用python实现:读取USB摄像头的画面
"""
# 导入CV2模块
import cv2
import os
import datetime
def read_usb_capture():
# 选择摄像头的编号
cap = cv2.VideoCapture(0)
# 添加这句是可以用鼠标拖动弹出的窗体
cv2.namedWindow('real_img', cv2.WINDOW_NORMAL)
# .mp4格式 , 25为 FPS 帧率, (640,480)为大小
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
out = cv2.VideoWriter('temp.mp4', fourcc, 25, (640, 480))
while(cap.isOpened()):
# 读取摄像头的画面
ret, frame = cap.read()
# 进行写操作
out.write(frame)
# 真实图
cv2.imshow('real_img', frame)
# 按下'esc'就退出
if cv2.waitKey(1) & 0xFF == 27:
break
# 释放画面
cap.release()
cv2.destroyAllWindows()
if __name__ == '__main__':
os.system("start cmd_.vbe") #启动录音
read_usb_capture() # 启动摄像
name = datetime.datetime.now().strftime('%Y-%m-%d_%H-%M-%S') # 当前的时间
os.system("ffmpeg -i temp.mp4 -i temp.wav -strict -2 -f mp4 " + name + ".mp4") # 利用ffmpe 进行合并
os.remove('temp.mp4') # 删除中间视频文件
os.remove("temp.wav") # 删除中间音频文件
sound.py文件
import threading
import os
import queue
import sys
import sounddevice as sd
import soundfile as sf
from pynput import keyboard
flag = True # 停止标志位
class SoundRecThread(threading.Thread):
def __init__(self, audiofile='record.wav'):
threading.Thread.__init__(self)
self.bRecord = True
self.filename = audiofile
self.samplerate = 44100
self.channels = 2
def run(self):
q = queue.Queue()
def callback(indata, frames, time, status):
"""This is called (from a separate thread) for each audio block."""
if status:
print(status, file=sys.stderr)
q.put(indata.copy())
with sf.SoundFile(self.filename,
mode='x',
samplerate=self.samplerate,
channels=self.channels) as file:
with sd.InputStream(samplerate=self.samplerate,
channels=self.channels,
callback=callback):
while self.bRecord:
file.write(q.get())
def stoprecord(self):
self.bRecord = False
def start_sound():
wav_file = "temp.wav"
t2 = SoundRecThread(wav_file)
t2.start()
with keyboard.Listener(on_press=on_press) as listener:
listener.join()
while flag:
pass
t2.stoprecord()
def on_press(key):
"""
键盘监听事件!!!
:param key:
:return:
"""
# print(key)
global flag
if key == keyboard.Key.esc:
flag = False
print("stop monitor!")
return False # 返回False,键盘监听结束!
if __name__ == "__main__":
start_sound()
cmd_.bat文件—利用命令行来启动录音
python sound.py
cmd_.vbe文件 — 隐藏cmd_.bat弹出的黑窗口
set ws=wscript.createobject("wscript.shell")
ws.run "cmd_.bat /start",0
无论是cmd_.bat文件,还是cmd_.vbe文件,都可以通过记事本来想编写,并修改后缀名。