【Python】ffmpeg模块处理视频、音频信息

多媒体视频处理工具FFmpeg有非常强大的功能包括视频采集功能、视频格式转换、视频抓图、给视频加水印等。
这里主要介绍一下FFmpeg的一些常用参数,并且主要功能:截取视频、视频格式转换、视频分辨率转换、视频合并、提取视频、提取音频、提取图片、视频水印处理等。

ffmpeg参数:

一、公共参数:
-i 设定输入流 
-y 表示如果输出文件已存在则覆盖
-f 设定输出格式  指定文件格式(ffmpeg -formats可以列举支持的format)
-b 指定视频和音频加起来的码率
-q:v表示存储jpeg的图像质量,一般2是高质量。 格式:-q:v 2 -f image2
-ss 开始时间                                                         格式:00:00:02或者2.00
-t 表示截取多长的时间(持续时间)
-to 截到视频的哪个时间点结束(时间点)
-async 多少桢同步
-max_muxing_queue_size  增大容器封装队列大小(视频处理出现报错时) 格式:-max_muxing_queue_size 1024

二、视频参数
-re 根据文件真实的帧率来读取文件,生成实时刷新的直播流  格式:-re
-r 设定帧速率,单位为Hz,默认为25                  格式:-r 29(表示每一秒几帧)
-s 设定画面的宽与高(帧尺寸)                        格式:-s 720x1280

"coded_height":1280, "coded_width":720,

–b:v 表示视频平均码率(更改码率的速度最慢)       格式:–b:v 1500k
-bufsize 用于设置码率控制缓冲器的大小             格式:-bufsize 1500k 
-maxrate 码率波动,不要超过一个阈值               格式:-maxrate 1800k
-minrate 码率波动,不要低于一个阈值               格式:-minrate 1300k
-aspect 设定画面的比例                                      格式:-aspect 16:9 或者-aspect 1.7777

"display_aspect_ratio":"16:9"

-sar 设定画面的比例                                      格式:-sar 1:1

"sample_aspect_ratio":"1:1"

-vf scale=iw*0.9:ih*0.9或者-vf scale=720:1280或者scale=720:-1     -vf是调用video filter,这里用了scale filter来改变分辨率进行转码

-vf是-filter:v的简写,-filter指定过滤器,:v是流选择器,表示对视频流应用过滤器。scale=后面的参数是w:h
格式:-vf scale=320:240        设置具体的宽度和高度
格式:-vf scale=360:-1         固定高度
格式:-vf scale=-2:720         固定宽度
格式:-vf scale=iw*0.9:ih*0.9  原来宽的0.9倍,高的0.9倍
-vf crop=width:height:x:y      视频裁剪(其中 width和height表示裁剪后的尺寸,x:y 表示裁剪区域的左上角坐标)
-vf transpose=2                旋转视频(transpose默认0-逆时针和垂直翻转,1-顺时针旋转90度,2-逆时针旋转90度,3-顺时针和垂直翻转)
-filter_complex [0][1]hstack   水平拼接两个视频
-filter_complex [0][1]vstack   垂直拼接两个视频
-qp 23                         编码质量(值越大,压缩率越大,质量越低)
-crf 23                        编码质量(0-无损编码,可用值是0~51;x264默认值是23(推荐 17~ 28))
-strict -2                     之前是实验参数表示aac音频编码(使用FFmpeg自带的aac音频编码要带上-strict -2 参数就可以了)
-- 图片+音频合并成视频
ffmpeg -r 15 -f image2 -loop 1 -i 输入图片.png -i 输入音频.mp3 -s 1920x1080 -pix_fmt yuvj420p -t 278 -vcodec libx264 输出.mp4
-pix_fmt:指定图片输入格式(有yuv420,yuv444等各种格式)
-loop 1 :因为只有一张图片所以必须加入这个参数
-t:这个是图片转换成视频后持续的时间长度,必须指定,单位为秒,不然会无限制生成视频时间长度;

-metadata:s:v:0 rotate=90

-vn 不处理视频 
-vcodec 设定视频编解码器,未设定时则使用与输入流相同的编解码器  -c:v效果一样
-vcodec copy 表示使用跟原视频一样的视频编解码器。
-c:v libx264 表示对原视频进行libx264重新编码
-pass n 选择处理遍数(1或者2)。两遍编码非常有用。第一遍生成统计信息,第二遍生成精确的请求的码率  格式:-pass 1
-bsf:v h264_mp4toannexb=-vbsf h264_mp4toannexb   把mp4格式转换为ts格式

三、音频参数
–ar 表示音频采样率,单位为Hz;               格式:–ar 44100
–ab 音频数据流量 位速                       格式:–ab 128k
-ac 设定声音的Channel数 
-acodec 设定声音编解码器,未设定时则使用与输入流相同的编解码器  -c:a效果一样
-acodec copy表示使用跟原视频一样的音频编解码器。
-an 不处理音频
-vol 200%的音量              格式:-vol 200

注意一个问题,ffmpeg 在切割视频的时候无法做到时间绝对准确,因为视频编码中关键帧(I帧)和跟随它的B帧、P帧是无法分割开的,否则就需要进行重新帧内编码,会让视频体积增大。所以,如果切割的位置刚好在两个关键帧中间,那么 ffmpeg 会向前/向后切割,所以最后切割出的 chunk 长度总是会大于等于应有的长度。

你可能感兴趣的:(Python模块)