从流的操作(一)视频转音频引发的血案一文中我们了解到,流的选择,实际有两种方式,一种是ffmpeg自动选择,一种是设置参数手动选择。
对于自动选择,ffmpeg默认选择规则如下:
- 视频流:默认选择分辨率最高的流
- 音频流:默认选择通道最多的流
- 字幕流:默认选择第一个字幕编码器支持的字幕流
对于视频流和音频流,如果分辨率相等或者通道相等则以第一个为准,数据流和附件流不支持自动选择,需要手动选择。
自动选择的情况下,ffmpeg每种类型只会选择一路,举个例子
ffmpeg -i r3.mp4 -hide_banner
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'r3.mp4':
...
Duration: 00:00:58.54, start: 0.000000, bitrate: 1998 kb/s
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 544x960, 1732 kb/s, 29.83 fps, 29.83 tbr, 11456 tbn, 59.67 tbc (default)
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 129 kb/s (default)
Stream #0:2(und): Audio: mp3 (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 128 kb/s (default)
注:Stream #0:0,第一个0表示第一个输入文件,第二个0表示第一个输入文件的第一路流
如果我们直接对 r3.mp4 转码操作,你会发现输出的视频只保留了一路视频和一路音频。
1、ffmpeg -i r3.mp4 tmp-r3.mp4
2、ffmpeg -i tmp-r3.mp4
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 544x960, 1684 kb/s, 29.83 fps, 29.83 tbr, 11456 tbn, 59.67 tbc (default)
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 129 kb/s (default)
这就是ffmpeg自动选择的结果。
如果想要输入视频的Stream #0:2这路音频流,就只能手动指定了。
流的手动模式,使用 -map 参数操作,-map 非常重要,后面我们还会反复使用它。它表示我们需要从输入文件中选择哪些流到输出文件。
语法规则:
-map [-]input_file_index[:stream_type_specifier][:stream_index]
- 中括号[]表示可选,input_file_index 之前的 - 表示反选,即可以剔除某一路流。
- input_file_index 指的是某个输入文件,我们可以用下标0表示第一个输入文件,1表示第二个输入文件,以此类推;
- stream_type_specifier (可选)指的是指定输入文件的某路流的类型,我们用 a、v、s、d、t分别表示音频流、视频流、字幕流、数据流和附件流;
- stream_index(可选)指的是具体的某个类型的某路流。
我们仍然以案例一的素材视频为例(没有下载的可以点击这里下载。
如果我们以r1ori.mp4为输入,想得到r3.mp4的结果,即多了一路音频流且是mp3格式的,怎么做?
ffmpeg -i r1ori.mp4 -map 0:v -map 0:a:0 -map 0:a:0 -c:v copy -c:a:0 copy -c:a:1 libmp3lame -y r3.mp4
注意输出代码段Stream mapping这一段
Stream mapping:
Stream #0:0 -> #0:0 (copy)
Stream #0:1 -> #0:1 (copy)
Stream #0:1 -> #0:2 (aac (native) -> mp3 (libmp3lame))
简单分析下
- 因为只有一个输入文件,所以-map的第一个参数都是0
- -map 0:v 表示选择输入文件的所有视频流(这里视频流只有一个)到输出,-c:v copy表示复制所有的视频流,即你看到的 Stream #0:0 -> #0:0 (copy)
- -map 0:a:0 我们写了两遍,第一个表示选择输入文件的第一个音频流到输出,第二个仍然表示选择输入文件的第一个音频流到输出,相当于输出了两路音频流
- -map 0:v -map 0:a:0 -map 0:a:0 连起来也有关系,表示要按照我们选择的这三路顺序输出
- -c:a:0 copy 针对第一个音频流进行复制,不重新编码,即 Stream #0:1 -> #0:1 (copy); -c:a:1 libmp3lame 针对第二个音频流使用libmp3lame编码器重新编码,即输出过程中的 Stream #0:1 -> #0:2 (aac (native) -> mp3 (libmp3lame))
后面我们还会大量使用-map命令,所以上面这段分析,务必要理解清楚。
上面的命令同样等价于
ffmpeg -i r1ori.mp4 -map 0:0 -map 0:1 -map 0:1 -c:v copy -c:a:0 copy -c:a:1 libmp3lame -y r3.mp4
-map 0:v 这里等价于 -map 0:0,-map 0:a:0 等价于-map 0:1,这是因为在r1ori.mp4中#0:0就是视频流,#0:1就是音频流
ffmpeg -i r1ori.mp4
...
Stream #0:0(und): Video: h264
Stream #0:1(und): Audio
...
注意:-map的参数,针对的是输入流,因为是我们想要从输入流中选择流到输出;-c选项的参数,针对的并不再是输入流了,-c的参数针对的是-map选择的流,即输出流。
除此之外,下面我们再看几个简单的例子,你可以在看结果之前尝试下
1、复制输入文件的所有流到输出,输出结果可就不止只有两路流了
ffmpeg -i r3.mp4 -map 0 -c copy output.mp4
2、把输入文件的三路流分别拆开,输出三个文件
ffmpeg -y -i r3.mp4 -map 0:v -c:v copy output-silent.mp4 \
-map 0:a:0 -c:a copy output-audio.aac \
-map 0:a:1 -c:a copy output-audio.mp3
我们还可以设置一些选项,比如可以设置r3.mp4的两路音频流有不同的码率。
ffmpeg -i r3.mp4 -b:a:0 32k -b:a:1 64k -map 0 -y r4.mp4
-map 0 是必须的,不然输出结果并不会输出两路音频流。
对于音视频流还有很多选项设置,具体你可以查阅官方文档了解,你也可以在我们平时练习中多查阅资料,奠定基础。
最后,我们还有一种最最常见的操作——结合滤镜使用。
比如把原视频 r3.mp4 等比例缩放一倍
ffmpeg -i r3.mp4 -vf scale=272:480 -y filter.mp4
我们也可以手动选择流处理
ffmpeg -i r3.mp4 -filter_complex "[0]scale=272:480[out]" -map 0:a -map "[out]" -y filter.mp4
上面这两条命令你可能很难理解,关于滤镜,大家先有个印象,下面文章我们再作详细介绍。
流的操作我们就介绍到这里,大家在练习中碰到各种莫名其妙的问题,尽管留言。