SuperMiguaL

6 FFmpeg从入门到精通-FFmpeg滤镜使用

1 FFmpeg从入门到精通-FFmpeg简介
2 FFmpeg从入门到精通-FFmpeg工具使用基础
3 FFmpeg从入门到精通-FFmpeg转封装
4 FFmpeg从入门到精通-FFmpeg转码
5 FFmpeg从入门到精通-FFmpeg流媒体
6 FFmpeg从入门到精通-FFmpeg滤镜使用
7 FFmpeg从入门到精通-FFmpeg中Linux设备操作
8 FFmpeg从入门到精通-FFmpeg接口libavformat的使用
9 FFmpeg从入门到精通-FFmpeg接口libavcodec的使用
10 FFmpeg从入门到精通-FFmpeg接口libavfilter的使用

文章目录

6.FFmpeg滤镜使用
- 6.1 FFmpeg滤镜Filter描述格式
- - 6.1.1 FFmpeg滤镜Filter的参数排列方式
  - 6.1.2 FFmpeg滤镜Filter时间内置变量
- 6.2 FFmpeg为视频加水印
- - 6.2.1 文字水印
  - 6.2.2 图片水印
- 6.3 FFmpeg生成画中画
- 6.4 FFmpeg视频多宫格处理
- 6.5 FFmpeg音频流滤镜操作
- - 6.5.1 双声道合并单声道
  - 6.5.2 双声道提取
  - 6.5.3 双声道转双音频流
  - 6.5.4 单声道转双声道
  - 6.5.5 两个音频源合并双声道
  - 6.5.6 多个音频合并为多声道
- 6.6 FFmpeg音频音量探测
- - 6.6.1 音频音量获得
  - 6.6.2 绘制音频波形
- 6.7 FFmpeg为视频加字幕
- - 6.7.1 ASS字幕流写入视频流
  - 6.7.2 ASS字幕流写入封装容器
- 6.8 FFmpeg视频抠图合并
- 6.9 FFmpeg3D视频处理
- - 6.9.1 stereo3d处理3D视频
  - 6.9.2 3D图像转换举例
- 6.10 FFmpeg定时视频截图
- - 6.10.1 vframe参数截取一张图片
  - 6.10.2 fps滤镜定时获得图片
- 6.11 FFmpeg生成测试元数据
- - 6.11.1 FFmpeg生成音频测试流
  - 6.11.2 FFmpeg生成视频测试流
- 6.12 FFmpeg对音视频倍速处理
- - 6.12.1 atempo音频倍速处理
  - 6.12.2 setpts视频倍速处理
- 6.13 小结

6.FFmpeg滤镜使用

6.1 FFmpeg滤镜Filter描述格式

在使用FFmpeg的滤镜处理音视频特效之前，首先需要了解一下Filter的基本格式。

6.1.1 FFmpeg滤镜Filter的参数排列方式

为了便于理解Filter使用的方法，下面先用最简单的方式来描述Filter使用时的参数排列方式：

输入流或标记名]滤镜参数[临时标记名];[输入流或标记名]滤镜参数[临时标记名]…

文字描述的排列方式很明确，接下来列举一个简单的例子：输入两个文件，一个视频input.mp4，一个图片logo.png，将logo进行缩放，然后放在视频的左上角：

ffmpeg -i input.mp4 -i logo.png -filter_complex "[1:v]scale=176:144[logo];[0:v][logo]overlay=x=0:y=0" output.mp4

从上述命令可以看出，将logo.png的图像流缩放为176×144的分辨率，然后定义一个临时标记名logo，最后将缩放后的图像[logo]铺在输入的视频input.mp4的视频流[0:v]的左上角。

6.1.2 FFmpeg滤镜Filter时间内置变量

在使用Filter时，经常会用到根据时间轴进行操作的需求，下面先来了解一下这些相关的变量，见表。

6.2 FFmpeg为视频加水印

FFmpeg可以为视频添加水印，水印可以是文字，也可以是图片，主要用来标记视频所属标记等。下面就来看一下FFmpeg加水印的多种方式。

6.2.1 文字水印

    在视频中增加文字水印需要准备的条件比较多，需要有文字字库处理的相关文件，在编译FFmpeg时需要支持FreeType、FontConfig、iconv，系统中需要有相关的字库，在FFmpeg中增加纯字母水印可以使用drawtext滤镜进行支持，下面就来看一下drawtext的滤镜参数，具体见表。

    drawtext滤镜使用举例
    使用drawtext可以根据前面介绍过的参数进行加水印设置，例如将文字的水印加在视频的左上角，命令行如下：

ffmpeg -i input.mp4 -vf "drawtext=fontsize=100:fontfile=FreeSerif.ttf:text='hello world':x=20:y=20" output.mp4

    执行完这条命令行之后，即可在output.mp4视频的左上角增加“hello world”文字水印，为了使文字展示得更清楚一些，将文字大小设置为100像素，如图所示。

    如图所示，视频的左上角加入了“hello world”文字水印。
    图的文字水印为纯黑色，会展现得比较突兀，为了使水印更加柔和，可以通过drawtext滤镜的fontcolor参数调节颜色，例如将字体的颜色设置为绿色：

ffmpeg -i input.mp4 -vf "drawtext=fontsize=100:fontfile=FreeSerif.ttf:text='hello world':fontcolor=green" output.mp4

执行完命令行之后，文字水印即为绿色，如图所示。

如果想调整文字水印显示的位置，调整x与y参数的数值即可。文字水印还可以增加一个框，然后给框加上背景颜色：

ffmpeg -i input.mp4 -vf "drawtext=fontsize=100:fontfile=FreeSerif.ttf:text='hello world':fontcolor=green:box=1:boxcolor=yellow" output.mp4

    执行完命令行之后，视频左上角显示文字水印，水印背景色为黄色，效果如图所示。

    至此，文字水印的基础功能已经添加完成。
    有些时候文字水印希望以本地时间作为水印内容，可以在drawtext滤镜中配合一些特殊用法来完成，例如：

ffmpeg -re -i input.mp4 -vf "drawtext=fontsize=60:fontfile=FreeSerif.ttf:text='%{localtime\:%Y\-%m\-%d %H-%M-%S}':fontcolor=green:box=1:boxcolor=yellow" output.mp4

在text中显示本地当前时间，格式为年月日时分秒的方式，具体情况如图所示。

在个别场景中，需要定时显示水印，定时不显示水印，这种方式同样可以配合drawtext滤镜进行处理，使用drawtext与enable配合即可，例如每3秒钟显示一次文字水印：

ffmpeg -re -i input.mp4 -vf "drawtext=fontsize=60:fontfile=FreeSerif.ttf:text='test':fontcolor=green:box=1:boxcolor=yellow:enable=lt(mod(t\,3)\,1)" output.mp4

执行完命令行之后，即可达到每三秒钟闪一下文字水印的效果，由于其是一个动态展示的视频，所以在这里就不抓图展示了。
当然，大多数时候文字水印会有中文字符，此时系统需要包含中文字库与中文编码支持，这样才能够将中文水印加入到视频中并正常显示。

ffmpeg -re -i input.mp4 -vf "drawtext=fontsize=50:fontfile=/Library/Fonts/Songti.ttc:text='文字水印测试':fontcolor=green:box=1:boxcolor=yellow" output.mp4

执行完命令行之后即可将中文水印加入到视频当中，并且中文字符的字体为行文楷体。

6.2.2 图片水印

FFmpeg除了可以向视频添加文字水印之外，还可以向视频添加图片水印、视频跑马灯等，本节将重点介绍如何为视频添加图片水印；为视频添加图片水印可以使用movie滤镜，下面就来熟悉一下movie滤镜的参数，如表所示。

下面举例说明，在FFmpeg中加入图片水印有两种方式，一种是通过movie指定水印文件路径，另外一种方式是通过filter读取输入文件的流并指定为水印，这里重点介绍如何读取movie图片文件作为水印，举例如下：

ffmpeg -i input.mp4 -vf "movie=logo.png[wm]; [in][wm]overlay=30:10[out]" output.mp4

执行完命令行之后logo.png水印将会打入到input.mp4视频中，显示在x坐标30、y坐标10的位置，如图所示。

从图中可以看到，将透明水印加入到视频中的效果更好一些。当只有纯色背景的logo图片时，可以考虑使用movie与colorkey滤镜配合做成半透明效果，例如：

ffmpeg -i input.mp4 -vf "movie=logo.png,colorkey=black:1.0:1.0 [wm]; [in] [wm]overlay=30:10 [out]" output.mp4

执行完命令行之后，将会根据colorkey设置的颜色值、相似度、混合度与原片混合为半透明水印。

6.3 FFmpeg生成画中画

在使用FFmpeg处理流媒体文件时，有时需要使用画中画的效果。在FFmpeg中，可以通过overlay将多个视频流、多个多媒体采集设备、多个视频文件合并到一个界面中，生成画中画的效果。在前面的滤镜使用中，以至于以后的滤镜使用中，与视频操作相关的处理，大多数都会与overlay滤镜配合使用，尤其是用在图层处理与合并场景中，下面就来了解一下overlay的参数，具体见表。

从参数列表中可以看到，主要参数并不多，但实际上在overlay滤镜使用中，还有很多组合的参数可以使用，可以使用一些内部变量，例如overlay图层的宽、高、坐标等；下面再列举几个画中画的例子：

ffmpeg -re -i input.mp4 -vf "movie=sub.mp4,scale=480x320[test]; [in][test] overlay [out]" -vcodec libx264 output.flv

执行完命令行之后会将sub.mp4视频文件缩放成宽480、高320的视频，然后显示在视频input.mp4的x坐标为0、y坐标为0的位置，下面看一下命令行执行后生成的output.flv的效果，如图所示。

图即为显示画中画的最基本方式，如果希望子视频显示在指定位置，例如显示在画面的右下角，则需要用到overlay中x坐标与y坐标的内部变量：

ffmpeg -re -i input.mp4 -vf "movie=sub.mp4,scale=480x320[test]; [in][test] overlay=x=main_w-480:y=main_h-320 [out]" -vcodec libx264 output.flv

根据命令行可以分析出，除了显示在overlay画面中，子视频将会定位在主画面的最右边减去子视频的宽度，最下边减去子视频的高度的位置，生成的视频播放效果如图所示。

以上两种视频画中画的处理均为静态位置处理，使用overlay还可以配合正则表达式进行跑马灯式画中画处理，动态改变子画面的x坐标与y坐标即可：

ffmpeg -re -i input.mp4 -vf "movie=sub.mp4,scale=480x320[test]; [in][test] overlay=x='if(gte(t,2), -w+(t-2)*20, NAN)':y=0 [out]" -vcodec libx264 output.flv

命令行执行之后，子视频将会从主视频的左侧开始渐入视频从左向右游动，视频画中画的基本处理至此已介绍完毕，重点为overlay滤镜的使用。

6.4 FFmpeg视频多宫格处理

视频除了画中画显示，还有一种场景为以多宫格的方式呈现出来，除了可以输入视频文件，还可以输入视频流、采集设备等。从前文中可以看出进行视频图像处理时，overlay滤镜为关键画布，可以通过FFmpeg建立一个画布，也可以使用默认的画布。如果想以多宫格的方式展现，则可以自己建立一个足够大的画布，下面就来看一下多宫格展示的例子：

ffmpeg -re -i input1.mp4 -re -i input2.mp4 -re -i input3.mp4 -re -i input4.mp4 -filter_complex "nullsrc=size=640x480 [base]; [0:v] setpts=PTS-STARTPTS, scale=320x240 [upperleft]; [1:v] setpts=PTS-STARTPTS, scale=320x240 [upperright]; [2:v] setpts=PTS-STARTPTS, scale=320x240 [lowerleft]; [3:v] setpts=PTS-STARTPTS, scale=320x240 [lowerright]; [base][upperleft] overlay=shortest=1 [tmp1]; [tmp1][upperright] overlay=shortest=1:x=320 [tmp2]; [tmp2][lowerleft] overlay=shortest=1:y=240 [tmp3]; [tmp3][lowerright] overlay=shortest=1:x=320:y=240" -c:v libx264 output.flv

    执行完命令行之后，即可通过nullsrc创建一个overlay画布，画布的大小为宽640像素、高480像素，使用[0:v][1:v][2:v][3:v]将输入的4个视频流去除，分别进行缩放处理，处理为宽320、高240的视频，然后基于nullsrc生成的画布进行视频平铺，平铺的整体情况如图所示。

    根据命令中定义的upperleft、upperright、lowerleft、lowerright进行不同位置的平铺，平铺的整体步骤如图所示。

    执行完命令行之后的最终展现形式如图所示。

6.5 FFmpeg音频流滤镜操作

FFmpeg除了可以操作视频之外，还可以对音频进行操作，例如拆分声道、合并多声道为单声道、调整声道布局、调整音频采样率等，而进行音频的拆分与合并，在FFmpeg中可以使用滤镜进行操作，可以通过amix、amerge、pan、channelsplit、volume、volumedetect等滤镜进行常用的音频操作，下面就来了解一下相关的操作。

6.5.1 双声道合并单声道

在进行音频转换时常常会遇到音频声道发生改变的情况，例如将双声道合并为单声道，通过ffmpeg –layouts参数可以查看音频的声道布局支持情况，例如将双声道合并为单声道操作，则是将stereo转变为mono模式，如图所示。

ffmpeg -i input.aac -ac 1 output.aac

执行完命令行之后，input.aac的音频原为双声道，现被转为单声道，下面来看一下执行后的对比信息：

Input #0, aac, from 'input.aac':
  Duration: 00:00:34.25, bitrate: 5 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 5 kb/s
Stream mapping:
  Stream #0:0 -> #0:0 (aac (native) -> aac (native))
Press [q] to stop, [?] for help
Output #0, adts, to 'output.aac':
  Metadata:
    encoder         : Lavf59.34.102
  Stream #0:0: Audio: aac (LC), 48000 Hz, mono, fltp, 69 kb/s
    Metadata:
      encoder         : Lavc59.54.100 aac
size=      18kB time=00:00:35.00 bitrate=   4.2kbits/s speed= 477x

从图中可以看到，input.aac的音频是stereo布局方式，即FL与FR两个声道，通过ac将双声道转为单声道mono布局，输出为output.aac。原本双声道的音频，左耳右耳都可以听到声音，调整后依然可以左右耳都听到声音，只是布局发生了改变，为中央布局；接下来可以将双声道拆分成左耳与右耳两个音频，每个耳朵只能听到一个声道的声音。

6.5.2 双声道提取

使用FFmpeg可以提取多声道的音频并输出至新音频文件或者多个音频流，以便于后续的编辑等，下面看一下提取多声道音频的方式，如图所示。

从提取方式中可以看到，将音频为stereo的布局提取为两个mono流，左声道一个流，右声道一个流，命令格式如下。可以使用FFmpeg的map_channel参数实现：

ffmpeg -i input.aac -map_channel 0.0.0 left.aac -map_channel 0.0.1 right.aac

这里也可以使用pan滤镜实现：

ffmpeg -i input.aac -filter_complex "[0:0]pan=1c|c0=c0[left];[0:0]pan=1c|c0=c1[right]" -map "[left]" left.aac -map "[right]" right.aac

命令行执行后，会将布局格式为stereo的input.aac转换为两个mono布局的left.aac与right.aac：

Input #0, aac, from 'input.aac':
  Duration: 00:00:34.25, bitrate: 5 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 5 kb/s
Stream mapping:
  Stream #0:0 (aac) -> pan:default
  Stream #0:0 (aac) -> pan:default
  pan:default -> Stream #0:0 (aac)
  pan:default -> Stream #1:0 (aac)
Output #0, adts, to 'left.aac':
  Metadata:
    encoder         : Lavf59.34.102
  Stream #0:0: Audio: aac (LC), 48000 Hz, mono, fltp, 69 kb/s
    Metadata:
      encoder         : Lavc59.54.100 aac
Output #1, adts, to 'right.aac':
  Metadata:
    encoder         : Lavf59.34.102
  Stream #1:0: Audio: aac (LC), 48000 Hz, mono, fltp, 69 kb/s
    Metadata:
      encoder         : Lavc59.54.100 aac
size=      18kB time=00:00:35.00 bitrate=   4.2kbits/s speed= 276x

从上述输出中可以看到，input.aac为stereo，而left.aac与right.aac为mono。

6.5.3 双声道转双音频流

FFmpeg不但可以将双声道音频提取出来生成两个音频文件，还可以将双声道音频提取出来转为一个音频文件两个音频流，每个音频流为一个声道，转换方式如图所示。

ffmpeg -i input.aac -filter_complex channelsplit=channel_layout=stereo output.mka

命令行通过channelsplit滤镜将stereo布局方式的音频切分开，分成两个音频流，下面来看一下切分前后的音频效果：

Input #0, aac, from 'input.aac':
  Duration: 00:00:34.25, bitrate: 5 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 5 kb/s
Output #0, matroska, to 'output.mka':
  Stream #0:0: Audio: vorbis (oV[0][0] / 0x566F), 48000 Hz, 1 channels (FL), fltp (default)
    Metadata:
      encoder         : Lavc59.54.100 libvorbis
  Stream #0:1: Audio: vorbis (oV[0][0] / 0x566F), 48000 Hz, 1 channels (FR), fltp
    Metadata:
      encoder         : Lavc59.54.100 libvorbis

6.5.4 单声道转双声道

使用FFmpeg可以将单声道转换为双声道，即当只有中央声道或者只有mono布局时，才可以通过FFmpeg转换为stereo布局，转换方式如图所示。

根据前面章节提到的stereo布局转出来的mono布局的音频文件left.aac进行生成，命令行如下：

ffmpeg -i left.aac -ac 2 output.m4a

执行完命令行之后，将会从left.aac中，将布局为mono的音频转换为stereo布局的音频文件output.m4a，下面查看一下输入与输出文件：

Input #0, aac, from 'left.aac':
  Duration: 00:00:34.13, bitrate: 4 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, mono, fltp, 4 kb/s
Stream mapping:
  Stream #0:0 -> #0:0 (aac (native) -> aac (native))
Press [q] to stop, [?] for help
Output #0, ipod, to 'output.m4a':
  Metadata:
    encoder         : Lavf59.34.102
  Stream #0:0: Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s
    Metadata:
      encoder         : Lavc59.54.100 aac
size=      17kB time=00:00:35.02 bitrate=   4.0kbits/s speed= 280x

从以上的输出信息中可以看到，输入的left.aac中音频为mono布局，而输出的文件output.m4a中的音频布局则为stereo。除了使用ac参数，还可以使用amerge滤镜进行处理，命令行如下：

ffmpeg -i left.aac -filter_complex "[0:a][0:a]amerge=inputs=2[aout]" -map "[aout]" output.m4a

命令行执行后的效果与使用ac的效果相同。
当然，这样执行之后的双声道并不是真正的双声道，而是由单声道处理成的多声道，效果不会比原有的多声道效果好。

6.5.5 两个音频源合并双声道

前面讲过将单mono处理为双声道，如果将输入的单mono转换为stereo双声道为伪双声道，则可以考虑将两个音频源合并为双声道，相对来说这样操作更容易理解一些，下面就来看一下如何将两个音频源输入为双声道，如图所示。

输入两个布局为mono的音频源，合并为一个布局为stereo双声道的音频流，输出到output文件，下面用命令行执行来举例说明：

ffmpeg -i left.aac -i right.aac -filter_complex "[0:a][1:a]amerge=inputs=2[aout]" -map "[aout]" output.mka

命令行执行之后，会将left.aac与right.aac两个音频为mono布局的AAC合并为一个布局为stereo的音频流，输出至output.mka文件，下面就来看一下输入文件与输出文件信息：

Input #0, aac, from 'left.aac':
  Duration: 00:00:34.13, bitrate: 4 kb/s
  Stream #0:0: Audio: aac (LC), 48000 Hz, mono, fltp, 4 kb/s
[aac @ 000002afbe53a640] Estimating duration from bitrate, this may be inaccurate
Input #1, aac, from 'right.aac':
  Duration: 00:00:34.13, bitrate: 4 kb/s
  Stream #1:0: Audio: aac (LC), 48000 Hz, mono, fltp, 4 kb/s
Stream mapping:
  Stream #0:0 (aac) -> amerge
  Stream #1:0 (aac) -> amerge
  amerge:default -> Stream #0:0 (libvorbis)
Press [q] to stop, [?] for help
Output #0, matroska, to 'output.mka':
  Metadata:
    encoder         : Lavf59.34.102
  Stream #0:0: Audio: vorbis (oV[0][0] / 0x566F), 48000 Hz, stereo, fltp
    Metadata:
      encoder         : Lavc59.54.100 libvorbis

从以上三个Input信息可以看，输入的两路mono转换为stereo了，输出音频为AC3，这个可以通过acodec aac指定为输出AAC编码的音频。

6.5.6 多个音频合并为多声道

除了双声道音频，FFmpeg还可以支持多声道，通过ffmpeg-layouts即可看到声道布局有很多种，常见的多声道还有一种是5.1方式的多声道，其原理如图6-20所示。

图表示将6个mono布局的音频流合并为一个多声道（5.1声道）的音频流。如果希望实现这样的效果，则可以使用如下命令行：

ffmpeg -i front_left.wav -i front_right.wav -i front_center.wav -i lfe.wav -i back_left.wav -i back_right.wav -filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a]amerge=inputs=6[aout]" -map "[aout]" output.wav

命令行执行之后，将会生成一个5.1布局的音频，下面就来看一下执行后的效果：

Input #0, wav, from 'output.wav':
    Metadata:
        encoder         : Lavf57.71.100
    Duration: 00:00:50.03, bitrate: 4608 kb/s
        Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 48000 Hz, 5.1, s16, 4608 kb/s

如Input信息所示，多音频输入合并后生成为5.1布局的音频，码率为4608kbit/s。
使用FFmpeg除了可以生成以上这些布局方式之外，还可以生成很多种，可以通过ffmpeg -layouts方式获得布局方式信息。

6.6 FFmpeg音频音量探测

在拿到音频文件播放音频时，有时会需要根据音频的音量绘制出音频的波形，而有时候会希望根据音频的音量来过滤音频文件，将重点介绍音频音量与音频波形相关的滤镜操作。

6.6.1 音频音量获得

使用FFmpeg可以获得音频的音量分贝，以及与音频相关的一些信息，可以使用滤镜volumedetect获得，下面举例说明：

ffmpeg -i output.wav -filter_complex volumedetect -c:v copy -f null /dev/null

命令行执行之后，输出信息如下：

Input #0, wav, from 'output.wav':
  Duration: 00:00:46.18, bitrate: 1411 kb/s
  Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
[Parsed_volumedetect_0 @ 0x41cf6c0] n_samples: 0
Stream mapping:
  Stream #0:0 (pcm_s16le) -> volumedetect:default
  volumedetect:default -> Stream #0:0 (pcm_s16le)
Press [q] to stop, [?] for help
Output #0, null, to '/dev/null':
  Metadata:
    encoder         : Lavf59.27.100
  Stream #0:0: Audio: pcm_s16le, 44100 Hz, stereo, s16, 1411 kb/s
    Metadata:
      encoder         : Lavc59.37.100 pcm_s16le
size=N/A time=00:00:46.18 bitrate=N/A speed=2.53e+03x    
video:0kB audio:7956kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: unknown
[Parsed_volumedetect_0 @ 0x4210d40] n_samples: 4073400
[Parsed_volumedetect_0 @ 0x4210d40] mean_volume: -16.2 dB
[Parsed_volumedetect_0 @ 0x4210d40] max_volume: -2.8 dB
[Parsed_volumedetect_0 @ 0x4210d40] histogram_2db: 206
[Parsed_volumedetect_0 @ 0x4210d40] histogram_3db: 3454
[Parsed_volumedetect_0 @ 0x4210d40] histogram_4db: 5650

从输出信息中可以看到，mean_volume为获得的音频的平均大小，即-16.2dB。

6.6.2 绘制音频波形

一些应用场景需要用到音频的波形图，随着声音分贝的增大，波形波动越强烈，使用FFmpeg可以通过showwavespic滤镜来绘制音频的波形图，下面将列举几个例子，首先看一下如何使用FFmpeg绘制简单的波形图：

ffmpeg -i output.wav -filter_complex "showwavespic=s=640x120" -frames:v 1 output.png

命令行执行之后将会生成一个宽高为640×120大小的output.png图片，图片内容为音频波形，如图所示。

图中所绘的为音频波形的全部信息。前边章节中看到的output.wav为5.1布局方式的多声道音频，如果希望看到每个声道的音频的波形图，则可以使用showwavepic与split_channel滤镜配合绘制出不同声道的波形图。

ffmpeg -i output.wav -filter_complex "showwavespic=s=640x240:split_channels=1" -frames:v 1 output.png

由于现实的波形有些多，所以生成图片的宽高会发生一些改变，可以将高度设置得大一些，这条命令执行完之后会将音频的每一个声道进行拆分，然后绘制出图像，如图所示。

六条波形图分别表示5.1布局每一个声道的波形图。

6.7 FFmpeg为视频加字幕

为视频添加字幕的方式有很多种，大概可以分为将字幕编码进视频流中以及在封装容器中加入字幕流。将字幕编码进入视频流中的方式与为视频增加水印的方式基本相似，而在封装容器中加入字幕流的方式则需要封装容器支持加入字幕流，下面就来看一下如何使用FFmpeg为视频文件增添字幕。

6.7.1 ASS字幕流写入视频流

使用FFmpeg可以将字幕流写入视频流，通过ASS滤镜即可，首先需要将视频流进行解码，然后将ASS字幕写入视频流，编码压缩之后再进行容器封装即可完成，字幕文件的内容格式大致如下：

Script Info]
[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding Style: *Default,微软雅黑,21,&H00FFFFFF,&H0000FFFF, &H2D804000,&H32000000,-1,0,0,0,100,100,0,0,0,2,1,2,5,5,5,134
Style: logo,微软雅黑,21,&H00FFFFFF,&HF0000000,&H00000000,&H00000000,0,0,0,0,100,100,0,0,1,2,1,2,5,5,5 ,134
[Events]
Format: Layer, Start, End, Style, Actor, MarginL, MarginR, MarginV, Effect, Text
Dialogue: 0,0:00:00.91,0:00:02.56,*Default,NTP,0000,0000,0000,,前情提要\N{\1c&HFFFFFF&}{\3a&H82&\4c&H030303&}{\fnArial Black}{\fs20}{\b1}{\fe0}{\shad1}{\3c&H030303&}{\4c&H030303&}Previously on “the Vampire Diaries”...
Dialogue: 0,0:00:02.59,0:00:05.47,*Default,NTP,0000,0000,0000,,Elena很享受你们兄弟俩对她的爱慕吧\N{\1c&HFFFFFF&}{\3a&H82&\4c&H030303&}{\fnArial Black}{\fs20}{\b1}{\fe0}{\shad1}{\3c&H030303&}{\4c&H030303&}Does Elena enjoy having both of you worship at her altar?
Dialogue: 0,0:00:05.50,0:00:06.66,*Default,NTP,0000,0000,0000,,我听说过你\N{\1c&HFFFFFF&}{\3a&H82&\4c&H030303&}{\fnArial Black}{\fs20}{\b1}{\fe0}{\shad1}{\3c&H030303&}{\4c&H030303&}I've heard about you...

打开的文件中的内容为字幕文件的片段，内容格式为ASS字幕格式。下面将字幕写入视频流中：

ffmpeg -i input.mp4 -vf ass=t1.ass -f mp4 output.mp4

命令行执行之后即可根据input.mp4的信息增加ASS字幕，将字幕写入视频流中生成output.mp4，下面可以看一下输入与输出文件的情况：

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'input.mp4':
  Stream #0:0[0x1](und): Video: h264 (High) (avc1 / 0x31637661), yuv420p(tv, bt709, progressive), 1920x1080 [SAR 1:1 DAR 16:9], 2497 kb/s, 30 fps, 30 tbr, 15360 tbn (default)
  Stream #0:1[0x2](und): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 159 kb/s (default)
Output #0, mp4, to 'output.mp4':
  Stream #0:0(und): Video: h264 (avc1 / 0x31637661), yuv420p(tv, bt709, progressive), 1920x1080 [SAR 1:1 DAR 16:9], q=2-31, 30 fps, 15360 tbn (default)
  Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (default)

从Input信息中可以看到，输入与输出的封装容器格式基本相同，均为一个视频流和一个音频流，并未包含字幕流，因为字幕已经通过ASS容器将文字写入视频流中。播放效果如图所示。

从图所示的播放效果可以看到，字幕流已经写入视频文件中，并且在播放时可以看到字幕。

6.7.2 ASS字幕流写入封装容器

下面看一下如何利用·FFmpeg将ASS字幕流写入MKV封装容器中·，并以字幕流的形式存在：

ffmpeg -i input.mp4 -i t1.ass -acodec copy -vcodec copy -scodec copy output.mkv

命令行执行之后，会将input.mp4中的音频流、视频流、t1.ass中的字幕流在不改变编码的情况下封装入output.mkv文件中，而output.mkv文件将会包含三个流，分别为视频流、音频流以及字幕流；而在input.mp4中或者输入的视频文件中原本同样带有字幕流，并希望使用t1.ass字幕流时，可以通过map功能将对应的字幕流指定封装入output.mkv，例如：

ffmpeg -i input.mp4 -i t1.ass -map 0:0 -map 0:1 -map 1:0 -acodec copy -vcodec copy -scodec copy output.mkv

6.8 FFmpeg视频抠图合并

FFmpeg还可以进行视频抠图与背景视频合并的操作——chromakey操作，下面就来介绍chromakey操作。

参数	类型	说明
color	颜色	设置chromakey颜色值默认为黑色
similarity	浮点	设置chromakey相似值
blend	浮点	设置chromakey融合值
yuv	布尔	yuv替代rgb 默认为false

参数介绍完毕，接下来再举一个例子实战体验一下。如果当前有两个视频：一个为input.mp4，另一个为绿色背景的视频input_green.mp4。
背景颜色可以根据ffmpeg-colors查询颜色支持，这个背景颜色为绿色，那么可以设置透明色部分为绿色，下面使用chromakey滤镜将绿色背景中的人物抠出来，然后贴到以input.mp4为背景的视频中：

ffmpeg -i input.mp4 -i input_green.mp4 -filter_complex "[1:v]chromakey=Green:0.1:0.2[ckout];[0:v][ckout]overlay[out]" -map "[out]" output.mp4

    命令行执行之后，会设置chrom-akey的背景色为绿色，设置标签为ckout，然后将ckout铺在以input.mp4的视频为背景的画布上，最后输出output.mp4，输出效果如图所示。

    从图中可以看到，人物已经被铺在了视频中，两个图层已经合并。chromakey效果已经达到。。
    注意：
    FFmpeg中除了有chromakey滤镜之外，还有一个colorkey参数，chromakey滤镜主要处理YUV数据，所以一般来说做绿幕处理更有优势；而colorkey处理纯色均可以，因为colorkey处理主要以RGB数据为主。

6.9 FFmpeg3D视频处理

使用FFmpeg可以进行相关的处理，介绍一下如何通过stereo3d滤镜方式实现3D效果。

6.9.1 stereo3d处理3D视频

查询FFmpeg滤镜stereo3d参数。接下来举个例子验证一下，首先获得一个左右眼的视频，然后将其转变为红蓝眼镜观看的视频。

6.9.2 3D图像转换举例

3D视频除了用VR眼镜观看之外，还有一种场景是在电影院裸眼用黄蓝眼镜观看，这时候看这样的视频同样是左右效果而不是3D效果，可以通过stereo3d滤镜转换之后使用黄蓝眼镜观看：

ffplay -vf "stereo3d=sbsl:aybd" input.mp4

命令行执行后，会将原片的左右排列效果合并为黄蓝合并排列效果，视频播放起来将会更有立体感；如果使用红蓝眼镜观看视频，可以使用红蓝输出参数：

ffplay -vf "stereo3d=sbsl:arbg" input.mp4

6.10 FFmpeg定时视频截图

使用FFmpeg截图有很多种，常见的为使用vframe参数与fps滤镜，下面重点介绍vframe参数与fps滤镜两种方法的使用例子。

6.10.1 vframe参数截取一张图片

在获取指定时间位置的视频图像缩略图时，可使用vframe获得，通过FFmpeg参数ss与vframe即可获得，下面来看一下例子：

ffmpeg -i input.flv -ss 00:00:7.435 -vframes 1 out.png

命令行执行之后，FFmpeg会定位到input.flv的第7秒位置，获得对应的视频帧，然后将图像解码出来编码成RGB24的图像并封装成PNG图像，过程如下：

Input #0, flv, from 'input.flv':
  Stream #0:0: Video: h264 (High), yuv420p(progressive), 1280x720, 2500 kb/s, 30 fps, 30 tbr, 1k tbn
  Stream #0:1: Audio: aac (LC), 44100 Hz, stereo, fltp, 160 kb/s
Stream mapping:
  Stream #0:0 -> #0:0 (h264 (native) -> png (native))
Output #0, image2, to 'out.png':
  Stream #0:0: Video: png, rgb24(pc, gbr/unknown/unknown, progressive), 1280x720, q=2-31, 200 kb/s, 30 fps, 30 tbn
[image2 @ 000001505cd0d240] The specified filename 'out.png' does not contain an image sequence pattern or a pattern is invalid.
[image2 @ 000001505cd0d240] Use a pattern such as %03d for an image sequence or use the -update option (with -frames:v 1 if needed) to write a single image.
frame=    1 fps=0.0 q=-0.0 Lsize=N/A time=00:00:00.00 bitrate=N/A dup=1 drop=0 speed=   0x

6.10.2 fps滤镜定时获得图片

下面来看一下FFmpeg的fps滤镜是如何在间隔时间获得图片的：

ffmpeg -i input.flv -vf fps=1 out%d.png

命令行执行之后，将会每隔1秒钟生成一张PNG图片。

ffmpeg -i input.flv -vf fps=1/60 img%03d.jpg

命令行执行之后，将会每隔1分钟生成一张JPEG图片。

ffmpeg -i input.flv -vf fps=1/600 thumb%04d.bmp

命令行执行之后，将会每隔10分钟生成一张BMP图片。
以上三种方式均为按照时间截取图片，那么如果希望按照关键帧截取图片，可以使用select来截取：

ffmpeg -i input.flv -vf "select='eq(pict_type,PICT_TYPE_I)'" -vsync vfr thumb%04d.png

命令行执行之后，FFmpeg将会判断图像类型是否为I帧，如果是I帧则会生成一张PNG图像。

6.11 FFmpeg生成测试元数据

FFmpeg不但可以处理音视频文件，还可以生成音视频文件，可以通过lavfi设备虚拟音视频源数据，下面就来简单介绍几个常用的案例。

6.11.1 FFmpeg生成音频测试流

在FFmpeg中，可以通过lavfi虚拟音频源的abuffer、aevalsrc、anullsrc、flite、anoisesrc、sine滤镜生成音频流，下面就来举例说明：

ffmpeg -re -f lavfi -i abuffer=sample_rate=44100:sample_fmt=s16p:channel_layout=stereo -acodec aac -y output.aac

命令行执行之后，FFmpeg会根据lavfi设备输入的abuffer中定义的采样率、格式，以及声道布局，通过AAC编码，然后生成AAC音频文件；下面再列举一个例子：

ffmpeg -re -f lavfi "aevalsrc=sin(420*2*PI*t)|cos(430*2*PI*t):c=FC|BC" -acodec aac output.aac

命令行执行之后，音频为使用aevalsrc生成的双通道音频，输出为output.aac，下面就来使用前边提到过的波形查看方式查看一下音频波形，效果如图所示。

以上举例为abuffer与aevalsrc两种输入举例，还可以以类似的方式使用anullsrc、flite、anoisesrc、sine来虚拟输入的音频设备生成音频流。以便使用FFmpeg测试音频流处理。

6.11.2 FFmpeg生成视频测试流

在使用FFmpeg测试流媒体时，如果没有输入文件，则可以通过FFmpeg虚拟设备虚拟出来一个输入视频流，可以通过FFmpeg模拟多种视频源：allrgb、allyuv、color、haldclutsrc、nullsrc、rgbtestsrc、smptebars、smptehdbars、testsrc、testsrc2、yuvtestsrc；下面就对常见的视频源进行举例测试。

ffmpeg -re -f lavfi -i testsrc=duration=5.3:size=qcif:rate=25 -vcodec libx264 -r:v 25 output.mp4

命令行执行之后，FFmpeg会根据testsrc生成长度为5.3秒、图像大小为QCIF分辨率、帧率为25fps的视频图像数据，并编码成为H.264，然后输出output.mp4视频文件，下面就来看一下生成的MP4文件，如图所示。

ffmpeg -re -f lavfi -i testsrc2=duration=5.3:size=qcif:rate=25 -vcodec libx264 -r:v 25 output.mp4

命令行执行之后，会根据testsrc2生成一个视频图像内容，其他参数与testsrc相同。下面就来看一下命令行执行之后生成的output.mp4文件内容，如图所示。

ffmpeg -re -f lavfi -i color=c=[email protected]:s=qcif:r=25 -vcodec libx264 -r:v 25 output.mp4

命令行执行之后，会使用color作为视频源，图像内容为纯红色，编码为H.264，编码出来后生成的output.mp4视频内容如图所示。

ffmpeg -re -f lavfi -i "nullsrc=s=256x256, geq=random(1)*255:128:128" -vcodec libx264 -r:v 25 output.mp4

命令行执行之后，会使用nullsrc作为视频源，宽高为256×256，数据为随机雪花样。下面看一下命令行执行之后的效果图，如图所示。

6.12 FFmpeg对音视频倍速处理

在音视频处理中，常见的处理还包括音视频的倍速处理，如2倍速播放、4倍速播放，常见的处理方式包含跳帧播放与不跳帧播放，两种处理方式FFmpeg均可支持，跳帧处理方式的用户体验稍差一些，下面就来了解两个滤镜：atempo与setpts。

6.12.1 atempo音频倍速处理

在FFmpeg的音频处理滤镜中，atempo是用来处理倍速的滤镜，能够控制音频播放速度的快与慢，这个滤镜只有一个参数：tempo，将这个参数的值设置为浮点型，取值范围从0.5到2，0.5则是原来速度的一半，调整为2则是原来速度的2倍速。下面列举两个测试例子。
（1）半速处理

ffmpeg -i input.wav -filter_complex "atempo=tempo=0.5" -acodec aac output.aac

命令行执行之后，FFmpeg将会输出如下执行信息：

Input #0, aac, from 'input_audio.aac':
    Duration: 00:00:50.82, bitrate: 127 kb/s
        Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 127 kb/s
Stream mapping:
    Stream #0:0 (aac) -> atempo
    atempo -> Stream #0:0 (aac)
Press [q] to stop, [?] for help
Output #0, adts, to 'output.aac':
    Metadata:
        encoder         : Lavf57.71.100
         Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 128 kb/s
        Metadata:
            encoder         : Lavc57.89.100 aac
size=    1600kB time=00:01:39.94 bitrate= 131.1kbits/s speed=31.8

从命令行执行后的内容中可以看到，该命令行执行总时长消耗为输入的duration的2倍，处理过后的output.aac可以通过播放器播放，效果是源音频速度的一半。
（2）2倍速处理

ffmpeg -i input.wav -filter_complex "atempo=tempo=2.0" -acodec aac output.aac

命令行执行之后，FFmpeg将会输出如下执行信息：

Input #0, aac, from 'input_audio.aac':
Input #0, aac, from 'input_audio.aac':
    Duration: 00:00:50.82, bitrate: 127 kb/s
        Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 127 kb/s
Stream mapping:
    Stream #0:0 (aac) -> atempo
    atempo -> Stream #0:0 (aac)
Press [q] to stop, [?] for help
Output #0, adts, to 'output.aac':
    Metadata:
        encoder         : Lavf57.71.100
        Stream #0:0: Audio: aac (LC), 48000 Hz, stereo, fltp, 128 kb/s
        Metadata:
            encoder         : Lavc57.89.100 aac
size=     400kB time=00:00:24.98 bitrate= 131.2kbits/s speed=30.4x

从以上输出的内容中可以看到，该命令执行总时长消耗为输入的duration的二分之一，处理过后的output.aac可以通过播放器播放，效果会比源音频快一倍。

6.12.2 setpts视频倍速处理

在FFmpeg的视频处理滤镜中，通过setpts能够控制视频速度的快与慢，这个滤镜只有一个参数：expr，这个参数可用来描述视频的每一帧的时间戳，下面就来看一下setpts的可用的常见值，具体见表。

值	说明
FRAME_RATE	根据帧率设置帧率值只用于固定帧率
PTS	输入的pts时间戳
RICTIME	使用RTC的时间作为时间戳
TB	输入的时间戳的实践基

下面对如何使用PTS值来控制播放速度的应用列举两个例子。
（1）半速处理

ffmpeg -re -i input.mp4 -filter_complex "setpts=PTS*2" output.mp4

命令行执行之后FFmpeg将会输出如下信息：

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'input_video.mp4':
    Metadata:
        major_brand     : isom
        minor_version   : 512
        compatible_brands: isomiso2avc1mp41
        encoder         : Lavf57.66.102
    Duration: 00:00:50.00, start: 0.080000, bitrate: 2486 kb/s
        Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x714 [SAR 1:1 DAR 640:357], 2484 kb/s, 25 fps, 25 tbr, 25k tbn, 50 tbc (default)

如上述输出内容所示，输出的视频output.mp4的时长刚好是input.mp4的duration的2倍，因为是半速的视频，所以处理时间长度是原视频的2倍，而使用播放器播放output.mp4时将会看到其速度比原视频慢一半的运动效果。
（2）2倍速处理

ffmpeg -i input.mp4 -filter_complex "setpts=PTS/2" output.mp4

命令行执行之后FFmpeg将会输出如下信息：

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'input_video.mp4':
    Metadata:
        major_brand     : isom
 major_brand     : isom
        minor_version   : 512
        compatible_brands: isomiso2avc1mp41
        encoder         : Lavf57.66.102
    Duration: 00:00:50.00, start: 0.080000, bitrate: 2486 kb/s
        Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1280x714 [SAR 1:1 DAR 640:357], 2484 kb/s, 25 fps, 25 tbr, 25k tbn, 50 tbc (default)
        Metadata:
            handler_name    : VideoHandler

如以上输出内容所示，输出的视频output.mp4的时长刚好是input.mp4的duration的一半，因为是2倍速的视频，所以处理时间长度是原视频的一半，使用播放器播放output.mp4时将会看到速度比原视频快一倍的运动效果。

6.13 小结

FFmpeg功能强大的主要原因是其包含了滤镜处理avfilter，FFmpeg的avfilter能够实现的音频、视频、字幕渲染效果数不胜数。

你可能感兴趣的:(FFmpeg从入门到精通,ffmpeg,音视频,c++)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
C++设计模式：简单工厂、工厂方法、抽象工厂起个别名 C++算法 c++
1.工厂模式的特点在我们现实生活中，买馒头和自己蒸馒头、去饭店点一份大盘鸡和自己养鸡，杀鸡，做大盘鸡，这是全然不同的两种体验：自己做麻烦，而且有失败的风险，需要自己承担后果。买现成的，可以忽略制作细节，方便快捷并且无风险，得到的肯定是美味的食物。对于后者，就相当于是一个加工厂，通过这个工厂我们就可以得到想要的东西，在程序设计中，这种模式就叫做工厂模式，工厂生成出的产品就是某个类的实例，也就是对象。
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
C++设计秘籍：为什么所有参数都需类型转换时，非成员函数才是王道？讳疾忌医丶 c++前端开发语言
当所有参数都需要类型转换时，为什么要选择非成员函数？在C++的世界里，有一个看似简单却蕴含深意的设计原则：当所有参数（包括被this指针所指的那个隐式参数）皆须进行类型转换时，请为此采用非成员函数实现。这个原则背后隐藏着C++类型系统的精妙设计，也揭示了成员函数与非成员函数在处理隐式类型转换时的本质差异。想象一下，你正在设计一个数学计算库，需要支持整数与有理数的混合运算。如果你天真地将所有操作都实
深入了解 Vim 编辑器：从入门到精通誰能久伴不乏编辑器 vim linux
文章目录深入了解Vim编辑器：从入门到精通一、Vim的三个基本模式1.普通模式（NormalMode）2.插入模式（InsertMode）3.命令模式（CommandMode）二、常用快捷键光标移动删除操作复制和粘贴撤销和重做三、文件操作与搜索文件操作搜索文本替换文本四、Vim的进阶功能多文件编辑分屏功能标签页查看帮助五、总结深入了解Vim编辑器：从入门到精通Vim是一个强大的文本编辑器，广泛应用
初始化列表与类型转换（C++） 2401_89195731 c++开发语言
初始化列表和构造函数体在C++中都是用于给类的成员变量赋初值区别：初始化列表是给每个成员变量定义初始化的地方，即使有成员变量没有给它显式在初始化列表初始化，它也会走初始化列表初始化时机初始化列表：在对象创建时，成员变量通过初始化列表被直接初始化，这发生在构造函数体执行之前。构造函数体内赋值：成员变量首先被默认初始化，然后在构造函数体内通过赋值语句进行赋值。性能差异初始化列表：通常更高效，因为它避免
list的一些特性（C++） 2401_89195731 c++开发语言
C++STL库中的std::list是一个带头双向循环链表，使用之前需要包头文件，它和vector的使用高度类似。构造list支持多种构造方式默认构造函数：创建一个空的列表。拷贝构造函数：从另一个相同类型的列表创建一个新的列表。范围构造函数：从一对迭代器指定的范围内复制元素到新的列表中。初始值列表构造函数：使用初始化列表（initializerlist）创建一个包含指定元素的列表。填充构造函数：创
QML与C++相互调用函数并获得返回值 cpp_learners QML c++QML qt
这篇博客主要讲解在qml端如何直接调用c++的函数并获得返回值，在c++端如何直接调用qml的函数并获得返回值；主要以map或者jsonobject、list或者jsonarray为主！其他单个类型，常见的类型，例如QString、int等，就不演示了；一通百通。目录1准备工作1.1C++端1.2QML端2qml端直接调用c++端函数3c++端直接调用qml端函数3.1调用qml的qmlFuncO
c++ 编译链接时报错找不到某个函数，如何排查? sun007700 c++chrome 开发语言
在C++开发中，链接时出现“undefinedreferenceto”错误是常见问题，以下是系统化的排查流程和解决方案：1.确认基础问题（30秒检查）#检查函数声明是否存在grep"function_name"include/*.hsrc/*.cpp#检查是否包含实现文件ls-lsrc/#确认包含实现的.cpp文件在编译列表中2.签名匹配检查（最常见问题）//头文件声明-voidprocess_d
C++函数签名
C++函数签名-CSDN博客函数签名的组成部分函数名称函数的名字（如calculate、print）。参数列表（ParameterList）参数的类型、顺序和数量。参数的名字不影响签名（如intfunc(inta)和intfunc(intb)是同一签名）。所属的类或命名空间成员函数属于特定类（如MyClass::method）。自由函数属于全局或某个命名空间。成员函数的const/volatile
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
C++面试核心知识点全面解析：从基础到高级
掌握这些核心知识点，轻松应对90%的C++技术面试一、基础语法与关键字1.1const关键字的多种用法//1.常量变量constintMAX_SIZE=100;//2.常量指针与指针常量constint*ptr1=&var;//指向常量的指针int*constptr2=&var;//常量指针constint*constptr3=&var;//指向常量的常量指针//3.常量成员函数classMyCl
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
c++中如何排查死锁三月微风 c++java 开发语言
排查死锁（deadlock）是多线程C++开发中的一项核心调试技能，死锁通常是因为多个线程交叉持有资源而相互等待导致程序卡死。下面详细讲讲如何排查和预防死锁：一、死锁的常见成因锁获取顺序不一致（最常见）多个互斥量之间相互等待一个线程尝试多次加锁同一个非递归互斥锁忘记释放锁条件变量使用错误（如wait时未持锁）二、排查死锁的方法✅1.日志调试法在加锁和解锁前后打日志，确认：哪些线程获取了锁哪个线程卡
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
C++中的智能指针
智能指针是C++中用于自动化管理动态内存的类模板，通过封装原生指针，并利用RAII（资源获取即初始化）技术，确保内存的自动释放，从而避免内存泄漏和悬空指针问题。它是现代C++内存管理的核心工具之一。原生指针的缺陷：1.内存泄漏：忘记调用delete2.悬空指针：释放后仍访问指针3.重复释放：同一内存被多次delete智能指针的优势：1.自动释放内存，不需手动delete，超出作用域自动释放2.防止
C++中NULL等于啥奇妙之二进制嵌入式/Linux #C++编程法则 c++开发语言
文章目录**一、`NULL`的标准定义****二、常见实现方式**1.**定义为整数`0`**2.**定义为`0L`或`(void*)0`**（较少见）**三、与C语言的关键区别****四、`NULL`在C++中的问题**1.**重载函数匹配歧义**2.**模板参数推导错误****五、C++11+的替代方案：`nullptr`****六、最佳实践****七、总结**在C++中，NULL的定义与行为
C++ 性能优化指南三月微风 c++性能优化开发语言
C++性能优化指南（针对GCC编译器，面向高级工程师面试）代码优化面试常问点：如何避免不必要的对象拷贝？为什么要用引用或std::move？虚函数调用有什么性能开销？原理解释：传递对象时按值会拷贝整个对象，特别是大对象会频繁分配/释放内存，影响性能；应尽量改用引用或指针传递。C++11引入移动语义（move），允许“窃取”临时对象的资源，避免深拷贝。虚函数调用需要先通过对象的虚函数表指针（vptr
C++中的智能指针（1）：unique_ptr
一、背景普通指针是指向某块内存区域地址的变量。如果一个指针指向的是一块动态分配的内存区域，那么即使这个指针变量离开了所在的作用域，这块内存区域也不会被自动销毁。动态分配的内存不进行释放则会导致内存泄漏。如果一个指针指向的是一块已经被释放的内存区域，那么这个指针就是悬空指针。使用悬空指针会造成不可预料的后果。如果我们定义了一个指针但未初始化使其指向有效的内存区域时，这个指针就成了野指针。使用野指针访
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1