weixin_33693070

FFmpeg视频处理

FFmpeg是一个用于音视频处理的自由软件，被广泛用于音视频开发。FFmpeg功能强大，本文主要介绍如何使用FFmpeg命令行工具进行简单的视频处理。

安装FFmpeg可以在官网下载各平台软件包或者静态编译版本，也可以使用包管理工具安装。

基本概念
获得音视频信息
使用ffmpeg进行视频处理
- 选项
  - -y / -n
  - -codec(-c)
  - -ss
  - -t
  - -to
  - -f
  - -filter / -filter_complex
  - -vframes
  - -vn
  - -r
  - -s
  - -an
  - -threads
  - -shortest
- filter
  - scale
  - crop
  - overlay
  - drawtext
  - fade
  - fps
应用示例
- 视频转码
- 提取视频流
- 提取音频
- 按帧截取图像
- 按时间截取图像
- 截取视频片段
- 截取视频区域
- 拼接视频
- 将图片合并为视频
- 添加音频
- 添加水印
- 添加动画
- 添加文字
- 添加字幕
- 旋转视频

基本概念

容器

我们熟悉的mp4,rmvb,mkv,avi是多媒体容器文件格式（或称多媒体封装格式），所谓容器是指将不同的数据流(视频流，音频流，字幕流等)封装在一个文件(载体)中。

播放时各种流分别进行解码等处理后，然后输出到显示器和音响等设备进行播放。多媒体容器格式不同于编码格式，一个容器中可以封装多种编码格式的媒体流。

流封装了实际的媒体数据，如视频流，音频流和字幕流等。一般情况下，流中的数据只能使用一种编码格式。

帧率

帧率(frames per second, fps)是每秒画面刷新的次数，帧率越高视频越流畅。一般来说30fps就是可以接受的，60fps则可以明显提升交互感和逼真感，但是一般超过75fps一般就不容易察觉到有明显的流畅度提升了。

分辨率

分辨率表示画面的精细程度，通常用像素密度来表示，常用的单位为ppi(像素每英寸)。通常像素密度越高画面越精细，模糊程度越低。

对于视频文件而言，像素密度是无法控制的(由播放器和显示设备决定)。我们通常用视频的像素数来表示它的分辨率如1080x640, 640x320等。

比特率

比特率(bit rate)又称码率，表示多媒体流每秒输出的字节数，单位为KB/s, Kbps等。同样的压缩算法下，比特率越高音视频的质量越好。

可变码率(Variable Bitrate, VBR)指的是编码器的输出码率可以根据输入源信号的复杂度进行自适应调整，以在输出质量保持不变的条件下尽可能减少数据量。VBR适用于存储，不太适用流式传输。

固定码率(Constant Bitrate, CBR)指的是编码器输出码率固定，CBR不适合存储，对于复杂内容可能没有足够码率进行编码，从而导致质量下降，同时会在简单内容部分浪费一些码率。

采样率

每秒钟对音频信号的采样次数，采样频率越高声音还原度越高，声音更加自然，单位是赫兹 Hz。

音频文件一般使用的采样率是 44.1 kHz，也就是一秒钟采样44100次，实验发现低于这个值就会有较明显的损失，而高于这个值人的耳朵已经很难分辨，而且增大了数字音频所占用的空间。

视频编码

视频流可以看做图片的序列，我们把这个序列中的一张图片称为一帧。若存储视频中所有帧则会数据量过大，不便于存储和传输。

所幸统计表明大多数视频相邻帧之间的区别并不大，所以对于一段变化不大的视频，我们可以先完整编码帧A，其后的B帧只需要编码与A帧不同的部分，B帧后的C帧则只编码与B帧的差异。如此递推，将一段视频编码为一个序列。

当某个图像与之前的图像变化很大无法参考前面的帧来生成，我们就结束上一个序列将该帧完整编码开始一个新的序列。

H264是目前流行的一种视频编码算法，它定义了三种帧：完整编码的I帧，参考I帧生成只包含差异的P帧，以及以及参考前后帧编码的B帧。

H264采用的核心算法是帧内压缩和帧间压缩，帧内压缩是生成I帧的算法，帧间压缩是生成B帧和P帧的算法。

通常，我们也把完整编码的I帧称为关键帧。因为解码非关键帧需要解码其参考的帧，因此在截图等不需要全部解码的操作中，经常截取关键帧以提升性能。

获得音视频信息

ffprobe是FFmpeg项目提供的用于分析视频信息的命令行工具。

随意下载一个测试视频testmp4, 然后终端中输入指令:

ffprobe -v quiet -print_format json -show_format -show_streams test.mp4

可以获得json格式输出的视频信息:

{
    "streams": [ // 文件中包含的流
        {
            "index": 0,  // 流的序号
            "codec_name": "h264", // 流的编码格式
            "codec_long_name": "H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10", // 编码格式的全名
            "profile": "High", 
            "codec_type": "video", // video表示这是一个视频流
            "codec_time_base": "1/60",
            "codec_tag_string": "avc1",
            "codec_tag": "0x31637661",
            "width": 1080, // 视频宽为1080像素
            "height": 614, // 视频高为614像素
            "coded_width": 1080,
            "coded_height": 614,
            "has_b_frames": 2,
            "sample_aspect_ratio": "0:1",
            "display_aspect_ratio": "0:1",
            "pix_fmt": "yuv420p",
            "level": 31,
            "chroma_location": "left",
            "refs": 1,
            "is_avc": "true",
            "nal_length_size": "4",
            "r_frame_rate": "30/1", // 实际帧率
            "avg_frame_rate": "30/1",
            "time_base": "1/15360",
            "start_pts": 0,
            "start_time": "0.000000",
            "duration_ts": 153093,  
            "duration": "9.966992",  // 以秒为单位的视频时间
            "bit_rate": "2077265",  // 视频的比特率
            "bits_per_raw_sample": "8",
            "nb_frames": "299",
            "tags": {  // 流中的附加信息，其中的字段可能为空
                "rotate": 90, // 视频旋转的角度
                "language": "und",
                "handler_name": "VideoHandler"
            }
        },
        {
            "index": 1, // 流编号
            "codec_name": "aac", // 流的编码格式
            "codec_long_name": "AAC (Advanced Audio Coding)", // 编码格式的全名
            "profile": "LC",
            "codec_type": "audio", // 这是一个音频流
            "codec_time_base": "1/44100", 
            "codec_tag_string": "mp4a",
            "codec_tag": "0x6134706d",
            "sample_fmt": "fltp",
            "sample_rate": "44100", // 采样率
            "channels": 2, // 声道数
            "channel_layout": "stereo", // 声道布局，stereo为立体双声道
            "bits_per_sample": 0,
            "r_frame_rate": "0/0",
            "avg_frame_rate": "0/0",
            "time_base": "1/44100",  // 每帧时长
            "start_pts": 0,
            "start_time": "0.000000", // 流开始播放时间
            "duration_ts": 442367,
            "duration": "10.030998",  // 流时长
            "bit_rate": "129341",  // 比特率
            "max_bit_rate": "129341",
            "nb_frames": "433",
            "tags": {
                "language": "und",
                "handler_name": "SoundHandler"
            }
        }
    ],
    "format": {  // 容器信息
        "filename": "test.mp4",  // 文件名
        "nb_streams": 2,
        "nb_programs": 0,
        "format_name": "mov,mp4,m4a,3gp,3g2,mj2", // 封装格式名
        "format_long_name": "QuickTime / MOV",
        "start_time": "0.000000",
        "duration": "10.055000",
        "size": "2762615",  // 文件字节数
        "bit_rate": "2198002", // 比特率
        "probe_score": 100,
        "tags": {
            "major_brand": "isom",
            "minor_version": "512",
            "compatible_brands": "isomiso2avc1mp41",
            "encoder": "Lavf57.71.100"
        }
    }
}

示例中使用-v quiet选项将日志级别设为quiet避免日志信息污染json，-show_format显示文件的容器信息，-show_stream显示容器中流的信息，-show_frames则可以显示视频中每一帧的信息。

更多关于ffprobe的内容可以参考官方文档

使用ffmpeg进行视频处理

ffmpeg的命令格式:

ffmpeg \
    [global_options] \
    [input_file_options] -i input_url \
    [actions] \
    [output_file_options] output_url

我们可以将ffmpeg的选项分为全局选项和局部选项，局部选项用于设置输入输出或者滤镜等，通常位于被修饰的指令前面。

ffmpeg的基本流程为将容器中的各流进行解码，然后重新编码为指定的格式。在编码之前，可以使用filter对视频进行处理。

选项

选项的详细内容请参考官方文档

`-y` / `-n`

-y/-n 为全局选项, -y表示直接覆盖已经存在的输出文件， -n表示若某个输出文件已经存在则退出。

若没有设置-y或-n选项，且某个输出文件已经存在ffmpeg会询问是否要覆盖输出文件。

ffmpeg -y -i test.mp4 test.mkv

`-codec`(`-c`)

指定输入输出的解码编码器, 可用的编解码器可以参考官方文档:

fmpeg -y -i test.mp4 -c:v libx264 -c:a copy test.mov

codec指定为copy则将输入流直接复制到输出流不进行编解码操作。

使用-c:STREAM_INDEX方式可以指定某一个流的解码器，STREAM_INDEX为stream对象的index属性。

-c:v或-vcodec可以为所有视频流指定编码器，-c:v:1为第2个视频流指定编解码器。

-c:a或-acodec可以为所有音频流指定编码器，-c:a:12为第13个视频流指定编解码器。

`-ss`

-ss选项用于设置流的开始时间，可以设置输入输出或者滤镜。在开始时间之前的帧将被跳过不被处理(输入不被解码，输出不被编码，滤镜不被处理)。

ffmpeg -ss 2 -t 10 -i test.mp4 test.mov

时长有两种方式来表示:

秒数: 如-t 10, -t 23.167
时分秒: 如-t 10:23, -t 21:31:00.233

`-t`

-t选项用于用于设置输入输出，-t在-i前可以限制输入时长，-t在输出文件前可以限制输出时长。

读入test.mp4文件2s开始10s内的数据，转码后输出到test.mov:

ffmpeg -ss 2 -t 10 -i test.mp4 test.mov

读入test.mp4全部数据，全部转码后输出从第2s开始1min10s内的数据到test.mov:

ffmpeg -i test.mp4 -ss 2 -t 01:10 test.mov

`-to`

-to选项类似于-t选项，不同的是-to指定结束时刻，-t指定持续时间。

读入test.mp4文件2s到12s内的数据，转码后输出到test.mov:

ffmpeg -ss 2 -to 12 -i test.mp4 test.mov

读入test.mp4全部数据，全部转码后输出从01:00到01:30内的数据到test.mov:

ffmpeg -i test.mp4 -ss 01:00 -to 01:30 test.mov

`-f`

强制设置输入输出的文件格式，默认情况下ffmpeg会根据文件后缀名判断文件格式。

ffmpeg -formats命令会显示所有支持的编码格式。

`-filter` / `-filter_complex`

使用过滤器对流进行处理，下文将简要介绍filter的相关内容。

可以使用-vf代替-filter:v处理视频流, -af代替-filter:a处理音频流。

`-vframes`

设置输出文件中包含的总帧数:

ffmpeg -i test.mp4 -vframes 1 test.mov

`-vn`

不将视频流写到输出文件中

ffmpeg -i test.mp4 -vn -a:c copy out.mp3

`-r`

设置某个流的帧率:

ffmpeg -i test.mp4 -r:v 30 test.mov

`-s`

设置帧的大小:

ffmpeg -i test.mp4 -s 1080x680 out.mp4

`-an`

不将音频流写到输出文件中:

ffmpeg -i test.mp4 -v:c copy -an out.mp4

`-threads`

设置处理线程数:

ffmpeg -threads 8 -i test.mp4 out.mp4

可以设置处理

`-shortest`

当最短的输入流结束后即停止编码和输出。

ffmpeg -i bgm.mp3 -i test.mp4 -shortest output.mp4

filter

过滤器会对已解码的帧进行处理，处理后的帧会被重新编码输出，整个流程可以概括为:

Input -> DecodedFrames -> FilteredFrames -> EncodedData

简单过滤器是单输入单输出的(只能处理一个流)，而复杂过滤器(filter_complex)是多输入多输出的可以进行更复杂的操作。

ffmpeg支持的各种滤镜可以参考官方文档-滤镜。

scale

ffmpeg -y -i test.mp4 -vf "scale=2*in_w:2*in_h" test.mov

scale滤镜用于缩放视频, in_w和in_h代表输入的宽和高。

crop

ffmpeg -y -i test.mp4 -vf "crop=w=100:h=100:x=in_w/2:y=in_h,scale=400:400" test.mov

crop滤镜用于截取视频中的一个区域。

overlay

ffmpeg -y -i test.mp4 -i logo.png -filter_complex 'overlay=10:main_h-overlay_h-10' out.mp4

overlay滤镜将一个视频叠放在另一个视频上，可用于在视频中添加水印和动画等操作。

overlay的第一个输入为底层视频流，第二个输入为叠加视频流。main_w和main_h为底层视频的宽和高，overlay_w和overlay_h为叠加视频的宽和高。

drawtext

ffmpeg -y -i test.mp4 -vf "drawtext=fontfile=CourierNew.ttf:text='hello world':x=100:y=50:fontsize=24" out.mp4

drawtext滤镜用于在视频上添加文字。

fade

ffmpeg -y -i test.mp4 -vf "fade=in:st=0:d=5" out.mp4

fade滤镜可以制作淡入淡出效果

fps

ffmpeg -y -i test.mp4 -vf "fps=60" out.mp4

fps滤镜通过删除帧或者复制帧的方法强制设置帧率。

ffmpeg -y -i test.mp4 -vf "fps=1" img%3d.png
ffmpeg -y -i test.mp4 -r 1 img%3d.png

上面两条指令都可以对视频每秒截取一帧图像，-r选项会截取关键帧并不一定截取0s、1s...处的帧，fps滤镜处理的是已经解码的帧因此可以精确的按照时间截取。

因为fps滤镜会解码要截图的视频片段，因此这种方式截图会慢很多。

应用示例

视频转码

ffmpeg -y \
    -i test.mp4 \
    -vcodec copy \
    -acodec copy \
    out.mkv

这条指令将容器格式由MP4转换到MKV，使用ffprobe检查输出文件可以发现，视频流没有发生变化，但是封装格式改变为mkv格式。

-vcodec是一个简单过滤器用于处理视频编码，copy表示将视频流复制到输出文件中。-acodec是处理音频编码的过滤器。

提取视频流

ffmpeg -y \
    -i test.mp4 \
    -vcodec copy \
    -an \
    out.mp4

-an表示不保留音频流。

提取音频

ffmpeg -y \
    -i test.mp4 \
    -ar 44100 -ac 2 -ab 192 \
    -f mp3 \
    output.mp3

分析:

-ar: 指定输出音频采样率
-ac: 指定输出音频通道(channel)数, 这里设置为双声道
-ab: 指定输出音频比特率，单位kb/s

按帧截取图像

截取第2s开始的10帧图像, 伸缩为352x240:

ffmpeg -y \
    -ss 2 -i test.mp4 \
    -vframes 10 \
    -f image2 \
    -s 352x240 \
    img%03d.png

分析:

-ss 2 -i test.mp4: ss为开始时间，用秒数或者hh:mm:ss[.xxx]格式表示。-i test.mp4表示输入源
-vframes: 指定截取的帧数, 这里是截取前10帧(从-ss指定开始时间算起）
-f: 指定输出文件的格式，如: image2, mjpeg, gif
-s: 对输出画面进行缩放
img%03d.png: 格式化输出文件名，本示例中输出img001.png, img002.png等。

-ss参数也可以放在vframes前:

ffmpeg -y \
    -i test.mp4 \
    -ss 2 -vframes 1 \
    -f image2 \
    -s 352x240 \
    img.png

-ss参数是局部选项用于设置其后的一个命令，-ss 2 -i test.mp4表示从输入视频的第2s开始处理，忽略前两秒的内容。

而-ss 2 -vframes 1表示从第2s开始截取，此时前2s的内容已经进行了解码。

对不需要处理的部分进行解码会浪费大量时间，因此建议使用-ss 2 -i test.mp4来表示截图开始时间。

按时间截取图像

从第2s到第12s内，每秒截取1帧图像:

ffmpeg -y \
    -ss 2 -i test.mp4 \
    -r 1 -t 10 \
    -f image2 \
    -s 352x240 \
    img%03d.png

分析:

-t: 指定截取时长，这里截取10s
-r 1: -t的局部选项设置每秒截取的帧数(截取帧率)，若不设置则截取全部帧

和-vframe一样-t的开始时间也有两种设置方式，基于同样的理由同样建议将-ss放在输入前。

截取视频片段

截取视频片段的方法与截图方法类似，只是将输出格式变为视频:

按时间截取：

 ffmpeg -y \
    -ss 2 -i test.mp4 \
    -r 20 -t 10 \
    -s 352x240 \
    clip.mp4

因为输出为视频，-r指定的截取帧率即为输出视频帧率。

按帧数截取：

ffmpeg -y \
    -ss 2 -i test.mp4 \
    -vframes 120 \
    -s 352x240 \
    clip.mp4

截取视频区域

截取视频区域:

ffmpeg -y \
    -ss 2 -i test.mp4 \
    -r 1   \
    -t 10 \
    -filter_complex "[0:v]crop=w=100:h=100:x=12:y=34,scale='400:400'[v]" \
    -map "[v]" \
    img%03d.png

crop滤镜可以截取视频部分区域，[0:v]crop=w=100:h=100:x=12:y=34,scale='400:400'[v]截取了左上角在(12,34)处，宽为100，高为100的矩形框中的内容，并将截图放大到400x400。

拼接视频

ffmpeg -i "concat:1.mp4|2.mp4|3.mp4" -c copy output.mp4

将图片合并为视频

ffmpeg -i img%3d.png output.gif
ffmpeg -i img%3d.png output.mp4

添加音频

ffmpeg -i bgm.mp3 -i test.mp4 output.mp4

添加水印

ffmpeg -y \
    -i test.mp4 \
    -i 1.png \
    -filter_complex "[1]scale=w=480:h=280[s];[0][s]overlay=x=main_w-overlay_w-10:y=main_h-overlay_h-10[ov]" \
    -map "[ov]" \
    output.mp4

使用filter_complex先将水印图片(输入1)放大到480x280, 然后使用overlay滤镜将放大后的流[s]覆盖到视频(输入0)上。

若不需要使用scale进行缩放，则可以简化filter_complex表达式:

ffmpeg -y \
    -i test.mp4 \
    -i 1.png \
    -filter_complex "overlay=x=main_w-overlay_w-10:y=main_h-overlay_h-10" 
    output.mp4

添加动画

ffmpeg -y -i test.mp4 -t 10 -loop 1 -framerate 6 -i ani%3d.png -filter_complex 'overlay=10:main_h-overlay_h-10' out.mp4

将多张图片(ani001.png, ani002.png...)组成动画, 然后将这个动画叠加在视频的左下角。-t 10 -loop 1会循环播放动画，持续10s。

该方式也支持gif格式的动画。

添加文字

ffmpeg -y -i test.mp4 -vf "drawtext=fontfile=CourierNew.ttf:text='hello world':x=100:y=50:fontsize=24" out.mp4

添加字幕

添加字幕有两种方式:

将字幕添加为独立的流，mkv,avi等封装格式支持此种方式，mp4格式不支持
将字幕叠加到视频中

添加字幕流:

ffprobe -show_streams -print_format json out.mp4

叠加字幕:

ffmpeg -i test.mp4  -i sub.srt -filter_complex "[0][1]overlay[v]" -map "[v]" out.mp4

HowToBurnSubtitlesIntoVideo详细介绍了烧录字幕的方法，作者建议尽量使用字幕流的方法添加字幕。

旋转视频

旋转视频有两种方式:

在视频元信息中添加旋转角度信息，由播放器执行旋转
将每帧图像旋转

添加元信息:

ffmpeg -i test.mp4 -metadata:s:v rotate="90" -codec copy out.mp4

逐帧旋转:

ffmpeg -i test.mp4 -vf "transpose=1" out.mp4

transpose滤镜的文档

你可能感兴趣的:(FFmpeg视频处理)

python ffmpeg直播_FFmpeg+Nginx+Rtmp+HLS+Videojs搭建直播网站（理论与实战） weixin_39565300 python ffmpeg直播
第1章直播原理与架构28分钟2节1-1直播原理与架构直播原理与架构「仅限付费用户」点击下载“直播原理与架构.pdf”[14:53]开始学习1-2甜点：福优学苑--简历包装与面试技巧甜点：福优学苑--简历包装与面试技巧「仅限付费用户」点击下载“福优学苑--简历包装与面试技巧--51other.pdf”[13:36]开始学习第2章亲手搭建FFmpeg+Nginx直播网站1小时48分钟11节2-1直播引
使用nginx+rtmp+ffmpeg实现桌面直播 handsomestWei 后端 nginx ffmpeg rtmp live直播推流拉流
使用nginx+rtmp+ffmpeg实现桌面直播流媒体服务器搭建dockerrundocker镜像基于添加了rtmp模块的nginx，和ffmpegdockerpullalfg/nginx-rtmpdockerrun-d-p1935:1935-p8080:80--name=nginx-rtmpalfg/nginx-rtmprtmp模块说明进入容器内部查看dockerps|grepalfg/ngi
springboot java ffmpeg 视频压缩、提取视频帧图片、获取视频分辨率因我你好久不见 java spring boot ffmpeg
用到的maven依赖：lombok依赖就不贴出来了org.bytedecoffmpeg-platform4.3.2-1.5.5org.apache.commonscommons-lang33.12.0cn.hutoolhutool-all5.5.2工具类：importcn.hutool.core.io.IoUtil;importlombok.extern.slf4j.Slf4j;importorg
QT+FFmpeg如何使用GPU加速解码？ bug菌¹ 全栈Bug调优(实战版)qt ffmpeg 开发语言 c++
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.确保FFmpeg和CUDA的支持2.正确选择硬件解码器设置硬件解码器3.初始化CUDA硬件设备4.硬件解码流程解码帧并处理硬件帧5.检查FF
ffmpeg音频命令（常用篇）晓光尘梦其他知识点学习 ffmpeg 音视频
写在前面使用ffmpeg的主要原因是工作需要，期间总是会涉及音频的采样率、音量啥的转换，音频的剪切与合成叠加。这是以前在别的平台发布的，整合一下丢在这，方便以后查阅。一、工作时涉及到的音频名词1、声道当人听到声音时，能对声源进行定位，那么通过在不同的位置设置声源，就可以造就出更好的听觉感受。声道越多的话，更能获得身临其境的听音体验，声音的环绕效果也会更加的真实。比如手机的单扬声器就是单声道，有双扬
x86平台基于Qt+opengl优化ffmpeg软解码1080P视频渲染效率 zanglengyu Qt上位机开发 qt ffmpeg 音视频
一般的在arm嵌入式平台，大多数板子都要硬解码硬件渲染的框架，使用即可。在x86下比较麻烦了。优化的思路一共有以下几个方面，1.软解码变成硬解码2.将YUV转QImage的操作转移到GPU3.QWidget渲染QImage变成opengGL渲染AVFrame这三点优化来说2与3是优化的效率是非常显著的。1的优化效果往往需要将硬解码的数据copy至CPU再使用2-3的优化。这样一来，解码效率提升了，
FFmpeg 基本语法全面介绍陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ffmpeg
1.FFmpeg基本语法结构FFmpeg的命令行工具遵循以下基本语法结构：ffmpeg[全局选项]-i输入文件[输入选项][输出选项]输出文件语法说明：ffmpeg：命令行工具的名称。[全局选项]：适用于整个命令的选项（如日志级别、覆盖输出文件等）。-i输入文件：指定输入文件或流。[输入选项]
ffmpeg实现视频拼接，图片生成视频demo 德玛西亚没有明天 ffmpeg 音视频
利用ffmpeg实现图片生成视频，视频拼接，添加字幕等$img){//添加背景//$returnImg="backImg{$key}.jpg";//$output="output{$key}.mp4";//$returnImg=$this->addBack($img,$returnImg);$output="output0.mp4";$returnImg="backImg0.jpg";$time=
FFmpeg 源码编译安装 coolhuhu~ 语音 linux ffmpeg
参考：https://trac.ffmpeg.org/wiki/CompilationGuide/UbuntuLinux(Ubuntu)下载FFmpeg源码，并将其解压，这里我将它放在~/ffmpeg_source目录下；cd~/ffmpeg_sourceswget-Offmpeg-snapshot.tar.bz2https://ffmpeg.org/releases/ffmpeg-snapsho
大规模GPU集群的进阶之路卢旗人工智能
大家好，我是卢旗。今天来聊聊GPU。GPU，全称GraphicProcessingUnit，即图形处理器。它的并行处理能力非常强大，能够同时处理多个任务和数据，因此被广泛用于图形渲染、视频处理、深度学习、科学计算等领域。研发团队在负责制定硬件选型策略并设计优化下一代大规模GPU集群的软硬件架构时，我们需要关注GPU技术的最新进展、重点研究问题以及潜在的技术突破。一、GPU在重点研究的问题算力提升与
ffmpeg源码分析：avformat_open_input() 风雨兼程8023 ffmpeg ffmpeg
目录一、avformat_alloc_context()二、init_input()2.1av_probe_input_format2()2.2av_probe_input_buffer2()2.3io_open三、read_header()本文简单分析FFmpeg中一个常用的函数：avformat_open_input()。该函数用于打开多媒体数据并且获得一些相关的信息。它的声明位于libavf
FFMpeg 源码分析（3）avformat_open_input（）雷霆小屁熊 FFmpeg ffmpeg
这个函数主要用来打开媒体资源。完成媒体格式的探测和获取相关的媒体信息的工作。函数完成定义如下：intavformat_open_input(AVFormatContext**ps,constchar*filename,AVInputFormat*fmt,AVDictionary**options){AVFormatContext*s=*ps;inti,ret=0;AVDictionary*tmp=
FFMPEG源码分析：avformat_open_input()（媒体打开函数） sunshineywz ffmpeg
本文分析了FFMPEG中的媒体打开函数avformat_open_input()//参数ps包含一切媒体相关的上下文结构，有它就有了一切，本函数如果打开媒体成功，//会返回一个AVFormatContext的实例．//参数filename是媒体文件名或URL．//参数fmt是要打开的媒体格式的操作结构，因为是读，所以是inputFormat．此处可以//传入一个调用者定义的inputFormat，
iOS 中使用 FFmpeg 的高级功能 - 滤镜（Filters）陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ios ffmpeg
FFmpeg提供了强大的滤镜功能，可以对音视频进行各种处理，例如裁剪、缩放、添加水印、调整颜色、添加特效等。1.FFmpeg滤镜基础知识1.1什么是滤镜（Filters）？滤镜是FFmpeg提供的一种功能，用于对音视频流进行处理。滤镜链（FilterChain）是多个滤镜的组合，按顺序对输入流进行处理。滤镜图（FilterGraph）是一个复杂的滤镜链，可以包含多个输入和输出。1.2常见的滤镜滤镜
ffmpeg configure 研究2:分析屏幕输出及文件输出的具体过程 hjjdebug #config configure 变量函数
author:hjjdebugdate:2025年02月17日星期一16:57:55CSTdescription:ffmpegconfigure研究2分析屏幕输出及文件输出的具体过程文章目录0.执行./configure命令1.sed:can'tread信息是从哪里来的?1.1find_filters_extern()1.2find_things_extern()2.屏幕输出信息的来源2.1,查找
ffmpeg源码简析（五）编码——avformat_alloc_output_context2()，avcodec_encode_video2() 小码哥_WS 流媒体-直播-编解码 ffmpeg ffmpeg 编码源码
1.avformat_alloc_output_context2()在基于FFmpeg的视音频编码器程序中，该函数通常是第一个调用的函数（除了组件注册函数av_register_all()）。avformat_alloc_output_context2()函数可以初始化一个用于输出的AVFormatContext结构体。它的声明位于libavformat\avformat.h，如下所示。intav
FFmpeg源码：av_strlcpy函数分析崔杰城 FFmpeg源码分析 ffmpeg
一、引言在C/C++编程中经常会用到strcpy这个字符串复制函数。strcpy是C/C++中的一个标准函数，可以把含有'\0'结束符的字符串复制到另一个地址空间。但是strcpy不会检查目标数组dst的大小是否足以容纳源字符串src，如果目标数组太小，将会导致缓冲区溢出。针对该问题很多C/C++开源库都会选择自己实现strcpy函数来保证安全性。而FFmpeg自定义了av_strlcpy函数，在
ffmpeg 多路流处理在iOS的具体使用陈皮话梅糖@ FFmpeg音视频高阶技术讲解 ffmpeg ios
多路流处理可以用于操作音视频文件中的多个流（如视频流、音频流、字幕流等），实现流的提取、替换、合并等操作。1.什么是多路流处理？1.1多路流的概念一个多媒体文件（如MP4、MKV）通常包含多个流：视频流：存储视频数据。音频流：存储音频数据。字幕流：存储字幕数据。FFmpeg提供了强大的工具来操作这些流，例如提取、替换、合并等。1.2常见的多路流操作操作类型功能描述提取流从文件中提取特定的流（如音频
ffmpeg-cli-wrapper操作ffmpeg的工具 NaughtyBo 视频&流媒体 ffmpeg
学习链接ffmpeg-cli-wrapper-内部封装了操作ffmpeg命令的java类库，它提供了一些类和方法，可以方便地构建和执行ffmpeg命令，而不需要直接操作字符串或进程。并且支持异步执行和进度监听springboot-ffmpeg-m3u8-convertor-gitee代码-springboot+ffmpeg，将视频转换为m3u8格式。支持.mp4|.flv|.avi|.mov|.w
使用 Python 爬虫和 FFmpeg 爬取 B 站高清视频大懒猫软件 python 爬虫 ffmpeg
以下是一个完整的Python爬虫代码示例，用于爬取B站视频并使用FFmpeg合成高清视频。1.准备工作确保安装了以下Python库和工具：bash复制pipinstallrequestsmoviepy2.爬取视频和音频文件B站的视频和音频文件通常是分开存储的，需要分别下载视频和音频文件，然后使用FFmpeg合成。Python复制importrequestsfrommoviepy.editorimp
Cameralink转SDI接口转换器昆山森启智能科技有限公司
1.概述Cameralink转SDI接口转换器（简称转换器）是基于FPGA设计的一款多功能视频处理设备，具有丰富的硬件资源和外围接口。转换器将Cameralink接口输入的图像数据转成SDI图像输出，同时还可实现数据格式转换，帧率变换，分辨率变换，OSD，缩放，开窗，增强等图像预处理功能。2.技术特性2.1主要功能a.支持Cameralink视频输入（支持多种分辨率默认1080p@30hz）b.支
FFMpeg源码分析-io_open_default() 坚持不懈z ffmpeg
主要函数调用关系如下图所示/**s:传进去的AVFormatContext结构体pb：函数调用成功之后创建的AVIOContext结构体。url：输入输出协议的地址（文件也是一种“广义”的协议，对于文件来说就是文件的路径）。flags：打开地址的方式。可以选择只读，只写，或者读写。取值如下。AVIO_FLAG_READ：只读。AVIO_FLAG_WRITE：只写。AVIO_FLAG_READ_WR
ffmpeg源码分析：avio_open2() 风雨兼程8023 ffmpeg ffmpeg
目录一、ffurl_open_whitelist1.1ffurl_alloc()1.2ffurl_connect二、ffio_fdopen2.1avio_alloc_context()libavformat\Avio.h/***CreateandinitializeaAVIOContextforaccessingthe*resourceindicatedbyurl.*@noteWhentheres
FFmpeg源码分析：avformat_open_input chaisy971124568 WebRTC 音视频 FFmpeg ffmpeg
一、函数功能介绍当前支持的媒体解封装协议在libavformat/demuxer_list.c文件的demuxer_list变量中定义当前支持的音视频采集格式在libavdevice/indev_list.c文件的indev_list变量中定义用户可以自行查看av_find_input_format函数的具体逻辑，得知最新版本的ffmpeg支持情况。注意：若进行音视频采集之前，则必须执行avdev
python M3U8转换为MP4 会飞的鱼— python
importosimportasyncioimportrandomimportshutilimportaiohttpimportffmpegfromconcurrent.futuresimportThreadPoolExecutor#M3U8文件的URL#m3u8_url='********************.m3u8'#临时存储TS文件的文件夹ts_folder='ts_files'os.
腾讯HunyuanVideo-HD：高清视频处理技术的革新 IT·小灰灰音视频自动化人工智能深度学习数据挖掘图像处理数据分析
在数字化时代，视频内容已成为信息传播的主要形式之一。随着用户对视频质量要求的不断提高，高清视频处理技术成为了各大科技公司竞相研发的重点。腾讯作为中国领先的互联网科技公司，一直致力于推动视频处理技术的创新。最近，腾讯推出了HunyuanVideo-HD，这是一项旨在提升高清视频处理效率和质量的技术。本文将深入探讨HunyuanVideo-HD的技术特点、应用场景、使用方法及其对行业的影响。目录一、技
opencv全面详解教程听忆. 机器学习深度学习计算机视觉人工智能
opencv全面详解教程1.OpenCV简介2.安装OpenCV2.1使用pip安装（适用于Python）2.2通过conda安装2.3从源码编译（高级）3.OpenCV基本操作3.1读取和显示图像3.2保存图像3.3视频处理4.图像处理操作4.1调整大小和裁剪4.2颜色空间转换4.3图像平滑（滤波）4.4边缘检测5.形态学操作6.特征检测与匹配6.1角点检测（Harris）6.2SIFT、SUR
PCM音频文件播放-PC软件推荐+android代码 superZhiChaoc Android android 音视频 java
PCM音频文件播放PC工具推荐Audacity音频处理PC端可以播放PCM的软件，亲测可用，并且作者很贴心了附上了可下载的FFMPEG库，按照步骤导入即可。但是我发现一个问题，我这边的PCM播放的时候，速率不对，我需要按照0.5X速播放才是正常，其他的一切正常，还能看到波形图。android代码Androidpcm文件播放方法(AudioTrack)别的作者的，亲测可用。播放正常。下面是我本地的方
linux下ffmpeg编译成so文件,Mac 编译FFmpeg成一个SO库灰先森
FFmpeg使用第三步，编译FFmpeg成一个SO库.编译环境macOSHighSierri10.13.3android-ndk-r14bFFmpeg3.4.2简介由于ffmpeg编译的so数目繁多，直接使用这些类库还是比较麻烦的.因此可以将它们合并为一个类库libffmpeg.so.操作步骤与编译多个so的脚本不同，这个脚本不再需要修改Configure的内容(生成的是.a而不是.so，并没有涉
OpenCV开发笔记（八十一）：通过棋盘格使用鱼眼方式标定相机内参矩阵矫正摄像头图像长沙红胖子Qt（技术Q群4597637） Qt开发图形图像处理 OpenCV图像处理 opencv 鱼眼畸变矫正鱼眼摄像头标定
若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/142614975长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬结合等等）持续更新中…OpenCV开发专栏（点击传送门）上一篇：《OpenCV开发笔记（八十）
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_