音视频开发老马

如何用FFMpeg生成视频

前言

FFMpeg读做“FF Mpeg”，“FF”指的是“Fast Forward”，而“Mpeg”指的是Moving Picture Experts Group（动态图像专家组）。

根据官方介绍，FFMpeg是一个完整的、跨平台的音频和视频录制、转换和流媒体解决方案。简单来说，只要涉及音视频开发，基本绕不开这个工具。

一、快速入门

FFMpeg快速入门的话，建议查看阮一峰老师的《FFmpeg 视频处理入门教程》，里面讲述了音视频处理的一些基本概念，比如FFMpeg支持的容器、编码格式以及编码器；还有就是讲述FFMpeg的常见用法，比如查看文件信息、转换编码格式、提取音频等。

二、音视频基础知识

我自己在使用FFMpeg的时候发现，想要把FFMpeg用得明白，一些基本的音视频基础知识的了解还是很有必要的，所以在这里做下总结。

现在短视频那么火，相信大家也是常看，而一个视频的构成其实也不复杂，就是图像、音频、字幕的一个组合。

对于图像，它有两个概念需要区分好，分别是图像格式和色彩空间。图像格式就是图片压缩编码以及存储的方式，比如我们常见的JPEG和PNG。色彩空间是颜色的数学描述方式，根据不同的表示方法分为不同的色彩模型，最常用的色彩模型有三类，RGB(用于计算机图形学)，YUV(用于视频系统), CMYK(用于彩色印刷)。（后面会经常看到YUV）

对于音频，也有两个概念比较重要，一个是采集到的原始音频数据（比如PCM），另一个是压缩后的音频数据，比如AAC，后面也会经常看到。

对于字幕，常见的有三种格式，分别是srt、ssa和aas。

srt字幕即文本格式字幕，它算是最简单的字幕了，因为它仅由时间和字幕内容构成，比如下面：

# 第一行是编号，表示第几个字幕
# 第二行是时间范围，精确到毫秒
# 第三话就是显示的文本内容

0
00:00:00,000 --> 00:00:01,000
假设张三携带10万美刀进行投资

1
00:00:02,000 --> 00:00:03,000
兑换成人民币后，银行就多了10万美刀的外汇

ssa字幕是比srt字幕更先进的字幕文件格式，而与它比较类似的ass字幕其实就是ssa字幕的plus版本，ass字幕的实质是SSA v4.00+，是基于SSA 4.00+编码构建的。下面是ass字幕的具体内容：

# 这是从上面的srt字幕转换得到的ass字幕
# Script Info：包含脚本的头部和总体信息
# V4+ Styles：包含了所有样式的定义
# Events：包含了所有脚本的事件，有字幕、注释、图片等
[Script Info]
; Script generated by FFmpeg/Lavc58.91.100
ScriptType: v4.00+
PlayResX: 384
PlayResY: 288
ScaledBorderAndShadow: yes

[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
Style: Default,Arial,16,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,0

[Events]
Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Dialogue: 0,0:00:00.00,0:00:01.00,Default,,0,0,0,,假设张三携带10万美刀进行投资
Dialogue: 0,0:00:02.00,0:00:03.00,Default,,0,0,0,,兑换成人民币后，银行就多了10万美刀的外汇

三、一个视频的构建

我之所以要用FFMpeg，源于我想通过图片生成视频，并加上音频和字幕，从而构成一个完成的视频，所以下面我主要说说在构建时的一些心路历程（坑）。

3.1 项目结构

本次实践生成的音视频都会上传到Github，可以点击这里查看：

# 项目结构
$ tree -l -L 1
.
├── add_audio  # 添加音频
├── add_caption # 添加字幕
└── img_to_video # 图片转视频

3.2 图片生成视频

为了方便展示，我从网上随便找了一张图片：

图片转视频的命令如下：

$ ffmpeg -r 25 -i img001.jpg -vcodec libx264 -pix_fmt yuv420p one_img_to_video.mp4
...
[libx264 @ 0x7faf5b809200] i8c dc,h,v,p: 65% 19%  9%  7%
[libx264 @ 0x7faf5b809200] kb/s:8960.40

下面是各个参数的逐个解析：

-r：rate，用于设定视频帧率。视频帧率即每秒显示帧数，常见的有30FPS、25FPS或者24FPS。本次设定为25FPS，即每秒有25张图片。
-i：input，即输入源文件。
-vcodec：video codec，即视频的编码格式，常见的有H.264，即libx264。
-pix_fmt：pixel formats，即像素格式，yuv420p是上文提到的YUV中的一种。
one_img_to_video.mp4：最后输出的文件名。

生成之后的视频，可以看到时长非常短（0秒），这是因为帧率设定是25，但是只输入了一张图片，图片数不够，所以生成的视频时长非常短。

解决办法有两种：一是降低帧率（不推荐），二是增加图片数量（推荐）。

我一开始是通过降低帧率来提高时长（我的需求是同一张图片要显示10秒左右），因为25FPS就是一秒25张图片，那如果设置为0.1FPS，等同于1张图片10秒，测试如下：

$ ffmpeg -r 0.1 -i img001.jpg -vcodec libx264 -pix_fmt yuv420p one_img_to_video_small_rate.mp4

通过下图，可以看到延长时长的目的确实达到了，但是这种方式生成的MP4其实是有问题的，不仅剪辑软件无法支持（比如剪映），在添加音频、字幕的时候也非常奇怪（血的教训）。

第二种方式是增加图片数量，这也是我使用剪映之后发现的，因为与剪映拖动图片增加视频长度的原理是一致的：

批量增加图片可以随便写个脚本就可以得到，但是图片的数量需要计算一下，比如一个时长10秒，帧率25FPS的视频就需要 10 x 25 = 250张图片：

# 输入为多张图片时，可使用这种写法
# %03d 其实就是 001、002、003...100
$ cd img_to_video

$ ffmpeg -r 25 -i img/img%03d.jpg -vcodec libx264 -pix_fmt yuv420p multi_img_to_video.mp4

这里可能有人会疑惑，为什么每次我都会带上 -pix_fmt yuv420p参数？这其实也是一个坑，因为如果不加这个参数，有些软件没办法识别生成的MP4文件，比如Mac 的QuickTime Player。

原因可以从官方文档得到，因为我们生成视频的方式其实是通过图像序列（一系列的图片）的方式，对应的编码类型为image2，这也是为什么有时在一些文章上可以看到他们的命令比上述命令多了 -f image2参数（加不加都无所谓）。在这种编码下，默认的pix_fmt参数并不是yuv420p，而是通过第一张图片得到，而JPG图片用的都是RGB，所以最终生成的视频无法识别。

3.2 视频添加音频

通过上面的方式生成的视频是没有声音的，所以我们需要通过FFMpeg为其加上音频。

有时候我们得到的音频格式并不是MP3，而是WAV，这时我们可以通过下面的命令进行转换：

$ ffmpeg -i input.wav -vn -ar 44100 -ac 2 -b:a 192k output.mp3

-i： 上文也提到过，即我们的输入文件

-vn：禁用视频，确保没有视频被包括在内

-ar：设置音频采样频率。对于输出流，它默认设置为相应的输入流的频率。对于输入流，这个选项只对音频抓取设备和原始解复用器有意义，并被映射到相应的解复用器选项中。

-ac：设置音频通道的数量。这里为2是为了确保它是立体声（2个通道）。对于输出流，它默认设置为输入音频通道的数量。对于输入流，这个选项只对音频抓取设备和原始解复用器有意义，并被映射到相应的解复用器选项中。

-b:a：将音频比特率（audio bitrate）转换为精确的192kbit/秒

上面的解释涉及到解复用这个术语，那什么是解复用呢？当我们打开一个多媒体文件之后，第一步就是解复用，称之为Demux。为什么需要这一步，这一步究竟是做什么的？我们知道在一个多媒体文件中，既包括音频也包括视频，而且音频和视频都是分开进行压缩的，因为音频和视频的压缩算法不一样，既然压缩算法不一样，那么肯定解码也不一样，所以需要对音频和视频分别进行解码。虽然音频和视频是分开进行压缩的，但是为了传输过程的方便，还是将压缩过的音频和视频捆绑在一起进行传输。所以我们解码的第一步就是将这些绑在一起的音频和视频流分开来，也就是传说中的**解复用。**简单来说，解复用这一步就是将音频流和视频流分开，方便后续解码。

转换之后就可以为视频添加音频了，这里使用的视频是上文生成的图片视频（注意添加音频也能用wav格式，只不过我习惯用mp3）

# 拷贝视频
$ cp img_to_video/multi_img_to_video.mp4 add_audio/input.mp4

# 添加音频有多种方式：
# 方式一：流拷贝（不推荐）
# 这种方式没有编解码的过程，只有解复用，所以速度很快，目前亲测不成功，不太建议
$ ffmpeg -i input.mp4 -i input.mp3 -codec copy audio_copy.mp4

# 方式二：手动选择特定流（不推荐，亲测无效）
$ ffmpeg -i input.mp4 -i input.mp3 -map 0:v -map 1:a -c copy audio_manually.mp4

# 方式三：重新编码（亲测有效）
$ ffmpeg -i input.mp4 -i input.mp3 -c:a aac -c:v libx264 audio_recode.mp4

# 有时候我们的音频长度大于视频长度，比如本次音频长度为20s，视频长度为10s，使用上面的命令会把视频长度拉长到20s
# 如果想要音频长度与视频长度保持一致，可加上 -shortest 参数
$ ffmpeg -i input.mp4 -i input.mp3 -c:a aac -c:v libx264  -shortest audio_recode_short.mp4

3.3 视频添加字幕

添加完音频后，就可以添加字幕了，关于字幕转换工具，可以自己手写一个，也可以用现成的，比如下面这个：

TXT to SRT Converter

使用起来也非常方便，每一行就是一行字幕，最后设置好起始时间就可以了（不一定与实际朗读匹配）：

添加srt字幕的命令如下：

# 拷贝之前生成好的视频
$ cp add_audio/audio_recode.mp4 add_caption/input.mp4

# 添加字幕
$ ffmpeg -i input.mp4 -vf subtitles=input.srt video_with_srt.mp4

# 有时候可能会遇到下面的报错：Too many packets buffered for output stream 0:1
# 该异常抛出的原因是有些视频数据有问题，导致视频处理过快，容器封装时队列溢出
# 可以通过增大容器封装队列大小来解决，比如设置最大封装队列的大小为1024
$ ffmpeg -i input.mp4 -vf subtitles=input.srt -max_muxing_queue_size 1024 video_with_srt.mp4

有时候我们需要自定义字幕的样式，或者字幕的位置，这时可以先把srt字幕转换为ass字幕，再做调整。如果你安装了FFMpeg，一行命令就能完成转换，如果没有安装，也可以用一些在线工具实现，比如字幕酱。

FFMpeg转换命令:

$ ffmpeg -i input.srt output.ass

添加ass字幕命令：

$ ffmpeg -i input.mp4 -vf "ass=output.ass" video_with_ass.mp4

最终效果如下：

如果想要控制字幕使用的文字、文字大小、以及显示位置等，则需要修改[V4+ Styles]里面的内容：

# 一共分为两行，第一行是字段名，第二行是字段值
# Fontname：字型
# Fontsize：字体大小
# MarginL：字幕距左边的距离，取值范围是0-PlayResX的数值
# MarginR：字幕距右边的距离，取值范围是0-PlayResX的数值
# MarginV：字幕高度，取值范围是0-PlayResY的数值
[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
Style: Default,Arial,16,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,0

注：其他参数的说明可参考这篇文章

假设我要把字幕大小改为20、且字幕往上移动，则对应的改动如下：

[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
Style: Default,Arial,20,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,50,0

最后重新添加即可：

$ ffmpeg -i input.mp4 -vf "ass=new.ass" video_with_new_ass.mp4

最终效果如下：

写在最后

以上就是如何用FFMpeg构建完成视频的全流程了，希望对大家有所帮助！

参考教程

FFmpeg 视频处理入门教程
FFmpeg Formats Documentation
ffmpeg图片视频互转
Convert audio files to mp3 using ffmpeg
FFMPEG深入理解
TXT to SRT Converter
在线字幕格式转换工具
解决FFmpeg抛出的"Too many packets buffered for output stream 0:1."

原文如何用FFMpeg生成视频 - 知乎

★文末名片可以免费领取音视频开发学习资料，内容包括（FFmpeg ，webRTC ，rtmp ，hls ，rtsp ，ffplay ，srs）以及音视频学习路线图等等。

见下方!↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

Html5学习教程，从入门到精通， HTML5超链接应用的详细语法知识点和案例代码（18）知识分享小能手网页开发前端开发编程语言如门 html5 学习前端 html java 后端 css3
HTML5超链接应用的详细语法知识点和案例代码超链接（Hyperlink），也称为跃点链接，是互联网和文档编辑中的一种重要概念。超链接的定义超链接是指从一个网页指向一个目标的连接关系，这个目标可以是另一个网页，也可以是相同网页上的不同位置，还可以是一个图片、动画、程序、电子邮件地址、文件，甚至是一个音视频文件。如果点击了这个链接，当前页面的位置就会跳转到被链接的目标位置。在文档编辑中，超链接可以链
ffplay 使用文档介绍码流怪侠 FFmpeg ffplay 播放器音视频直播转码
ffplayffplay是一个简单的媒体播放器，它是FFmpeg项目的一部分。FFmpeg是一个广泛使用的多媒体框架，能够解码、编码、转码、复用、解复用、流化、过滤和播放几乎所有类型的媒体文件。ffplay主要用于测试和调试，因为它提供了一个命令行界面，可以方便地查看媒体文件的详细信息，如视频帧、音频波形等。它支持多种视频和音频格式，并且可以实时显示解码过程中的统计信息。使用文档原文地址：http
opencv借助ffmpeg读取sdp文件进行rtp拉流 20231019 诗筱涵 rtsp 用简单代码实现功能 OpenCV rtp
20231019ffmpeg装起来很快编译命令g++rtp_ffmpeg_test.cpp-ooutput$(pkg-config--libsopencv4)代码如下#include#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,char**argv){cout>frame;if(frame.em
SOPHON SDK解码视频流的常见调试方法算能开发者社区 SOPHON SDK常见问题 linux 人工智能
SOPHONSDK解码视频流的常见调试方法1.rtsp连接测试2.判断rtsp是否正常工作3.确认解码器是否能正常工作：（url为文件名或者rtsp连接地址）4.确认解码器和vpp的OpenCV接口是否正常工作5.解码不正确或者无法解码的最终调试手段1.rtsp连接测试ffmpeg-rtsp_transporttcp-iurl-frawvideo-y/dev/null或者ffmpeg-rtsp_t
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发引言在HarmonyNext生态系统中，音视频播放是一个复杂且具有挑战性的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的音视频播放器，涵盖从基础播放功能到高级控制与优化的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多种格式、流畅播放的音视频播放器，并确保其性能优化。1.环境准备与项目初始化首先，确保你的开发
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的音视频处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂
HarmonyNext实战：基于ArkTS的跨平台音视频流媒体应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的跨平台音视频流媒体应用开发引言在HarmonyNext生态系统中，音视频流媒体应用是一个复杂且技术含量较高的领域。本文将深入探讨如何使用ArkTS构建一个高性能的跨平台音视频流媒体应用，涵盖从音视频采集、编码、传输到播放的完整开发流程。我们将通过一个实际的案例——实现一个实时音视频直播应用，来展示ArkTS在HarmonyNext平台上的强大能力。环境准
视频生成缩略图后端
视频生成缩略图最近有个需求，视频上传之后在列表和详情页需要展示缩略图使用ffmpeg首先引入jar包org.bytedecojavacpp1.4.3org.bytedecojavacv1.4.3org.bytedeco.javacpp-presetsffmpeg-platform4.0.2-1.4.3代码如下publicStringgetThumbnails(StringvideoFilePath
xuggle操作视频后端
xuggle操作视频有个需求是要读取视频的宽高，找到了Xuggle和FFmpeg两种方式，FFmpeg很强大，但是我并不需要那些功能，所以使用了轻量一点的Xuggle引入依赖xugglexuggle-xuggler5.4可能maven仓库中没有该依赖，可以下载后放到本地仓库或私服xuggle-xuggler-5.4.jar或者可以使用org.boofcvxuggler0.23该依赖中包含有xugg
openharmony 富对富 WiFi投屏设计月上柳青 openharmony harmonyos
castengine_wifi_display部件别名Sharing，媒体分享之意。拥有流媒体协议接入、媒体预览、媒体转分发能力，受投播管理服务管理和调用，是音视频投播子系统重要的流媒体能力部件。提供一套简单的NativeC++的接口，主要业务是Miracast投屏，提供以下常用功能：主投端（WFDSource）：主投端发送器，用于投屏Source端业务，可发送多路屏幕镜像流到不同设备。被投端（W
使用jcodec库，访问网络视频提取封面图片上传至oss 鑫品音视频传媒
注释部分为FFmpeg（确实方便但依赖太大，不想用）packagecom.zuodou.upload;importcom.aliyun.oss.OSS;importcom.aliyun.oss.model.ObjectMetadata;importcom.aliyun.oss.model.PutObjectRequest;importcom.zuodou.oss.OssProperties;//i
解析：婚恋交友系统APP源码开发攻略,语音视频聊天功能实现步骤核心功能前端后端小程序数据库程序员
系统功能特点1.自定义小程序管理：本系统提供完整的后台管理功能，开发者可以根据自己的需求进行定制和修改，包括但不限于论坛版块管理、帖子管理、用户管理等功能。后台管理界面简洁明了，操作方便，大大降低了开发门槛。2.完整的安装代码包：本系统提供完整的安装代码包，包括小程序前端代码、后端服务代码以及数据库结构等。开发者只需按照说明进行安装和配置，即可快速搭建起一个功能完备的社区论坛小程序。3.丰富的功能
优化UDP在实时传输中的可靠性白总Server udp 网络安全 ide stm32 单片机 proteus
虽然UDP（用户数据报协议）本身是无连接的、不可靠的传输协议，但在实时音视频传输等需要低延迟的应用中，可以通过一些机制来优化其可靠性。是几种常见的优化方法：1.应用层重传机制（Application-LevelRetransmission）原理:在应用层实现数据包的确认和重传机制。当接收方发现数据包丢失时，发送方可以在超时后重新发送丢失的数据包。实现方法:选择性重传:仅重传丢失的数据包，而不是整个
C语言基础系列【20】内存管理程序喵大人 C语言基础系列 c语言开发语言 c++后端面试
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列C++大佬养成攻略在C++编程中，内存管理是一个至关重要的概念。要深入理解内存管理，我们肯定要
FFplay 7.0 文档宋志辉 FFmpeg 7.0文档 ffplay ffmpeg
ffplay文档1.概要ffplay[options][input_url]2.描述FFplay是一个非常简单且可移植的媒体播放器，使用FFmpeg库和SDL库。它主要用作各种FFmpegAPI的测试平台。3.选项如果没有特别说明，所有数值选项都接受一个表示数字的字符串作为输入，该字符串可以后跟SI单位前缀之一，例如：‘K’、‘M’或‘G’。如果在SI单位前缀后附加‘i’，则整个前缀将被解释为二进
H5之webcoekt播放JPEG图片流视频处理html5
一、简介既然webcoekt是基于tcp连接的，理论上讲所有的浏览器是可以私有协议处理二进制的，如果我们需要播放视频，我们可以将视频数据在后端解码后直接将图片推送到webcoekt前端，然后前端通过websocket接收图片然后将图片显示到img或canvas中即可，当然这个是我自己设想的，也是应该可以做的到了，做到如下需要以下技术支持：后端直接ffmpeg转码为jpeg图片流后端定制播放协议包括
常见开源许可证 WwwwwH_PLUS #Software Engineering 开源
常见开源许可证许可证允许商业使用是否必须开源适用场景MIT✅是❌否最宽松，适合开源库（如OCCT相关项目）GPL✅是✅必须强制开源，适合Linux、GNU项目LGPL✅是☑️仅限修改核心部分适用于动态库（如Qt、FFmpeg）Apache2.0✅是❌否允许专利权，适合企业（如Google）BSD3-Clause✅是❌否类似MIT，但限制广告使用
WebRTC简介及实战应用 — 从0到1实现实时音视频聊天等功能不怕麻烦的鹿丸 HTML5 JavaScript WebRTC webrtc 实时音视频前端音视频 javascript html5 html
一、WebRTC简介WebRTC是由一家名为GobalIPSolutions，简称GIPS的瑞典公司开发的。Google在2011年收购了GIPS，并将其源代码开源。然后又与IETF和W3C的相关标准机构合作，以确保行业达成共识。其中：WebReal-TimeCommunications(WEBRTC)W3C组织：定义浏览器API。Real-TimeCommunicationinWeb-brows
EasyRTC嵌入式音视频通话SDK：基于ICE与STUN/TURN的实时音视频通信解决方案 EasyCVR RTC 音视频实时音视频 h.265 人工智能 webrtc
在当今数字化时代，实时音视频通信技术已成为人们生活和工作中不可或缺的一部分。无论是家庭中的远程看护、办公场景中的远程协作，还是工业领域的远程巡检和智能设备的互联互通，高效、稳定的通信技术都是实现这些功能的核心。EasyRTC嵌入式音视频通话SDK支持多种类型的网络环境，能够适应不同的网络条件，确保在各种场景下都能实现高效、稳定的实时音视频通信。以下是EasyRTC支持的主要网络环境类型：1、有线网
WebRTC简介小柒的博客 5.linux webrtc
WebRTC简介WebRTC（WebReal-TimeCommunication）是一种支持浏览器之间进行实时音视频通信和数据传输的开放标准和技术。它由Google发起，现已成为W3C和IETF的标准。WebRTC允许开发者在不依赖第三方插件或软件的情况下，直接在网页中实现点对点（P2P）的实时通信。直接在浏览器中运行，无需安装额外的插件或软件。WebRTC是开源技术，并且是W3C和IETF的标准
抖音采集工具Gui版：高效无水印下载抖音视频的神器东风西巷音视频软件需求
抖音采集工具Gui版是一款由52pojie论坛的@biqiang大神自制的功能强大的采集工具。它专为抖音视频下载设计，能够帮助用户轻松获取抖音平台上的各种视频资源，支持批量下载，极大地提升了下载效率。全面的资源采集支持采集抖音作品、Webp动态封面、短剧、喜欢、话题、音乐等多种内容。无论是热门视频还是小众作品，都能轻松下载。批量下载与高效管理用户可以批量下载指定作者的所有作品、单个视频、某话题下的
颜永红:大模型时代的智能音频处理 | 演讲嘉宾公布声光界人工智能音视频
一、GAS20242024中国国际音频产业大会(GAS)将于2024年3.27-28日在上海张江科学会堂举办。大会将以“音无界，@未来（Audio，@Future）”为主题。大会由中国电子音响行业协会、上海市浦东新区先进音视频技术协会共同主办，上海国展展览中心有限公司承办。GAS2024作为中国最大的音频产业盛会之一，不仅展示了音频技术的最新成果，还为业界人士提供了一个交流和合作的平台。大会始终致
OSG开发笔记（三十二）：深入理解相机视口、制作支持与主视图同步变换旋转的相机HUD 长沙红胖子Qt（技术Q群4597637） Qt开发 OSG三维开发 Qt OSG 三维开发 HUD相机前景HUD旋转坐标
若该文为原创文章，未经允许不得转载本文章博客地址：https://blog.csdn.net/qq21497936/article/details/143852695各位读者，知识无穷而人力有穷，要么改需求，要么找专业人士，要么自己研究长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬结合等等）持续更
FFmpeg 4.3 音视频-多路H265监控录放C++开发十三：将AVFrame转换成AVPacket。视频编码原理.编码相关api，H264特殊参数说明 hunandede FFmpeg4.3 ffmpeg 音视频 c++
前提：从前面的学习我们知道AVFrame中是最原始的视频数据，这一节开始我们需要将这个最原始的视频数据压缩成AVPacket数据，我们前面，将YUV数据或者RGBA数据装进入了AVFrame里面，并且在SDL中显示。也就是说：对于安防项目来说，我们将原始从摄像头数据(YUV,RGB)转换成AVFrame后，可以直接显示出来。但是如果我们将要数据存储，则要将AVFrame转成AVPacket.视频编
RV1126视频采集 weixin_45281309 嵌入式Linux 音视频 c++嵌入式硬件
简介：将摄像头采集的视频以H264编码存储在本地文件test_out.h264里，并以ffmpeg播放**1.**流程图2.源代码bananapeelx_h264.h#ifndefBANANAPEELX_H264_H#defineBANANAPEELX_H264_H#include#include#include#include#include#include#include#include#in
[FFmpeg] 软解码将mp4解码为yuv420文件努力学习的谢老板 ffmpeg 视频编解码音视频
文章目录概要整体架构流程代码小结概要使用ffmpeg软件解码mp4文件，解码为yuv420p类型的数据。整体架构流程1.打开输入流文件avformat_open_input2.获取输入流信息avformat_find_stream_info3.获取视频流信息av_find_best_stream4.创建一个解码的上下文avcodec_alloc_context35.获取原文件解码参数avcodec
音视频入门基础：RTP专题（13）——SDP的packetization-mode 崔杰城音视频技术音视频
一、引言由《音视频入门基础：RTP专题（3）——SDP简介》可以知道，SDP中的packetization-mode表示RTP有效载荷类型的属性或接收器实现的功能。只能指示一个配置点；因此，当声明支持一种以上数据包化模式的功能时，必须使用多个配置点（RTP有效载荷类型）。当packetization-mode值等于0或不存在packetization-mode时，表示必须使用SingleNALun
FFmpeg--解码：mp4文件解码为音频aac和视频h264 八月的雨季997 ffmpeg aac
mp4文件解封装：视频文件（mp4）–解封装—音频流（aac），视频流(h264)流程code命令行参数：input.mp4out.h264out.aac#include#include"libavutil/log.h"#include"libavformat/avformat.h"#defineERROR_STRING_SIZE1024#defineADTS_HEADER_LEN7;intadt
qt 播放pcm音频码农客栈_V13427279549 音视频 Qt pcm 音视频
一、获取PCM音频ffmpeg-iinput.mp3-acodecpcm_s16le-ar44100-ac2-fs16leoutput.pcm-acodecpcm_s16le：指定16位小端PCM编码格式（兼容性最佳）-ar44100：设置采样率为CD标准44.1kHz（可替换为16000/8000等）‌-ac2：保留立体声（单声道用-ac1）‌-fs16le：强制输出二进制裸数据格式‌二、播放方
B站自研的第二代视频连麦系统（上）哔哩哔哩技术 webrtc 直播
导读本系列文章将从客户端、服务器以及音视频编码优化三个层面，介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解，帮助开发者更全面地了解WebRTC的核心技术与实践应用。背景在文章《B站在实时音视频技术领域的探索与实践》中，提到了直播行业从传统娱乐直播发展到教育、电商等新形式，用户对实时互动直播的需求增加。B站基于WebRTC的开发了一套视频连麦系统：这套系统优先选择UDP协议以保证低
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。