meetyanfei

转载：ffmpeg+wasm显示H264

转载：https://zhuanlan.zhihu.com/p/40786748

有没有那么一种可能，在前端页面处理音视频？例如用户选择一个视频，然后支持他设置视频的任意一帧作为封面，就不用把整一个视频上传到后端处理了。经过笔者的一番摸索，基本实现了这个功能，一个完整的demo：ffmpeg wasm截取视频帧功能：

支持mp4/mov/mkv/avi等文件。基本的思想是这样的：

使用一个file input让用户选择一个视频文件，然后读取为ArrayBuffer，传给ffmpeg.wasm处理，处理完之后，输出rgb数据画到canvas上或者是转成base64当做img标签的src属性就形成图片了。（Canvas可以直接把video dom当作drawImage的对象进而得到视频帧，不过video能播放的格式比较少，本文重点讨论ffmpeg方案的实现，因为ffmpeg还可做其它的事情，这只是一个例子。）

这里有一个问题，为什么要借助ffmpeg呢，而不直接用JS写？因为多媒体处理的C库比较成熟，ffmpeg就是其中一个，还是开源的，而wasm刚好可以把它转化格式，在网页上使用，多媒体处理相关的JS库比较少，自己写一个多路解复用(demux)和解码视频的复杂度可想而知，JS直接编解码也会比较耗时。所以有现成的先用现成的。

第1步是编译（如果你对编译过程不感兴趣的话，可以直接跳到第2步）

编译ffmpeg为wasm版本
我一开始以为难度会很大，后来发现并没有那么大，因为有一个videoconverter.js已经转过了（它是一个借助ffmpeg在网页实现音视频转码的），关键在于把一些没用的特性在configure的时候给disable掉，不然编译的时候会报语法错误。这里使用的是emsdk转的wasm，emsdk的安装方法在它的安装教程已经说得很明白，主要是使用脚本判定系统下载不同编译好的文件。下载好之后就会有几个可执行文件，包括emcc、emc++、emar等命令，emcc是C的编译器，emc++是C++的编译器，而emar是用于把不同的.o库文件打包成一个.a文件的。

先要在ffmpeg的官网下载源码。

（1）configure
解压进入目录，然后执行以下命令：

emconfigure ./configure --cc=“emcc” --enable-cross-compile --target-os=none --arch=x86_32 --cpu=generic
–disable-ffplay --disable-ffprobe --disable-asm --disable-doc --disable-devices --disable-pthreads --disable-w32threads --disable-network
–disable-hwaccels --disable-parsers --disable-bsfs --disable-debug --disable-protocols --disable-indevs --disable-outdevs --enable-protocol=file
通常configure的作用是生成Makefile——configure阶段确认一些编译的环境和参数，然后生成编译命令放到Makefile里面。

而前面的emconfigure的主要作用是把编译器指定为emcc，但只是这样是不够的，因为ffmpeg里面有一些子模块，并不能彻底地把所有的编译器都指定为emcc，好在ffmpeg的configure可以通过–cc的参数指定自定义的编译器，在Mac上C编译器一般是使用/usr/bin/clang，这里指定为emcc。

后面的disable是把一些不支持wasm的特性给禁掉了，例如–disable-asm是把使用汇编代码的部分给禁掉了，因为那些汇编语法emcc不兼容，没有禁掉的话编译会报错语法错误。另外一个–disable-hwaccels是把硬解码禁用了，有些显卡支持直接解码，不需要应用程序解码（软解码），硬解码性能明显会比软解码的高，这个禁了之后，会导致后面使用的时候报了一个warning：

[swscaler @ 0x105c480] No accelerated colorspace conversion found from yuv420p to rgb24.
但是不影响使用。

（执行configure的过程会报一个segment fault，但后续的过程中发现没有影响。）

等待configure命令执行完了，就会生成Makefile和相关的一些配置文件。

（2）make
make是开始编译的阶段，执行以下命令进行编译：

emmake make
在Mac上执行，你会发现最后把多个.o文件组装成.a文件的时候会报错：

AR libavdevice/libavdevice.a
fatal error: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/ar: fatal error in /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/ranlib
解决这个问题需要把打包的命令从ar改成emar，然后再把一个ranlib的过程去掉就行，修改ffbuild/config.mak文件：

修改ar为emar

AR=ar

AR=emar

去掉ranlib

RANLIB=ranlib

#RANLIB=ranlib
然后再重新make就可以了。

编译完成之后，会在ffmpeg目录生成一个总的ffmpeg文件，在ffmpeg的libavcodec等目录会生成libavcodec.a等文件，这些文件是后面我们要使用的bitcode文件，bitcode是一种已编译程序的中间代码。

（最后在执行strip -o ffmpeg ffmpeg_g命令会挂掉，但是不要紧，strip改成cp ffmpeg_g ffmpeg就好了）

使用ffmpeg
ffmpeg主要是由几个lib目录组成的：

libavcodec：提供编解码功能
libavformat：多路解复用(demux)和多路复用(mux)
libswscale：图像伸缩和像素格式转化
以一个mp4文件为例，mp4是一种容器格式，首先使用libavformat的API把mp4进行多路解复用，得到音视频在这个文件存放的位置等信息，视频一般是使用h264等进行编码的，所以需要再使用libavcodec进行解码得到图像的yuv格式，最后再借助libswscale转成rgb格式。

在使用ffmpeg的时候，如果执行报错，要么是参数错了，要么就是上边disable了需要使用的模块，改成enable

这里有两个使用ffmpeg的方式，第一种是直接把第一步得到的ffmpeg文件编译成wasm：

需要拷贝一个.bc后缀，因为emcc是根据后缀区分文件格式的

cp ffmpeg_g ffmpeg.bc
emcc ffmpeg.bc -o ffmpeg.html
然后就会生成一个ffmpeg.js和ffpmeg.wasm，ffmpeg.js是用来加载和编译wasm文件以及提供一个全局的Module对象用来操控wasm里面ffmpeg API的功能的。有了这个之后，在JS里面通过Module调用ffmpeg的API。

但是我感觉这个方式比较麻烦，JS的数据类型和C的数据类型差异比较多，在JS里面频繁地调C的API，需要让数据传来传去比较麻烦，因为要实现一个截取功能要调很多ffmpeg的API。

所以我用的是第二种方式，先写C代码，在C里面把功能实现了，最后再暴露一个接口给JS使用，这样JS和WASM只需要通过一个接口API进行通信就好了，不用像第一种方式一样频繁地调用。

所以问题就转化成两步：

第一步是使用C语言写一个ffmpeg保存视频帧图像的功能

第二步是编译成wasm和js进行数据的交互

第一步的实现主要参考了一个ffmpeg的教程：ffmpeg tutorial。里面的代码都是现成的直接拷过来就好，有一些小问题是他用的ffmpeg版本稍老，部分API的参数需要修改一下。代码已上传到github，可见：cfile/simple.c。

使用方法已在readme里面进行介绍，通过以下命令编译成一个可执行文件simple：

gcc simple.c -lavutil -lavformat -lavcodec pkg-config --libs --cflags libavutil pkg-config --libs --cflags libavformat pkg-config --libs --cflags libavcodec pkg-config --libs --cflags libswscale -o simple
然后使用的时候传一个视频文件的位置就可以了：

./simple mountain.mp4
就会在当前目录生成一张pcm格式的图片。

这个simple.c是调用的ffmpeg自动读取硬盘文件的api，需要改成从内存读取文件内容，即我们自己读到内存的buffer然后传给ffmpeg，后面才能把数据传输改成从JS的buffer获取，这个的实现可见：simple-from-memory.c. 具体的C代码这里就不分析了，就是调调API，相对来说还是比较简单，就是要知道怎么用，ffmpeg网上的开发文档相对较少。

这样第一步就算完成了，接着第二步，把数据的输入改成从JS获取，输出改成返回给JS.

js和wasm的交互
wasm版的具体实现是在web.c（还有一个proccess.c是把simple.c的一些功能拆了出去），在web.c里面有一个暴露给JS调用的函数，姑且起名叫setFile，这个setFile就是给JS调的：

EMSCRIPTEN_KEEPALIVE // 这个宏表示这个函数要作为导出的函数
ImageData *setFile(uint8_t *buff, const int buffLength, int timestamp) {
// process …
return result;
}
需要传递三个参数：

buff：原始的视频数据（通过JS的ArrayBuffer传进来）
buffLength：视频buff的总大小（单位字节）
timestamp：是希望截取第几秒的视频帧
最后处理完了返回一个ImageData的数据结构：

typedef struct {
uint32_t width;
uint32_t height;
uint8_t *data;
} ImageData;
里面有三个字段：图片的宽高和rgb数据。

写好这些C文件后进行编译：

emcc web.c process.c …/lib/libavformat.bc …/lib/libavcodec.bc …/lib/libswscale.bc …/lib/libswresample.bc …/lib/libavutil.bc
-Os -s WASM=1 -o index.html -s EXTRA_EXPORTED_RUNTIME_METHODS=’[“ccall”, “cwrap”]’ -s ALLOW_MEMORY_GROWTH=1 -s TOTAL_MEMORY=16777216
使用第1步编译生成的那些libavcode.bc等文件，这些文件有依赖顺序，前后不能颠倒，被依赖的要放在后面。这里面有些参数说明一下：

-o index.html表示导出hmtl文件，同时会导出index.js和index.wasm，主要使用这两个，生成的index.html是没用的；

-s EXTRA_EXPORTED_RUNTIME_METHODS=’[“ccall”, “cwrap”] 表示要导出ccall和cwrap这两个函数，这两个函数的功能是为了调用上面C里面写的setFile函数；

-s TOTAL_MEMORY=16777216 表示wasm总内存大小为约16MB，这个也是默认值，这个需要是64的倍数；

-s ALLOW_MEMORY_GROWTH=1 当内存超出总大小时自动扩容。

编译好之后写一个main.html，加入input[type=file]等控件，并引入上面生成的index.js，它会去加载index.wasm，并提供一个全局的Module对象操控wasm的API，包括上面在编译的时候指定导出的函数，如下代码所示：

ffmpeg wasm截取视频帧功能

请选择一个视频（本地操作不会上传）

时间(秒) 需要在wasm下载并解析完成之后才能开始操作，它提供了一个onRuntimeInitialized的回调。

为了能够使用C文件里面导出的函数，可以使用Module.cwrap，第一个参数是函数名，第二个参数是返回类型，由于返回的是一个指针地址，这里是一个32位的数字，所以用js的number类型，第三个参数是传参类型。

接着读取input的文件内容到放到一个buffer里面：

接下来的关键问题是：怎么把这个buffer传给wasm的setFile函数？这个需要理解wasm的内存堆模型。

wasm的内存堆模型
上面在编译的时候指定的wasm使用的总内存大小，内存里面的内容可以通过Module.buffer和Module.HEAP8查看：

这个东西就是JS和WASM数据交互的关键，在JS里面把数据放到这个HEAP8的数组里面，然后告诉WASM数据的指针地址在哪里和占用的内存大小，即在这个HEAP8数组的index和占用长度，反过来WASM想要返回数据给JS也是被放到这个HEA8里面，然后返回指针地址和和长度。

但是我们不能随便指定一个位置，需要用它提供的API进行分配和扩容。在JS里面通过Module._molloc或者Module.dynamicMalloc申请内存，如下代码所示：

// 得到文件的原始二进制数据，放在buffer里面
let buffer = new Uint8Array(this.result);
// 在HEAP里面申请一块指定大小的内存空间
// 返回起始指针地址
let offset = Module._malloc(buffer.length);
// 填充数据
Module.HEAP8.set(buffer, offset);
// 最后调WASM的函数
let ptr = setFile(offset, buffer.length, +form.time.value * 1000);
调用malloc，传需要的内存空间大小，然后会返回分配好的内存起始地址offset，这个offset其实就是HEAP8数组里的index，然后调用Uint8Array的set方法填充数据。接着把这个offset的指针地址传给setFile，并告知内存大小。这样就实现了JS向WASM传数据。

调用setFile之后返回值是一个指针地址，指向一个struct的数据结构：

typedef struct {
uint32_t width;
uint32_t height;
uint8_t *data;
} ImageData;
它的前4个字节，用来表示宽度，紧接着的4个字节是高度，后面的是图片的rgb数据的指针，指针的大小也是4个字节，这个省略了数据长度，因为可以通过width * height * 3得到。

所以[ptr, ptr + 4)存的内容是宽度，[ptr + 4, ptr + 8)存的内容是长度，[ptr + 8, ptr + 12)存的内容是指向图像数据的指针，如下代码所示：

let ptr = setFile(offset, buffer.length, +form.time.value * 1000);
let width = Module.HEAPU32[ptr / 4]
height = Module.HEAPU32[ptr / 4 + 1],
imgBufferPtr = Module.HEAPU32[ptr / 4 + 2],
imageBuffer = Module.HEAPU8.subarray(imgBufferPtr,
imgBufferPtr + width * height * 3);
HEAPU32和上面的HEAP8是类似的，只不过它是每个32位就读一个数，由于我们上面都是32位的数字，所以用这个刚刚好，它是4个字节一个单位，而ptr是一个字节一个单位，所以ptr / 4就得到index。这里不用担心不能够被4整除，因为它是64位对齐的。

这样我们就拿到图片的rgb数据内容了，然后用canvas画一下。

Canvas画图像
利用Canvas的ImageData类，如下代码所示：

drawImage(width, height, imageBuffer);
// 释放内存
Module._free(offset);
Module._free(ptr);
Module._free(imgBufferPtr);
在C里面写的代码也要释放掉中间过程申请的内存，不然这个内存泄露还是挺厉害的。如果正确free之后，每次执行malloc的地址都是16358200，没有free的话，每次都会重新扩容，返回递增的offset地址。

但是这个东西整体消耗的内存还是比较大。

存在的问题
初始化ffmpeg之后，网页使用的内存就飙到500MB，如果选了一个300MB的文件处理，内存就会飙到1.3GB，因为在调setFile的时候需要malloc一个300MB大小的内存，然后在C代码的setFile执行过程中又会malloc一个300MB大小的context变量，因为要处理mov/m4v格式的话为了获取moov信息需要这么大的，暂时没优化，这几个加起来就超过1GB了，并且WebAssembly.Memory只能grow，不能shrink，即只能往大扩，不能往小缩，扩充后的内存就一直在那里了。而对于普通的mp4文件，context变量只需要1MB，这个可以把内存控制在1GB以内。

第二个问题是生成的wasm的文件比较大，原始有12.6MB，gzip之后还有5MB，如下图所示：

因为ffmpeg本身比较大，如果能够深入研究源码，然后把一些没用的功能disable掉或者不要include进来应该就可以给它瘦身，或者是只提取有用的代码，这个难度可能略高。

第三个问题是代码的稳健性，除了想办法把内存降下来，还需要考虑一些内存访问越界的问题，因为有时候跑着跑着就抛了这个异常：

Uncaught RuntimeError: memory access out of bounds
虽然存在一些问题，但是起码已经跑起来，可能暂时还不具备部署生产环境的价值，后面可以慢慢优化。

除了本文这个例子外，还可以利用ffmpeg实现其它一些功能，让网页也能够直接处理多媒体。基本上只要ffmpeg能做的，在网页也是能跑，并且wasm的性能要比直接跑JS的高。

测试结果：
H264 19201080 勉强可以，效果不是很好，如果需要2倍播放，基本不可以
H265 19201080 卡顿严重，不能用

如果是分辨率小（300*600）一类的，是可以考虑这么用，效果挺好

pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
【物联网技术大作业】设计一个智能家居的应用场景 Dream_Chaser～期末复习智能家居物联网技术期末大作业
前言：本人的物联网技术的期末大作业，希望对你有帮助。目录大作业设计题（1）智能家居的概述。（2）介绍智能家居应用。要求至少5个方面的应用，包括每个应用所采用的设备，性能，功能。（3）画出智能家居应用图，并设计使用。大作业设计题设计一个智能家居的应用场景。要求：（1）智能家居的概述。答：智能家居，又称为智能住宅或家庭自动化，是指运用综合布线、网络通信、安全防范、自动控制及音视频等技术，将家居设施集成
抖音视频搬运如何才能不违规？抖音搬运视频违规有什么后果？氧惠导师
在抖音平台中搬运短视频的人非常多，经常能看到一些视频，别的平台中也会出现，但是又会有所不一样，其实是进行了二次编辑，那么抖音搬运视频怎么做才不会违规呢?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的
WebRTC之LiveKit的基础入门使用（入门必看） tabzzz 前端 webrtc web3 typescript
LiveKit本文主要是讲解在Next13+中如何使用LiveKit来实现简单的音视频通话，想了解更多的还是要去官方文档去掌握更复杂、高级的使用方法。什么是LiveKitLiveKit是一个开源的实时通信平台，基于WebRTC，主要用于构建高质量的音视频通话、实时数据传输和互动应用。LiveKit除了方便以外的大优势就是它提供了丰富的API和SDK，支持多种平台，包括Web、iOS、Android
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
Android平台轻量级RTSP服务模块技术接入说明音视频牛哥大牛直播SDK 轻量级RTSP服务 android 音视频轻量级RTSP服务 Android RTSP服务 Android RTSP服务器安卓RTSP服务器大牛直播SDK
技术背景为满足内网无纸化/电子教室等内网超低延迟需求，避免让用户配置单独的服务器，大牛直播SDK在推送端发布了轻量级RTSP服务SDK。轻量级RTSP服务解决的核心痛点是避免用户或者开发者单独部署RTSP或者RTMP服务，实现本地的音视频数据（如摄像头、麦克风），编码后，汇聚到内置RTSP服务，对外提供可供拉流的RTSPURL，轻量级RTSP服务，适用于内网环境下，对并发要求不高的场景，支持H.2
音视频入门基础：WAV专题（11）——FFmpeg源码中计算WAV音频文件每个packet的pts_time、dts_time的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
移动应用-音视频播放绚烂的萤火移动开发 android 音视频
一.音频1.Mediaplayer设置数据源的三种方式:应用自带的音频,SD卡中的音频、网络音频MediaPlayerplayer＝newMediaPlayer();player=Mediaplayer.create(this,R.raw.XX);player＝MediaPlayer.setDatasource("SD卡路径/网络路径");设置按钮并添加监听事件,实现音乐的播放、暂停2.Sound
2023-06-02《青楼文学与中国文化》陶慕宁64 每天坚持
20230602四点三十一《青楼文学与中国文化》陶慕宁64今天早上起床的闹钟我并没有听见，是我老婆把我叫醒了，昨天晚上睡得挺好，很快就睡觉了，早上有点不想起床，被老婆叫起来了。按说昨天我应该是听完了陶慕宁老师讲的课，但是我的听课记录上显示我没有听完，还是感觉喜马拉雅手机版记录的比较详细，但是喜马拉雅电脑版上的记录没有那么详细，感觉这些音视频软件应该更精准的记录一个人的听课位置，对于我们这些学习的人
神奇酷炫的下拉菜单紫藤11
下拉菜单目前公司的销售报表上，用有这个功能，真心方便，感谢小哈录制的抖音视频，但操作更简单。一、基本用法直接按住Alt+↓即可快速生成,注意：想要实现这样的功能前提是已经输入部分内容二、进阶用法1.提示信息2.出错警告3.圈释无效信息第一次作用圈释无效信息的功能三、动态下拉列表选取数据→定义名称→数据验证→序列→输入=名称四、快速录入当前时间=now（）数据验证设置单元格格式五、借贷只能一方输入选
01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发小猪佩琪962 2024年程序员学习 flink 学习大数据
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
2023-07-25《优势教养》127 每天坚持
20230725四点三十五星期二《优势教养》127昨天晚上睡得早，我八点五十多就到家了，催着孩子们睡觉，孩子们睡的就早，我在水里边洗了一会，拉了几下单杠，顺着老路回来了，昨天温度比较低，感觉能听进去音视频。昨天下午没有怎么睡着，晚上也感觉没有精神。昨天下午老婆带着儿女去收拾牙，我在家没事，也没有写文章，昨天上午去姐家看她家修水，耽误昨天的两千字的电子日记也没有完成，昨天的作业打卡还没有设计好，昨天
音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
ffplay音视频同步分析攻城狮百里音视频音视频 C++ffplay
ffplay默认也是采用的这种同步策略。主流程ffplay中将视频同步到音频的主要方案是，如果视频播放过快，则重复播放上一帧，以等待音频；如果视频播放过慢，则丢帧追赶音频。这一部分的逻辑实现在视频输出函数video_refresh中，分析代码前，我们先来回顾下这个函数的流程图：在这个流程中，“计算上一帧显示时长”这一步骤至关重要。先来看下代码：staticvoidvideo_refresh(voi
音视频入门基础：WAV专题（5）——FFmpeg源码中解码WAV Header的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
OpenHarmony 5.0 纯血鸿蒙系统 ejinxian harmonyos 华为
OpenHarmony-v5.0-Beta1版本已于2024-06-20发布。OpenHarmony5.0Beta1版本标准系统能力持续完善，ArkUI完善了组件通过CAPI调用的能力；应用框架细化了生命周期管理能力，完善了应用拉起、跳转的能力；分布式软总线连接能力和规格进一步增强；媒体完善了框架能力、视频编解码能力、音视频的应用能力，媒体库丰富了使用场景，提供更好的使用体验。OpenHarmon
即时通讯项目 NingDream816 即时通讯项目网络 redis 数据库服务器缓存设计模式
即时通讯项目需求分析功能约束可行解更优解高性能接入层优化存储层优化消息时序一致性高可用需求分析功能添加好友聊天会话列表单聊AB群聊多设备登录消息漫游消息已读，查看已读/未读列表视频通话(学音视频技术时补上)语音通话约束DAU(DailyActiveUsers，日活跃用户数量)10亿假设每人平均每天发100条消息，1000Mli*100/86400=12MliQPS(Queriespersecond
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
ffmpeg一些基本用法 980205 ffmpeg 流媒体
来源：ffmpeg一些基本用法|王石头的博客(iwangsen.com)音视频操作，几乎绕不开ffmpeg，因为市面上绝大多数音视频播放软件、转码软件，内核都是它。它非常的强大，轻松几条命令就可以顺利完成你想做的工作我来汇总一些经常使用的命令首先在cmd窗口进入到ffmpeg目录里面最简单的视频格式转换ffmpeg-iD:\Media\IMG_0873.MOV-ccopyD:\Media\outp
走自己的路，随自己的心减读
“走自己的路，让别人去说吧”，就是一种人生态度。别人去说，是在浪费他自己的时间，而你只管活好自己的生活。被大家熟知的超级演说家总冠军刘媛媛曾经在她的抖音视频中说：“不喜欢我的人，为啥不是你改是我改，你让别人改，别人不改，然后你就会很痛苦。”最后一句“你不喜欢我，你自己改吧。”未尝不是一种只随我心的人生态度。还记得那位今年在《脱口秀大会》上爆火的北大女生李雪琴吗？她看起一脸“丧”劲儿，凭着自己的智慧
抖音视频去水印，获取无水印原视频的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间。 liqizheng_ 笔记 php
抖音视频去水印获取原视频地址的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间.前言：抖音视频自己保存的都带有抖音的logo和视频片尾，让一些做自媒体和搬运工的朋友感到不爽，想要搬运还有水印，于是网上出现好多视频无水印解析的网站，包括微信小程序和公众号都在做，引流也确实可以，但是大部分都是调用的其它网站提供的解析接口，往往一些还要付费，或者不稳定各种问题。，因为他们都不是从最原始的代
抖音视频怎么去水印保存到手机上 Java搬砖组长音视频
抖音已经成为人们日常消遣的主要平台之一。无论是搞笑的视频、感人的短片，还是充满创意的短视频，抖音总能给人带来无限的欢乐与惊喜。有时候我们可能会想要将喜欢的视频保存到手机上，方便离线观看或与朋友分享，但这些视频通常会带有抖音的水印。这篇文章将向大家介绍如何去除抖音视频的水印并保存到手机上。1.使用第三方工具网站去水印许多第三方应用程序和网站可以帮助用户去除抖音视频的水印。例如，“视频解析器（www.
FFmpeg任意文件读取漏洞分析音视频开发老马 ffmpeg
背景介绍FFmpeg是一套目前非常流行的可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。目前有非常多的视音频软件或是视频网站、手机APP都采用了这个库，但是这个库历史上曝出的漏洞也非常之多。这次的漏洞是利用了ffmpeg可以处理HLS播放列表的功能，在AVI文件中的GAB2字幕块中嵌入了一个HLS文件，然后提供给ffmpeg进行转
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
OpenglEs之EGL环境搭建 FlyerGo Opengl 音视频 c++opengl
前言前面我们发布了一系列的入门教程，例如C++系列的指针扫盲、多线程的使用等，JNI入门系列，ffmpeg入门系列等，有感兴趣的童鞋们可以关注往回自行查阅。今天我们的主题依然是音视频开发的范畴，做过音视频开发的都知道Opengl也是音视频开发中的一项重要技能，特别是涉及到视频录制、特效处理、画质渲染细分功能。因此后续笔者打算再出一系列的OpenglES的学习笔记，希望能与大家共同温故知新。因为前面
FFmpeg的入门实践系列七(滤镜) 星海逐愿 ffmpeg ffmpeg
欢迎诸位来阅读在下的博文~在这里，在下会不定期发表一些浅薄的知识和经验，望诸位能与在下多多交流，共同努力文章目录前期博客一、滤镜过滤器filter的简介FFmpeg编程的四大结构体1.滤镜AVFilter2.滤镜图AVFilterGraph3.滤镜实例AVFilterContext4.滤镜输入输出参数AVFilterInOut二、使用滤镜加工音视频前期博客FFmpeg的入门实践系列一(环境搭建)F
Linux 编译 qtav,QtAV 1.3.3 发布，跨平台音视频播放库丶本心灬 Linux 编译 qtav
QtAV1.3.3发布-支持调用NVIDIA的cuvid库进行CUDA硬解。支持平台：windows,linux。(是linux上第一个支持cuda硬解的么？)。有些视频播放会抖动，目前原因还不清楚。4k硬解画面貌似有点花，效果不如lavfilters好。-OpenGL和OpenGLES2支持16-bit的YUV渲染，包括9,10,12,14,16bit的little/bigendian的yuv。
ffmpeg命令详解 weixin_42178492 java 基础工作相关经验集锦
ffmpeg命令详解(转)FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。[百度百科]ffmpeg使用语法ffmpeg使用语法：ffmpeg[[o
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

转载：ffmpeg+wasm显示H264

修改ar为emar

去掉ranlib

需要拷贝一个.bc后缀，因为emcc是根据后缀区分文件格式的

你可能感兴趣的:(音视频)