前进的蜗牛啊

rtmplib rtmp协议过程分析

转自：http://chenzhenianqing.cn/articles/1009.html

写的很好，收藏如下，向作者致敬！

没事碰到了librtmp库，这个库是ffmpeg的依赖库，用来接收，发布RTMP协议格式的数据。

代码在这里：git clone git://git.ffmpeg.org/rtmpdump

先看一段通过librtmp.so库下载RTMP源发布的数据的例子，从rtmpdump中抽取出来。使用的大体流程如下：

RTMP_Init主要就初始化了一下RTMP*rtmp变量的成员。
RTMP_SetupURL 函数将rtmp源地址的端口，app，等url参数进行解析，设置到rtmp变量中。比如这样的地址： rtmp://host[:port]/path swfUrl=url tcUrl=url 。
RTMP_SetBufferMS 函数设置一下缓冲大小；
RTMP_Connect函数完成了连接的建立，一级RTMP协议层的应用握手，待会介绍。
RTMP_ConnectStream总的来说，完成了一个流的创建，以及打开，触发服务端发送数据过来，返回后，服务端应该就开始发送数据了。
Download 其实是RTMP_Read函数的封装，后者读取服务端的数据返回。

RTMP_Init(&rtmp);//初始化RTMP参数
//指定了-i 参数，直接设置URL
if (RTMP_SetupURL(&rtmp, fullUrl.av_val) == FALSE) {
    RTMP_Log(RTMP_LOGERROR, "Couldn't parse URL: %s", fullUrl.av_val);
    return RD_FAILED;
}
 
rtmp.Link.timeout = timeout ;
/* Try to keep the stream moving if it pauses on us */
if (!bLiveStream )
    rtmp.Link.lFlags |= RTMP_LF_BUFX;
 
while (!RTMP_ctrlC)
{
    RTMP_Log(RTMP_LOGDEBUG, "Setting buffer time to: %dms", DEF_BUFTIME);
    RTMP_SetBufferMS(&rtmp, DEF_BUFTIME);//告诉服务器帮我缓存多久
 
    RTMP_LogPrintf("Connecting ...\n");
    if (!RTMP_Connect(&rtmp, NULL)) {//建立连接,发送"connect"
        nStatus = RD_NO_CONNECT;
        break;
    }
    RTMP_Log(RTMP_LOGINFO, "Connected...");
 
    //处理服务端返回的各种控制消息包，比如收到connect的result后就进行createStream，以及发送play(test)消息
    if (!RTMP_ConnectStream(&rtmp, 0)) {//一旦返回，表示服务端开始发送数据了.可以play了
        nStatus = RD_FAILED;
        break;
    }
 
    nStatus = Download(&rtmp, file, bStdoutMode, bLiveStream );
    if (nStatus != RD_INCOMPLETE || !RTMP_IsTimedout(&rtmp) || bLiveStream)
        break;
}

一、建立协议连接

下面来详细介绍下RTMP_Connect函数的工作。

先看代码，下面RTMP_Connect的工作是连接对端，进行握手，并且发送”connect” 控制消息，附带一些app,tcurl等参数。其实时调用了2个函数完成工作的：RTMP_Connect0， RTMP_Connect1 。

int  RTMP_Connect(RTMP *r, RTMPPacket *cp)
{//连接对端，进行握手，并且发送"connect" 控制消息，附带一些app,tcurl等参数
    struct sockaddr_in service;
    if (!r->Link.hostname.av_len)
        return FALSE;

    memset(&service, 0, sizeof(struct sockaddr_in));
    service.sin_family = AF_INET;

    if (r->Link.socksport)
    {
        /* Connect via SOCKS */
        if (!add_addr_info(&service, &r->Link.sockshost, r->Link.socksport))
            return FALSE;
    }
    else
    {
        /* Connect directly */
        if (!add_addr_info(&service, &r->Link.hostname, r->Link.port))
            return FALSE;
    }

    if (!RTMP_Connect0(r, (struct sockaddr *)&service))//建立一个socket连接
        return FALSE;

    r->m_bSendCounter = TRUE;

    return RTMP_Connect1(r, cp);//进行C0-2/S0-2协议握手，发送connect命令
}

其中RTMP_Connect0 函数比较简单，标准的socket, conect 流程，另外设置了一下TCP_NODELAY选项，方便小包发送等。以及SO_RCVTIMEO读超时，这部分属于基本的TCP层面的连接；

RTMP_Connect1 函数则完成类似HTTP层面的RTMP协议的连接建立过程。首先是HandShake 握手。RTMP的握手是通过客户端跟服务端互相发送数据包来完成的，每人3个数据包，名之为C0，C1，C2 以及S0，S1， S2。其发送数据有严格的限制的。因为互相依赖。这个在官方文档中有详细的介绍，不多说。

对于librtmp来说，可能的一种流程是：

CLIENT SERVER

C0，C1 —>

<— S0， S1，S2

C2 –>

具体看一下代码，比较长。

static int HandShake(RTMP *r, int FP9HandShake)
{//C0,C1 -- S0, S1, S2 -- C2 消息握手协议
    int i;
    uint32_t uptime, suptime;
    int bMatch;
    char type;
    char clientbuf[RTMP_SIG_SIZE + 1], *clientsig = clientbuf + 1;
    char serversig[RTMP_SIG_SIZE];
    clientbuf[0] = 0x03;//C0, 一个字节。03代表协议版本号为3     /* not encrypted */
    uptime = htonl(RTMP_GetTime());//这是一个时间戳，放在C1消息头部
    memcpy(clientsig, &uptime, 4);
    memset(&clientsig[4], 0, 4);//后面放4个字节的空数据然后就是随机数据
 
    //后面是随机数据，总共1536字节的C0消息
#ifdef _DEBUG
    for (i = 8; i < RTMP_SIG_SIZE; i++)
        clientsig[i] = 0xff;
#else
    for (i = 8; i < RTMP_SIG_SIZE; i++)
        clientsig[i] = (char)(rand() % 256);//发送C0， C1消息
#endif

    if (!WriteN(r, clientbuf, RTMP_SIG_SIZE + 1))
        return FALSE;

    //下面读一个字节也就是S0消息，看协议是否一样
    if (ReadN(r, &type, 1) != 1)    /* 0x03 or 0x06 */
        return FALSE;

    RTMP_Log(RTMP_LOGDEBUG, "%s: Type Answer   : %02X", __FUNCTION__, type);
    if (type != clientbuf[0])//C/S版本不一致
        RTMP_Log(RTMP_LOGWARNING, "%s: Type mismatch: client sent %d, server answered %d",  __FUNCTION__, clientbuf[0], type);

    //读取S1消息，里面有服务器运行时间
    if (ReadN(r, serversig, RTMP_SIG_SIZE) != RTMP_SIG_SIZE)
        return FALSE;

    /* decode server response */
    memcpy(&suptime, serversig, 4);
    suptime = ntohl(suptime);
 
    RTMP_Log(RTMP_LOGDEBUG, "%s: Server Uptime : %d", __FUNCTION__, suptime);
    RTMP_Log(RTMP_LOGDEBUG, "%s: FMS Version   : %d.%d.%d.%d", __FUNCTION__, serversig[4], serversig[5], serversig[6], serversig[7]);

    /* 2nd part of handshake */
    if (!WriteN(r, serversig, RTMP_SIG_SIZE))//发送C2消息，内容就等于S1消息的内容。
        return FALSE;

    //读取S2消息
    if (ReadN(r, serversig, RTMP_SIG_SIZE) != RTMP_SIG_SIZE)
        return FALSE;

    bMatch = (memcmp(serversig, clientsig, RTMP_SIG_SIZE) == 0);
    if (!bMatch)//服务端返回的S2消息必须跟C1消息一致才行
    {
        RTMP_Log(RTMP_LOGWARNING, "%s, client signature does not match!", __FUNCTION__);
    }
    return TRUE;
}

握手的目的其实是互相沟通一下支持的协议版本号，服务器时间戳等。确保连接的对端真的是RTMP支持的。

发送请求给服务端。

然后就是SendConnectPacket的工作了。总结一句其功能是成一个“connect消息以及其app,tcurl等参数，然后调用RTMP_SendPacket函数将其数据发送出去。

到这里连接建立完成了。

二、准备数据通道

RTMP_ConnectStream完成了通道的建立。其处理服务端返回的各种控制消息包，比如收到connect的result后就进行createStream，以及发送play(test)消息。一旦返回，表示服务端开始发送数据了.可以play了。

函数本身比较简单，就是一个while循环，不断的调用RTMP_ReadPacket读取服务端发送过来的数据包进行相应的处理。直到m_bPlaying变老变为TRUE为止，也就是可以播放的时候为止。数据包的处理函数为RTMP_ClientPacket。

int RTMP_ConnectStream(RTMP *r, int seekTime)
{//循环读取服务端发送过来的各种消息，比如window ack**, set peer bandwidth, set chunk size, _result等
    //直到接收到了play
    RTMPPacket packet = { 0 };
 
    /* seekTime was already set by SetupStream / SetupURL.
     * This is only needed by ReconnectStream.
     */
    if (seekTime > 0)
        r->Link.seekTime = seekTime;
    r->m_mediaChannel = 0;
 
    //一个个包的读取，直到服务端告诉我说可以play了为止
    while (!r->m_bPlaying && RTMP_IsConnected(r) && RTMP_ReadPacket(r, &packet))
    {
        if (RTMPPacket_IsReady(&packet))//是否读取完毕。((a)->m_nBytesRead == (a)->m_nBodySize)
        {
            if (!packet.m_nBodySize)
                continue;
            if ((packet.m_packetType == RTMP_PACKET_TYPE_AUDIO) ||
                    (packet.m_packetType == RTMP_PACKET_TYPE_VIDEO) ||
                    (packet.m_packetType == RTMP_PACKET_TYPE_INFO))
            {
                RTMP_Log(RTMP_LOGWARNING, "Received FLV packet before play()! Ignoring.");
                RTMPPacket_Free(&packet);
                continue;
            }
 
            RTMP_ClientPacket(r, &packet);//处理一下这个数据包，其实里面就是处理服务端发送过来的各种消息等。直到接受到了play/publish
            RTMPPacket_Free(&packet);
        }
    }
    //返回当前是否接收到了play/publish 或者stopd等
    return r->m_bPlaying;
}

RTMP_ReadPacket 跟Send类似，函数比较长，基本是处理RTMP数据包RTMPPacket的包头，包体的读写等碎碎代码。真正处理事件的函数为RTMP_ClientPacket。

RTMP_ClientPacket函数是一个很大的数据包分发器。负责将不同类型m_packetType的数据包传递给对应的函数进行处理。比如：

RTMP_PACKET_TYPE_CHUNK_SIZE 块大小设置消息 HandleChangeChunkSize；
RTMP_PACKET_TYPE_CONTROL 控制消息 HandleCtrl ；
RTMP_PACKET_TYPE_AUDIO 音频消息 HandleAudio；
RTMP_PACKET_TYPE_INFO 元数据设置消息 HandleMetadata；
RTMP_PACKET_TYPE_INVOKE 远程过程调用 HandleInvoke；

其中比较重要的是HandleInvoke 远程过程调用。其里面实际是个状态机。

前面说过，建立连接握手的时候，客户端回发送connect字符串以及必要的参数给服务端。然后服务端会返回_result消息。当客户端收到_result消息后，会从消息里面取出其消息号，从而在r->m_methodCalls[i].name 中找到对应发送的消息是什么消息。从而客户端能够确认发送的那条消息被服务端处理了。进而可以进行后续的处理了。来看HandleInvoke开头的代码。

static int HandleInvoke(RTMP *r, const char *body, unsigned int nBodySize){
    AMFObject obj;
    AVal method;
    double txn;
    int ret = 0, nRes;
 
    nRes = AMF_Decode(&obj, body, nBodySize, FALSE);
    if (nRes < 0){
        RTMP_Log(RTMP_LOGERROR, "%s, error decoding invoke packet", __FUNCTION__);
        return 0;
    }
 
    AMF_Dump(&obj);
    AMFProp_GetString(AMF_GetProp(&obj, NULL, 0), &method);
    txn = AMFProp_GetNumber(AMF_GetProp(&obj, NULL, 1));
    RTMP_Log(RTMP_LOGDEBUG, "%s, server invoking <%s>", __FUNCTION__, method.av_val);
 
    if (AVMATCH(&method, &av__result))
    {//接收到服务端返回的一个_result包，所以我们需要找到这个包对应的那条命令，从而处理这条命令的对应事件。
        //比如我们之前发送了个connect给服务端，服务端必然会返回_result，然后我们异步收到result后，会调用
        //RTMP_SendServerBW,RTMP_SendCtrl,以及RTMP_SendCreateStream来创建一个stream
        AVal methodInvoked = {0};
        int i;
 
        for (i=0; im_numCalls; i++) {//找到这条指令对应的触发的方法
            if (r->m_methodCalls[i].num == (int)txn) {
                methodInvoked = r->m_methodCalls[i].name;
                AV_erase(r->m_methodCalls, &r->m_numCalls, i, FALSE);
                break;
            }
        }

上面可以看出，librtmp发送出一条需要得到服务端返回结果的消息的时候，会将消息名称记录在m_methodCalls数组上面，其下标就是告诉服务端的消息id。从而每次收到_result的时候就能知道对那个的是哪条消息methodInvoked。

然后就可以进行对应的处理了，举个例子：在之前发送connect的时候，body部分的第二个元素为一个整数，代表一个唯一ID，这里是1，如下图：

服务端对此数据包的回包会是如下的样子：

注意蓝底的Number 1, 他会跟上面的connect(live)消息对应的。因此methodInvoked变量就能等于connect，所以HandleInvoke函数会进入到如下的分支：

//下面根据不同的方法进行不同的处理
if (AVMATCH(&methodInvoked, &av_connect))
{
    if (r->Link.protocol & RTMP_FEATURE_WRITE)
    {
       SendReleaseStream(r);
        SendFCPublish(r);
    }
    else
    {//告诉服务端，我们的期望是什么，窗口大小，等
        RTMP_SendServerBW(r);
        RTMP_SendCtrl(r, 3, 0, 300);
    }
    RTMP_SendCreateStream(r);//因为服务端同意了我们的connect，所以这里发送createStream创建一个流
    //创建完成后，会再次进如这个函数从而走到下面的av_createStream分支，从而发送play过去
 
    if (!(r->Link.protocol & RTMP_FEATURE_WRITE))
    {
        /* Authenticate on Justin.tv legacy servers before sending FCSubscribe */
        if (r->Link.usherToken.av_len)
            SendUsherToken(r, &r->Link.usherToken);
        /* Send the FCSubscribe if live stream or if subscribepath is set */
        if (r->Link.subscribepath.av_len)
            SendFCSubscribe(r, &r->Link.subscribepath);
        else if (r->Link.lFlags & RTMP_LF_LIVE)
            SendFCSubscribe(r, &r->Link.playpath);
    }
}
else if (AVMATCH(&methodInvoked, &av_createStream))

上面的分支在服务端同意客户端的connect请求后，客户端调用。

根据流的配置类型不同，进行不同的处理，比如如果是播放的话，那么就会调用SendReleaseStream，以及SendFCPublish发送publish消息；

否则会调用RTMP_SendServerBW设置缓冲大小，也就是图中的“Window Acknowledgement Size 5000000” 。然后就是RTMP_SendCtrl设置缓冲时间；

之后就会调用RTMP_SendCreateStream函数，发送注明的流创建过程。发送createStream消息给服务端，创建数据传输通道。当然这里只是发送了数据，什么时候能够确定创建成功呢？答案很简单：当接收到服务端的数据包后，如果其为过程调用，且为_result，并且AVMATCH(&methodInvoked, &av_createStream)的时候，就代表创建成功。看如下代码：

  else if (AVMATCH(&methodInvoked, &av_createStream))
    {
        r->m_stream_id = (int)AMFProp_GetNumber(AMF_GetProp(&obj, NULL, 3));
 
        if (r->Link.protocol & RTMP_FEATURE_WRITE)
        {//如果是要发送，那么高尚服务端，我们要发数据
            SendPublish(r);
        }
        else
        {//否则告诉他我们要接受数据
            if (r->Link.lFlags & RTMP_LF_PLST)
                SendPlaylist(r);
            SendPlay(r);//发送play过去,
            RTMP_SendCtrl(r, 3, r->m_stream_id, r->m_nBufferMS);//以及我们的buf大小
        }
    }
    else if (AVMATCH(&methodInvoked, &av_play) ||
            AVMATCH(&methodInvoked, &av_publish))
    {//接收到了play的回复，那么标记为play
        r->m_bPlaying = TRUE;
    }
    free(methodInvoked.av_val);
}

createStream消息确认收到后，客户端就是发送SendPlay 请求开始接收数据，或者SendPublish请求开始发布数据；

此后再经过几次简短的消息传输，比如：onStatus(‘NetStream.Play.Start’) | |RtmpSampleAccess() | onMetaData() 等，真正的数据就能够开始接收了。也就是服务端开始发送数据了。通信的信道已经建立好。

三、读取数据

连接经过漫长的过程建立起来后，数据读取比较简短，只需要调用nRead = RTMP_Read(rtmp, buffer, bufferSize)函数不断的读取数据就行。这些数据就是发送方放入RTMP通道里面的数据了。

所以这部分其实就等于：通道已经建立，读使用RTMP_Read，发送使用RTMP_SendPacket等。

介绍的差不多了，再细致的后续有时间再补上。基本框架就在这里。过段时间看看nginx_rtmp_module模块学习一下。

HarmonyNext实战：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频处理应用开发引言在音视频处理领域，实时性和性能是关键。随着HarmonyNext生态系统的不断发展，开发者可以利用ArkTS语言构建高性能的音视频处理应用。本文将深入探讨如何利用ArkTS开发一个音视频处理应用，重点介绍音频处理、视频编解码以及实时流媒体传输的实现。我们将从理论基础出发，逐步构建一个完整的应用，并通过优化技巧提升性能。1.音视
三分钟掌握音视频信息查询 | 在 Rust 中优雅地集成 FFmpeg Yeauty 音视频 rust ffmpeg
前言在音视频处理领域，开发者常常需要获取媒体文件的详细信息，如时长、格式、元数据，以及音视频流的编码参数等。这些信息对于媒体管理、转码调度、播放控制等场景至关重要。然而，直接使用FFmpeg命令行工具或其原生API存在以下挑战：命令行工具的复杂性：FFmpeg的命令行参数众多且复杂，使用不当可能导致错误。例如，处理包含空格的文件名时，需要特别注意正确的转义和引用方式，否则可能导致无法识别文件名的问
WebRTC技术在音视频处理上的难点剖析：EasyRTC嵌入式视频通话SDK的优化策略 Black蜡笔小新 EasyRTC webrtc 音视频大模型人工智能
在实时通信领域，WebRTC技术因其开源、高效、低延迟等特性而备受瞩目。然而，尽管WebRTC技术已经相对成熟，但在实际应用中仍然面临诸多挑战。一、网络相关问题（一）网络延迟与稳定性在网络基础设施薄弱或带宽有限的地区，实时通信质量会大打折扣。此外，不同网络运营商之间的差异以及网络拥塞高峰时段，也会导致延迟飙升、丢包率增加。EasyRTC解决方案：EasyRTC通过优化网络传输技术，采用先进的智能路
pydub，一个有趣的 Python 音视频处理库！漫走云雾 python 音视频开发语言
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站零基础入门的AI学习网站~。目录编辑前言什么是pydub？安装pydub基本用法1.播放音频文件2.剪切音频文件高级用法1.合并音频文件2.调整音量实际应用案例1.音频文件格式转换2.音频剪切和合并3.音频混音4.音频音量调整总结前言大家好，今天为大家分享一个有趣的Python库-pydub。Githu
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发引言在HarmonyNext生态系统中，音视频处理是一个复杂且技术密集的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的音视频播放器，涵盖从音视频解码到播放控制的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多种格式的音视频播放器，并优化其性能以适应HarmonyNext平台。环境准备在开始之前，确保你的开发环
基于HarmonyNext的实时音视频通信实战指南 harmonyos-next
基于HarmonyNext的实时音视频通信实战指南引言随着移动互联网的快速发展，实时音视频通信已成为现代应用中不可或缺的功能。HarmonyNext作为华为最新的操作系统，提供了强大的音视频处理能力和高效的开发工具。本文将深入探讨如何在HarmonyNext平台上使用ArkTS实现实时音视频通信，并通过一个实战案例来详细讲解如何实现一个简单的音视频通话应用。环境准备在开始之前，确保你已经安装了以下
工程化与框架系列（27）--前端音视频处理一进制ᅟᅠ ‌‍‎‏ 前端工程化与框架前端音视频状态模式
前端音视频处理引言前端音视频处理是现代Web应用中的重要组成部分，涉及音频播放、视频处理、流媒体传输等多个方面。本文将深入探讨前端音视频处理的关键技术和最佳实践，帮助开发者构建高质量的多媒体应用。音视频技术概述前端音视频处理主要包括以下技术方向：音频处理：音频播放、录制、分析视频处理：视频播放、录制、编辑流媒体：实时音视频、直播推流WebRTC：点对点通信媒体格式：编解码、转换音频处理实现音频播放
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的音视频处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂
FFmpeg 6.0实现视频硬解码大王算法 ffmpeg 音视频 c++1024程序员节
目录一、背景二、FFmpeg6.0实现视频硬解码的操作步骤2.1、安装FFmpeg6.02.2、配置FFmpeg解码器2.3、转换视频流格式2.4、在Surface设备上显示视频三、总结一、背景随着计算机技术的不断发展，视频编解码技术也在不断进步。FFmpeg作为一款强大的开源音视频处理工具，广泛应用于音视频处理的各种场景。而在实际的应用中，我们常常需要将解码后的视频流输出到特定的显示设备，如Mi
音视频处理中的基本概念码农飞飞音视频处理基本概念音视频编码解码
文章目录编码(encode)解码(decode)转码(transcode)视频编码音频编码视频编码参数解析音频编码参数解析各种音视频流介绍流媒体传输部署结构实时流式传输工作流程直播过程的几种工作模式要想入门并学好音视频处理，明白理解音视频处理中的各种基本概念是第一步。这是音视频处理工作中的基石。掌握了解这些概念，对于在音视频领域的发展大有裨益。这里总结了音视频处理中常涉及到的一些概念，希望对想从事
HarmonyNext实战：基于ArkTS的跨平台音视频播放器开发 harmonyos-next
HarmonyNext实战：基于ArkTS的跨平台音视频播放器开发引言在HarmonyNext生态系统中，音视频处理是一个重要且复杂的领域。本文将深入探讨如何使用ArkTS语言开发一个跨平台的音视频播放器，涵盖从音视频解码到播放控制的完整流程。我们将通过一个实战案例，详细讲解如何利用HarmonyNext的多媒体能力，结合ArkTS的现代语法，构建一个高效、灵活的音视频播放器。1.项目概述1.1目
基于 FFmpeg 实现 H.264 转 MP4 视频转码码农新猿类 FFMPEG ffmpeg
引言FFmpeg是强大的开源音视频处理库，能实现多种音视频操作。本文将分享如何用FFmpeg把H.264视频文件转码为MP4格式。代码整体思路代码把转码功能封装在TranceVideo类中，通过一系列步骤完成H.264到MP4的转码，包括初始化、打开输入文件、获取视频流信息、确定输出格式、创建输出文件、转码并写入帧数据，最后清理资源。详细步骤1.初始化在类的构造函数里，进行基础的初始化操作：cpp
Qt/C++ 音视频开发 - 使用 MDK-SDK 组件鱼弦音视频开发系列实践 Qt学习与实践 qt c++音视频
Qt/C++音视频开发-使用MDK-SDK组件介绍MDK-SDK（MediaDevelopmentKitSoftwareDevelopmentKit）是由原QtAV作者开发的一款音视频处理库。它以高性能和跨平台支持为亮点，为开发者提供了便捷的音视频处理接口。相比于其他音视频处理库，MDK-SDK在性能上有显著优势，适用于各种复杂的音视频应用场景。应用使用场景媒体播放器：构建高效、流畅的视频播放软件
fluent-ffmpeg 依赖详解 yqcoder ffmpeg
fluent-ffmpeg是一个用于在Node.js环境中与FFmpeg进行交互的强大库，它提供了流畅的API来执行各种音视频处理任务，如转码、剪辑、合并等。一、安装npminstallfluent-ffmpeg二、基本使用要使用fluent-ffmpeg，首先需要确保系统中已经安装了FFmpeg，或者使用ffmpeg-static等库提供静态的FFmpeg二进制文件。如下，展示如何将视频文件转换
Qt/C++音视频开发-本地摄像头推流/桌面推流/文件推流/监控推流鱼弦 Qt学习与实践音视频开发系列实践 qt c++音视频
Qt/C++音视频开发-本地摄像头推流/桌面推流/文件推流/监控推流介绍Qt/C++音视频开发是一种结合使用Qt框架和C++语言进行音视频处理与传输的技术。通过这种技术，可以实现本地摄像头推流、桌面推流、文件推流以及监控推流等功能。这些应用在视频会议、远程教育、在线直播等场景中非常常见。应用使用场景本地摄像头推流：用于将本地摄像头采集的视频数据进行实时编码并通过网络传输。桌面推流：用于捕获用户桌面
python 速度 write_videofile_moviepy音视频剪辑：使用VideoFileClip、AudioFileClip和write_videofile、write_audiofile... weixin_39529914 python 速度 write_videofile
一、概述在本地进行音视频处理时，首先要从视频文件进行音视频加载，最后要将处理结果输出到文件。本节介绍moviepy的音视频的加载和输出方法。二、视频加载2.1、视频加载方法要从视频文件中加载视频非常简单，使用VideoFileClip类的构造方法即可完成加载。其构造方法语法如下：__init__(self,filename,has_mask=False,audio=True,audio_buffe
Android平台FFmpeg多媒体处理实战雲明
本文还有配套的精品资源，点击获取简介：FFmpeg在Android平台为开发者提供强大的音视频处理能力，涵盖编解码、容器格式解析、软硬解码切换、音频重采样和视频转换等关键功能。本项目介绍如何集成FFmpeg到Android应用，包括编译库、解封装、解码、硬解支持、音频重采样、视频转换和测试代码的使用，为音视频应用开发提供完整流程的实践指南。1.Android平台上FFmpeg的应用和重要性1.1F
FFmpeg音视频编解码优化 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
FFmpeg音视频编解码优化关键词FFmpeg音视频编解码优化策略性能测试实战案例摘要本文将围绕FFmpeg音视频编解码优化这一主题，详细介绍FFmpeg的基础知识、安装配置、音视频编解码原理、性能优化方法，以及实际应用中的实战案例。通过对FFmpeg的深入分析，读者将了解到如何高效地利用FFmpeg进行音视频处理，提升编解码性能，为音视频处理项目提供实用的优化方案。目录大纲第一部分：FFmpeg
Android笔记--MediaCodec(一) ljt2724960661 Android基础 android android
这一节主要来了解一下MediaCodec，AndroidMediaCodec是Android平台提供的一个用于处理音频和视频数据的API。它允许开发者对音频和视频数据进行编码和解码，支持多种格式和编解码器。MediaCodecAPI通常用于实现实时音视频处理，如视频录制、播放、转码等。基本概念：编解码器（Codec）：编解码器是负责将原始音视频数据压缩成特定格式（编码）或将压缩数据还原为原始数据（
FFmpeg：多媒体处理的瑞士军刀我码玄黄开源后端运维 ffmpeg 多媒体处理开源
FFmpeg：多媒体处理的瑞士军刀前言FFmpeg是一个功能强大且跨平台的开源多媒体框架，广泛应用于音视频处理领域。它由多个库和工具组成，能够处理各种音视频格式，涵盖编码、解码、转码、流处理等多种操作。无论是专业视频编辑软件，还是流媒体服务，FFmpeg都扮演着重要角色。本文将从其核心组件、常用命令、应用场景以及优势与挑战等方面，深入探讨FFmpeg的功能与价值。核心组件解析FFmpeg的强大功能
QML音视频架构与设计 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QML音视频架构与设计使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频处理概述1.1QML音视频处理概念1.1.1QML音视频处理概念
大模型高级工程师实践 - 将课程内容转为视频 MichaelIp 大语言模型人工智能实验室音视频 python AIGC prompt langchain 人工智能自然语言处理
通过整合之前生成的文字、音频、PPT，我们能够制作出引人入胜的科普课程视频，使表达更加生动且多样化。本节课程将介绍如何利用音视频处理工具ffmpeg和moviepy，快速将课程内容转化为视频。1.原理介绍当前的大模型文生视频或图生视频方案还不足以直接生成符合我们预期的科普课程视频，因此，我们会采用传统的方案，使用音视频处理工具进行合成。本次课程除了上次课程用到的moviepy外，你还将用到以下工具
pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
ffplay源码分析（五）包缓存队列和帧缓存队列头快撑不住了 ffplay 源码解析 ffplay ffmpeg 音视频
在音视频处理流程中，ffplay的有两种队列，包缓存队列（PacketBufferQueue）和帧缓存队列（FrameBufferQueue）。这两个队列的存在，是为了适应音视频数据处理过程中的多线程架构——包括收包线程、解码线程和渲染线程。具体来说，收包线程负责从网络或文件中读取数据并将其放入包缓存队列中；解码线程从包缓存队列中取出数据进行解码，然后将解码后的数据放入帧缓存队列中；最后，渲染线程
Qt/C++ 音视频开发 - VLC 解码播放（代码+部署测试）鱼弦人工智能时代 qt c++音视频
Qt/C++音视频开发-VLC解码播放介绍Qt是一个跨平台的C++应用程序框架，广泛用于GUI程序和跨平台应用。VLC是一个开源的跨平台多媒体播放器及框架，可以播放大多数多媒体文件及流媒体协议。结合两者可以实现强大的音视频处理功能。在Qt/C++项目中集成VLC可以实现高效的音视频解码和播放功能，从而增强了应用的多媒体处理能力。应用使用场景多媒体播放器：开发支持多种格式的音视频播放器。实时流媒体播
红鲸音视频SD助力企业实现音视频技术 HJ_SDK 音视频
在数字化、信息化高速发展的今天，音视频技术已成为各行业不可或缺的一部分。从在线教育、远程会议到娱乐直播，音视频技术的应用场景日益丰富，对音视频处理技术的要求也越来越高。红鲸音视频SDK以其独特的全面私有云或内网部署、支持信创操作系统等特性，深受众多企业的追捧和欢迎。一、红鲸音视频SDK的技术特点全面私有云或内网部署红鲸音视频SDK的一大亮点是支持全面私有云或内网部署。这一特性使得用户可以将音视频处
RK3588平台开发系列讲解（视频篇）ffmpeg 的移植内核笔记 RK3588 Android12 开发入门到精通专栏 RK3588
文章目录一、ffmpeg介绍二、ffmpeg的组成三、ffmpeg依赖库沉淀、分享、成长，让自己和他人都能有所收获！ffmpeg是一种多媒体音视频处理工具，具备视频采集功能、视频抓取图像、视频格式转换、给视频加水印并能将视频转化为流等诸多强大的功能。它采用LGPL或GPL许可证，是一种开源程序。一、ffmpeg介绍FFmpeg主要特点和功能：多媒体格式支持：FFmpeg支持几乎所有常见的音视频格式
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

rtmplib rtmp协议过程分析

一、建立协议连接

二、准备数据通道

三、读取数据

你可能感兴趣的:(音视频处理)