Deng94

雷神simplest_ffmpeg_player解析（一）

写在前面

学习雷神的博客，向雷神致敬～

看了雷神的小学期视频课，在Github上下载了simplest_ffmpeg_player的代码，为代码加上了注释，作为留存。

2019.07.16

视频中的前置知识点
simple_ffmpeg_decoder.cpp注释
simple_ffmpeg_decoder_pure.cpp注释

链接及参考资料

《基于 FFmpeg + SDL 的视频播放器的制作》课程的视频
FFmpeg Documentation
FFmpeg源代码简单分析

知识点

封装、编码格式

FFmpeg解码流程及数据结构

FFmpeg数据结构简介

AVFormatContext:封装格式上下文结构体，也是统领全局的结构体，保存了视频文件封装格式相关信息
AVInputFormat:每种封装格式对应一个该结构体
AVStream:视频文件每个视频（音频）流对应一个该结构体
AVCodecContext:编码器上下文结构体，保存了视频（音频）编解码相关信息
AVCodec:每种视频（音频）编解码器对应一个该结构体
AVPacket:存储一帧压缩编码数据
AVFrame:存储一帧解码后像素（采样）数据

AVFormatContext

iformat:输入视频的AVIputFormat
nb_streams:输入视频的AVStream个数
streams:输入视频的AVStream[]数组
duration:输入视频的时长（以微秒为单位）
bit_rate:输入视频的码率

AVIputFormat

name:封装格式名称
long_name:封装格式的长名称
extensions:封装格式的扩展名
id:封装格式ID
一些封装格式处理的接口函数

AVStream

id:序号
codec:该流对应的AVCodecContext
time_base:该流的时基
r_frame_rate:该流的帧率

AVCodecContext

codec:编解码器的AVCodec
width,height:图像的宽高（只针对视频）
pix_fmt:像素格式（只针对视频）
sample_rate:采样率（只针对音频）
channels:声道数（只针对音频）
sample_fmt:采样格式（只针对音频）

AVCodec

name:编解码器名称
long_name:编解码器长名称
type:编解码器类型
id:编解码器ID
一些编解码的接口函数

1.simplest_ffmpeg_decoder.cpp

/**
 * 最简单的基于FFmpeg的视频解码器
 * Simplest FFmpeg Decoder
 *
 * 雷霄骅 Lei Xiaohua
 * [email protected]
 * 中国传媒大学/数字电视技术
 * Communication University of China / Digital TV Technology
 * http://blog.csdn.net/leixiaohua1020
 *
 *
 * 本程序实现了视频文件解码为YUV数据。它使用了libavcodec和
 * libavformat。是最简单的FFmpeg视频解码方面的教程。
 * 通过学习本例子可以了解FFmpeg的解码流程。
 * This software is a simplest decoder based on FFmpeg.
 * It decodes video to YUV pixel data.
 * It uses libavcodec and libavformat.
 * Suitable for beginner of FFmpeg.
 *
 */



#include 

#define __STDC_CONSTANT_MACROS

#ifdef _WIN32
//Windows
extern "C"
{
#include "libavcodec/avcodec.h"
#include "libavformat/avformat.h"
#include "libswscale/swscale.h"
#include "libavutil/imgutils.h"
};
#else
//Linux...
#ifdef __cplusplus
extern "C"
{
#endif
#include 
#include 
#include 
#include 
#ifdef __cplusplus
};
#endif
#endif

/**
 * 将视频解封装、解码，转换为yuv格式
 **/
int main(int argc, char* argv[])
{
    // 封装格式上下文的结构体，也是统领全局的结构体，保存了视频文件封装格式的相关信息
   AVFormatContext    *pFormatCtx;

   // 视频流在文件中的位置
   int             i, videoindex;

   // 编码器上下文结构体，保存了视频（音频）编解码相关信息
   AVCodecContext *pCodecCtx;

   // 每种视频（音频）编解码器（例如H.264解码器）对应一个该结构体
   AVCodec          *pCodec;

   // 存储一帧解码后像素（采样）数据
   AVFrame    *pFrame,*pFrameYUV;

   //
   unsigned char *out_buffer;

   // 存储一帧压缩编码数据
   AVPacket *packet;

   // width×height，用于计算YUV数据分布
   int y_size;

   // 视频是否解码成功的返回
   int ret, got_picture;

   // libswsscale 上下文
   struct SwsContext *img_convert_ctx;

    // 输入文件
   char filepath[]="Titanic.mkv";

    // 输出文件
   FILE *fp_yuv=fopen("output.yuv","wb+");  

    // 注册复用器，编码器等（参考FFmpeg解码流程图）
   av_register_all();
   avformat_network_init();
   pFormatCtx = avformat_alloc_context();

    // 打开多媒体数据并且获得一些相关的信息（参考FFmpeg解码流程图）
   if(avformat_open_input(&pFormatCtx,filepath,NULL,NULL)!=0){
      printf("Couldn't open input stream.\n");
      return -1;
   }

   // 读取一部分视音频数据并且获得一些相关的信息（参考FFmpeg解码流程图）
   if(avformat_find_stream_info(pFormatCtx,NULL)<0){
      printf("Couldn't find stream information.\n");
      return -1;
   }

   // 每个视频文件中有多个流（视频流、音频流、字幕流等，而且可有多个），循环遍历找到视频流
   // 判断方式：AVFormatContext->AVStream->AVCodecContext->codec_type是否为AVMEDIA_TYPE_VIDEO
   videoindex=-1;
   for(i=0; inb_streams; i++) 
      if(pFormatCtx->streams[i]->codec->codec_type==AVMEDIA_TYPE_VIDEO){
         videoindex=i;
         break;
      }

   // 如果没有视频流，返回
   if(videoindex==-1){
      printf("Didn't find a video stream.\n");
      return -1;
   }

    // 保存视频流中的AVCodecContext
   pCodecCtx=pFormatCtx->streams[videoindex]->codec;

   // 用于查找FFmpeg的解码器（参考FFmpeg解码流程图）
   pCodec=avcodec_find_decoder(pCodecCtx->codec_id);
   if(pCodec==NULL){
      printf("Codec not found.\n");
      return -1;
   }

   // （参考FFmpeg解码流程图）
   if(avcodec_open2(pCodecCtx, pCodec,NULL)<0){
      printf("Could not open codec.\n");
      return -1;
   }

   // 创建一个AVFrame，用来存放解码后的一帧的数据
   pFrame=av_frame_alloc();
   pFrameYUV=av_frame_alloc();

    // av_image_get_buffer_size：返回使用给定参数存储图像所需的数据量的字节大小
   out_buffer=(unsigned char *)av_malloc(av_image_get_buffer_size(AV_PIX_FMT_YUV420P,  pCodecCtx->width, pCodecCtx->height,1));

   // 根据指定的图像参数和提供的数组设置数据指针和线条（data pointers and linesizes）
   av_image_fill_arrays(pFrameYUV->data, pFrameYUV->linesize,out_buffer,
      AV_PIX_FMT_YUV420P,pCodecCtx->width, pCodecCtx->height,1);

   
   // 创建一个AVPacket，用来存放下面循环获取到的未解码帧
   packet=(AVPacket *)av_malloc(sizeof(AVPacket));

   //Output Info-----------------------------
   printf("--------------- File Information ----------------\n");
   av_dump_format(pFormatCtx,0,filepath,0);
   printf("-------------------------------------------------\n");

    // sws_getContext()：初始化一个SwsContext
   img_convert_ctx = sws_getContext(pCodecCtx->width, pCodecCtx->height, pCodecCtx->pix_fmt, 
      pCodecCtx->width, pCodecCtx->height, AV_PIX_FMT_YUV420P, SWS_BICUBIC, NULL, NULL, NULL); 

    // 循环读取帧数据
   while(av_read_frame(pFormatCtx, packet)>=0){
       // 取出视频流，
      if(packet->stream_index==videoindex){
          // 解码一帧视频数据：输入一个压缩编码的结构体AVPacket，输出一个解码后的结构体AVFrame
         ret = avcodec_decode_video2(pCodecCtx, pFrame, &got_picture, packet);
         if(ret < 0){
            printf("Decode Error.\n");
            return -1;
         }

         if(got_picture){
             // sws_scale()：处理图像数据，用于转换像素
            sws_scale(img_convert_ctx, (const unsigned char* const*)pFrame->data, pFrame->linesize, 0, pCodecCtx->height, 
               pFrameYUV->data, pFrameYUV->linesize);

                // 根据YUV数据格式，分离Y、U、V数据
                // 如果视频帧的宽和高分别为w和h，那么一帧YUV420P像素数据一共占用w*h*3/2 Byte的数据
                // 其中前w*h Byte存储Y，接着的w*h*1/4 Byte存储U，最后w*h*1/4 Byte存储V
            y_size=pCodecCtx->width*pCodecCtx->height;  
            fwrite(pFrameYUV->data[0],1,y_size,fp_yuv);    //Y 
            fwrite(pFrameYUV->data[1],1,y_size/4,fp_yuv);  //U
            fwrite(pFrameYUV->data[2],1,y_size/4,fp_yuv);  //V
            printf("Succeed to decode 1 frame!\n");

         }
      }
      av_free_packet(packet);
   }

   //flush decoder
   //FIX: Flush Frames remained in Codec
   while (1) {
       // 解码一帧视频数据：输入一个压缩编码的结构体AVPacket，输出一个解码后的结构体AVFrame
      ret = avcodec_decode_video2(pCodecCtx, pFrame, &got_picture, packet);
      if (ret < 0)
         break;
      if (!got_picture)
         break;

      // // sws_scale()：处理图像数据，用于转换像素
      sws_scale(img_convert_ctx, (const unsigned char* const*)pFrame->data, pFrame->linesize, 0, pCodecCtx->height, 
         pFrameYUV->data, pFrameYUV->linesize);

      int y_size=pCodecCtx->width*pCodecCtx->height;  
      fwrite(pFrameYUV->data[0],1,y_size,fp_yuv);    //Y 
      fwrite(pFrameYUV->data[1],1,y_size/4,fp_yuv);  //U
      fwrite(pFrameYUV->data[2],1,y_size/4,fp_yuv);  //V

      printf("Flush Decoder: Succeed to decode 1 frame!\n");
   }

    // sws_freeContext()：释放一个SwsContext
   sws_freeContext(img_convert_ctx);

    // close and free
    fclose(fp_yuv);

   av_frame_free(&pFrameYUV);
   av_frame_free(&pFrame);
   avcodec_close(pCodecCtx);
   avformat_close_input(&pFormatCtx);

   return 0;
}

2.simplest_ffmpeg_decoder_pure

/**
 * 最简单的基于FFmpeg的视频解码器（纯净版）
 * Simplest FFmpeg Decoder Pure
 *
 * 雷霄骅 Lei Xiaohua
 * [email protected]
 * 中国传媒大学/数字电视技术
 * Communication University of China / Digital TV Technology
 * http://blog.csdn.net/leixiaohua1020
 *
 *
 * 本程序实现了视频码流(支持HEVC，H.264，MPEG2等)解码为YUV数据。
 * 它仅仅使用了libavcodec（而没有使用libavformat）。
 * 是最简单的FFmpeg视频解码方面的教程。
 * 通过学习本例子可以了解FFmpeg的解码流程。
 * This software is a simplest decoder based on FFmpeg.
 * It decode bitstreams to YUV pixel data.
 * It just use libavcodec (do not contains libavformat).
 * Suitable for beginner of FFmpeg.
 */

#include 

#define __STDC_CONSTANT_MACROS

#ifdef _WIN32
//Windows
extern "C"
{
#include "libavcodec/avcodec.h"
};
#else
//Linux...
#ifdef __cplusplus
extern "C"
{
#endif
#include 
#ifdef __cplusplus
};
#endif
#endif


//test different codec
#define TEST_H264  1
#define TEST_HEVC  0

int main(int argc, char* argv[])
{
    // 每种视频（音频）编解码器（例如H.264解码器）对应一个该结构体
   AVCodec *pCodec;

    // 编码器上下文结构体，保存了视频（音频）编解码相关信息
    AVCodecContext *pCodecCtx= NULL;

    // 保存了当前帧的信息，包括offset、dts、pts、宽高等
   AVCodecParserContext *pCodecParserCtx=NULL;

    FILE *fp_in;
   FILE *fp_out;

   // 存储一帧解码后像素（采样）数据
    AVFrame    *pFrame;
   
   const int in_buffer_size=4096;

   // FF_INPUT_BUFFER_PADDING_SIZE:在输入比特流的末尾用于解码的额外分配字节的所需数量。
    // 这主要是因为一些优化的比特流读取器一次读取32位或64位并且可以读取结束。
    // 注意：如果附加字节的前23位不为0，则损坏的MPEG比特流可能导致过度读取和段错误。
   unsigned char in_buffer[in_buffer_size + FF_INPUT_BUFFER_PADDING_SIZE]={0};
   unsigned char *cur_ptr;
   int cur_size;

   // 存储一帧压缩编码数据
    AVPacket packet;

    // 视频是否解码成功的返回
   int ret, got_picture;

    // hevc h264 m2v -> yuv
#if TEST_HEVC
   enum AVCodecID codec_id=AV_CODEC_ID_HEVC;
   char filepath_in[]="bigbuckbunny_480x272.hevc";
#elif TEST_H264
   AVCodecID codec_id=AV_CODEC_ID_H264;
   char filepath_in[]="bigbuckbunny_480x272.h264";
#else
   AVCodecID codec_id=AV_CODEC_ID_MPEG2VIDEO;
   char filepath_in[]="bigbuckbunny_480x272.m2v";
#endif

   char filepath_out[]="bigbuckbunny_480x272.yuv";
   int first_time=1;


   //av_log_set_level(AV_LOG_DEBUG);

   // 注册复用器，编码器等（参考FFmpeg解码流程图）
   avcodec_register_all();

    // 用于查找FFmpeg的解码器（参考FFmpeg解码流程图）
    pCodec = avcodec_find_decoder(codec_id);
    if (!pCodec) {
        printf("Codec not found\n");
        return -1;
    }

    // 创建AVCodecContext结构体
    pCodecCtx = avcodec_alloc_context3(pCodec);
    if (!pCodecCtx){
        printf("Could not allocate video codec context\n");
        return -1;
    }

    // 初始化AVCodecParserContext。其参数是codec_id,所以同时只能解析一种
    // AVCodecParser用于解析输入的数据流并把它们分成一帧一帧的压缩编码数据。
    // 比较形象的说法就是把长长的一段连续的数据“切割”成一段段的数据。
    // 核心函数是av_parser_parse2()
   pCodecParserCtx=av_parser_init(codec_id);
   if (!pCodecParserCtx){
      printf("Could not allocate video parser context\n");
      return -1;
   }

    //if(pCodec->capabilities&CODEC_CAP_TRUNCATED)
    //    pCodecCtx->flags|= CODEC_FLAG_TRUNCATED; 

    // 使用给定的AVCodec初始化AVCodecContext;
    // 在使用这个函数之前需要使用avcodec_alloc_context3()分配的context
    if (avcodec_open2(pCodecCtx, pCodec, NULL) < 0) {
        printf("Could not open codec\n");
        return -1;
    }
   //Input File
    fp_in = fopen(filepath_in, "rb");
    if (!fp_in) {
        printf("Could not open input stream\n");
        return -1;
    }
   //Output File
   fp_out = fopen(filepath_out, "wb");
   if (!fp_out) {
      printf("Could not open output YUV file\n");
      return -1;
   }

    pFrame = av_frame_alloc();
    // 把packet的参数设为默认值，要求packet的内存已经分配好了
   av_init_packet(&packet);

   while (1) {
        // 获取视频文件的总长度
        cur_size = fread(in_buffer, 1, in_buffer_size, fp_in);
        if (cur_size == 0)
            break;
        cur_ptr=in_buffer;

        while (cur_size>0){
            /**
              * 解析数据获得一个Packet， 从输入的数据流中分离出一帧一帧的压缩编码数据
              * Parse a packet.
              *
              * @param s             parser context.
              * @param avctx         codec context.
              * @param poutbuf       set to pointer to parsed buffer or NULL if not yet finished.
              * @param poutbuf_size  set to size of parsed buffer or zero if not yet finished.
              * @param buf           input buffer.
              * @param buf_size      input length, to signal EOF, this should be 0 (so that the last frame can be output).
              * @param pts           input presentation timestamp.
              * @param dts           input decoding timestamp.
              * @param pos           input byte position in stream.
              * @return the number of bytes of the input bitstream used.
              *
              * Example:
              * @code
              *   while(in_len){
              *       len = av_parser_parse2(myparser, AVCodecContext, &data, &size,
              *                                        in_data, in_len,
              *                                        pts, dts, pos);
              *       in_data += len;
              *       in_len  -= len;
              *
              *       if(size)
              *          decode_frame(data, size);
              *   }
              * @endcode
              *
              * 其中poutbuf指向解析后输出的压缩编码数据帧，buf指向输入的压缩编码数据。
              * 如果函数执行完后输出数据为空（poutbuf_size为0），则代表解析还没有完成，还需要再次调用av_parser_parse2()解析一部分数据才可以得到解析后的数据帧。
              * 当函数执行完后输出数据不为空的时候，代表解析完成，可以将poutbuf中的这帧数据取出来做后续处理。
              */
         int len = av_parser_parse2(
            pCodecParserCtx, pCodecCtx,
            &packet.data, &packet.size,
            cur_ptr , cur_size ,
            AV_NOPTS_VALUE, AV_NOPTS_VALUE, AV_NOPTS_VALUE);

         cur_ptr += len;
         cur_size -= len;

            // 如果函数执行完后输出数据为空（poutbuf_size为0），则代表解析还没有完成，还需要再次调用av_parser_parse2()解析一部分数据才可以得到解析后的数据帧。
         if(packet.size==0)
            continue;

         //Some Info from AVCodecParserContext
         printf("[Packet]Size:%6d\t",packet.size);
         switch(pCodecParserCtx->pict_type){
            case AV_PICTURE_TYPE_I: printf("Type:I\t");break;
            case AV_PICTURE_TYPE_P: printf("Type:P\t");break;
            case AV_PICTURE_TYPE_B: printf("Type:B\t");break;
            default: printf("Type:Other\t");break;
         }
         printf("Number:%4d\n",pCodecParserCtx->output_picture_number);

            // 解码一帧视频数据：输入一个压缩编码的结构体AVPacket，输出一个解码后的结构体AVFrame
         ret = avcodec_decode_video2(pCodecCtx, pFrame, &got_picture, &packet);
         if (ret < 0) {
            printf("Decode Error.\n");
            return ret;
         }
         if (got_picture) {
            if(first_time){
               printf("\nCodec Full Name:%s\n",pCodecCtx->codec->long_name);
               printf("width:%d\nheight:%d\n\n",pCodecCtx->width,pCodecCtx->height);
               first_time=0;
            }
            //Y, U, V
            for(int i=0;iheight;i++){
               fwrite(pFrame->data[0]+pFrame->linesize[0]*i,1,pFrame->width,fp_out);
            }
            for(int i=0;iheight/2;i++){
               fwrite(pFrame->data[1]+pFrame->linesize[1]*i,1,pFrame->width/2,fp_out);
            }
            for(int i=0;iheight/2;i++){
               fwrite(pFrame->data[2]+pFrame->linesize[2]*i,1,pFrame->width/2,fp_out);
            }

            printf("Succeed to decode 1 frame!\n");
         }
      }

    }

   //Flush Decoder
    packet.data = NULL;
    packet.size = 0;
   while(1){
       // 解码一帧视频数据：输入一个压缩编码的结构体AVPacket，输出一个解码后的结构体AVFrame
      ret = avcodec_decode_video2(pCodecCtx, pFrame, &got_picture, &packet);
      if (ret < 0) {
         printf("Decode Error.\n");
         return ret;
      }
      if (!got_picture){
         break;
      }else {
         //Y, U, V
         for(int i=0;iheight;i++){
            fwrite(pFrame->data[0]+pFrame->linesize[0]*i,1,pFrame->width,fp_out);
         }
         for(int i=0;iheight/2;i++){
            fwrite(pFrame->data[1]+pFrame->linesize[1]*i,1,pFrame->width/2,fp_out);
         }
         for(int i=0;iheight/2;i++){
            fwrite(pFrame->data[2]+pFrame->linesize[2]*i,1,pFrame->width/2,fp_out);
         }

         printf("Flush Decoder: Succeed to decode 1 frame!\n");
      }
   }

    // close and free
    fclose(fp_in);
   fclose(fp_out);


   av_parser_close(pCodecParserCtx);

   av_frame_free(&pFrame);
   avcodec_close(pCodecCtx);
   av_free(pCodecCtx);

   return 0;
}

音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
OpenglEs之EGL环境搭建 FlyerGo Opengl 音视频 c++opengl
前言前面我们发布了一系列的入门教程，例如C++系列的指针扫盲、多线程的使用等，JNI入门系列，ffmpeg入门系列等，有感兴趣的童鞋们可以关注往回自行查阅。今天我们的主题依然是音视频开发的范畴，做过音视频开发的都知道Opengl也是音视频开发中的一项重要技能，特别是涉及到视频录制、特效处理、画质渲染细分功能。因此后续笔者打算再出一系列的OpenglES的学习笔记，希望能与大家共同温故知新。因为前面
Android 音视频开发：详讲 AudioTrack 播放PCM音频【附源码】小驰行动派 android 音视频 pcm
一、AudioTrack基本使用AudioTrack类可以完成Android平台上音频数据的输出任务。AudioTrack有两种数据加载模式（MODE_STREAM和MODE_STATIC），对应的是数据加载模式和音频流类型，对应着两种完全不同的使用场景。MODE_STREAM：在这种模式下，通过write一次次把音频数据写到AudioTrack中。这和平时通过write系统调用往文件中写数据类似
音视频开发—FFmpeg打开麦克风，采集音频数据 Trump. yang 音视频开发音视频 ffmpeg
文章目录1.使用命令行实现采集PCM数据2.使用代码实现3.播放PCM4.PCM转换为WAV1.使用命令行实现采集PCM数据确保你的系统有FFmpeg安装。你可以通过在终端运行ffmpeg-version来检查是否已安装。找出你的麦克风设备名。在Linux中，你可以使用arecord-l命令列出所有的音频录制设备。使用FFmpeg录制音频。下面是一个基本的命令示例，它使用FFmpeg从麦克风捕获音
Qt/C++ 音视频开发 - FFmpeg保存裸流鱼弦人工智能时代 qt c++音视频
Qt/C++音视频开发-FFmpeg保存裸流介绍FFmpeg是一个开源的多媒体框架，能够处理音频、视频及其他多媒体文件和流。裸流指的是未经封装处理的原始音视频数据。使用FFmpeg保存裸流，可以通过高效的方式处理并存储音视频数据。应用使用场景实时流媒体传输：在没有时间进行复杂封装的情况下，将音视频数据直接传输。低延迟应用：减少因为封装产生的冗余数据和延迟。数据分析：对原始音视频数据进行深入分析时，
【Qt | 音视频学习路线（高薪路线 AI）】 Qt历险记 Qt 高级开发工程师 qt 音视频学习
Answer学习Qt音视频开发的学习路线可以分为以下几个阶段：1.基础知识准备C++编程基础：Qt主要使用C++，因此需要有扎实的C++编程基础。计算机图形学基础：了解基本的图形学概念，如图像处理、渲染等。音视频基础：了解音视频的基本概念，如编码、解码、格式等。2.学习Qt框架Qt基础：学习Qt的基本概念，如信号与槽、事件处理、界面布局等。QtWidgets：掌握QtWidgets模块，用于创建传
Qt/C++ 音视频开发 - VLC 回调处理鱼弦人工智能时代 qt c++音视频
Qt/C++音视频开发-VLC回调处理介绍Qt是一个跨平台的C++应用程序开发框架，VLC则是一个广泛使用的多媒体播放器和框架。通过结合这两者，我们可以构建一个功能强大的音视频应用。在这个过程中，VLC提供了丰富的API和回调机制，让我们能够方便地处理音视频流。应用使用场景实时视频流处理：用于监控系统，直播平台等。多媒体播放器：构建一个自定义的音视频播放器。视频分析与处理：如视频剪辑、特效添加等。
Qt/C++ 音视频开发 - VLC 解码播放（代码+部署测试）鱼弦人工智能时代 qt c++音视频
Qt/C++音视频开发-VLC解码播放介绍Qt是一个跨平台的C++应用程序框架，广泛用于GUI程序和跨平台应用。VLC是一个开源的跨平台多媒体播放器及框架，可以播放大多数多媒体文件及流媒体协议。结合两者可以实现强大的音视频处理功能。在Qt/C++项目中集成VLC可以实现高效的音视频解码和播放功能，从而增强了应用的多媒体处理能力。应用使用场景多媒体播放器：开发支持多种格式的音视频播放器。实时流媒体播
音视频常见问题（七）：首开慢即构开发者
本文主要讨论音视频应用中的首开慢问题，文章介绍了首开慢的产生原因：DNS解析耗时、网络传输协议耗时、传输网络调度耗时，并提供了排查方式和解决方案。即构科技的ExpressSDK和MSDN网络可以有效的解决首开慢问题，且节省开发成本。一、前言对于音视频开发者来说，掌握排查问题的技术技巧方法是非常必要的，排查问题的技术方法也能够帮助开发者更好地了解音视频技术的原理和工作机制，从而更加深入地理解音视频开
C++音视频开发-H.265编码原理入门零声教育 1000道程序员常见问题解析音视频人工智能计算机视觉 h265 c++
视频编码的目的是为了压缩原始视频，压缩的主要思路是从空间、时间、编码、视觉等几个主要角度去除冗余信息。由于H.264出色的数据压缩比率和视频质量，成为当前市场上最为流行的编解码标准。而H.265是在H.264的基础上，保证相同视频质量的同时，视频流的码率还可以减少50%。随着H.265编码格式越来越流行，本文将主要介绍H.265的编码原理，以下是H.265的编码框架流程图。01、编码结构H.265
Android音视频开发之MediaExtractor 永恒_FM
简介Android提供了一个MediaExtractor类，可以用来分离容器中的视频track和音频track。使用步骤通过setDataSource()设置数据源，数据源可以是本地文件地址，也可以是网络地址：MediaExtractormVideoExtractor=newMediaExtractor();mVideoExtractor.setDataSource(mVideoPath);可以通
019-C++跨平台开发内存检测一亩三分甜
《C++文章汇总》上一篇介绍了《018-智能指针》,本文介绍实际开发中利用Xcode工具对内存进行检测。在音视频开发中，不可避免要使用C++，需要我们自己管理内存，不像OC可通过自动释放池autoreleasepool管理内存，如何知道我们写的C++代码是否有内存忘记释放，内存泄露，内存破坏呢？可充分利用Xcode检测调试工具进行检测调试1.开发中遇到的问题需求图片.png图片.png现实开发中图
音视频开发之旅（40)-贝塞尔曲线和曲面 yabin小站
目录贝塞尔曲线基本知识画贝塞尔曲线让曲线动起来画贝塞尔曲面资料收获本篇最终实现效果如下：篇外说明：由于有必要学习使用下kotlin，后续的java层代码实现尽量采用kotlin一、贝塞尔曲线基本知识贝塞尔曲线法国汽车工程师PierreBézier在1962年在对汽车主体进行设计时的发明，通过贝塞尔曲线可以设计出优美的车身。在PS、Sketch等图形软件上我们也经常会看到通过钢笔icon进行贝塞尔曲
音视频开发学习之路--C语言（二）蜗牛是不是牛
前言C和C++作为学习音视频技术首要具备的语言基础，所以十分必要学习和复习一下之前学习的C语言基础。视频教程：音视频开发全系列教程_哔哩哔哩_bilibili正文前面有一篇文章已经介绍了不少关于C的知识点，下面我们继续。结构体不论是C还是Java，都不能只有那几种基本数据类型，当然也需要一种类的概念，在Java中是面向对象，也就是类，在C中我们需要使用结构体。结构体允许C语言创建一种自定义的数据类
聊聊 Http 服务化改造实践程序员老舅 C++Linux后端 http 网络协议网络 C++服务器开发服务器 linux
在微服务架构体系中远程RPC调用主要包括Dubbo与Http调用两个大类，由于Dubbo拥有服务注册中心，并且起服务的命名非常规范，使用包名.类名.方法名进行描述。粉丝福利，免费领取C/C++开发学习资料包、技术视频/项目代码，1000道大厂面试题，内容包括（C++基础，网络编程，数据库，中间件，后端开发/音视频开发/Qt开发/游戏开发/Linuxn内核等进阶学习资料和最佳学习路线）↓↓↓↓↓↓见
C++并发编程：如何编写多线程代码程序员老舅 C++Linux后端 c++服务器后端开发 linux C++多线程 C++线程池高并发
一、多线程概述1多线程的概念与优劣多线程是指在程序中同时运行多个线程，每个线程都可以独立执行不同的代码段，且各个线程之间共享程序的数据空间和资源。粉丝福利，免费领取C/C++开发学习资料包、技术视频/项目代码，1000道大厂面试题，内容包括（C++基础，网络编程，数据库，中间件，后端开发/音视频开发/Qt开发/游戏开发/Linuxn内核等进阶学习资料和最佳学习路线）↓↓↓↓↓↓见下面↓↓文章底部点
MongoDB 中的分布式集群架构程序员老舅 C++Linux后端 mongodb 分布式架构 C++服务器开发 C++后端开发 linux c++
前言前面我们了解了MongoDB中的索引，事务，锁等知识点。线上使用的MongoDB大部分的场景我们都会考虑使用分布式结构，这里我们来了解一下MongoDB中的分布式架构。粉丝福利，免费领取C/C++开发学习资料包、技术视频/项目代码，1000道大厂面试题，内容包括（C++基础，网络编程，数据库，中间件，后端开发/音视频开发/Qt开发/游戏开发/Linuxn内核等进阶学习资料和最佳学习路线）↓↓↓
CentOS下安装vlc cuijiecheng2018 音视频技术 linux centos linux 音视频
一、引言vlc是一跨多媒体播放器，可以播放本地媒体文件和网络串流，帮助我们排查音视频开发过程中遇到的问题。大部分情况下，我们只需要在Windows系统下安装vlc就可以了。但有一种情况是需要在Linux下安装vlc的：我们的音视频拉流软件（比如推流端）运行在Linux系统下，只能通过该Linux系统访问网络串流（比如摄像机的rtsp流），无法通过Windows系统访问这些网络串流。这个时候为了能判
音视频开发系列(8)——详解Android SurfaceTexture 进击的代码家音视频开发 android 音视频
SurfaceTexture是Android中用于在OpenGLES中显示Camera预览数据的类。它提供了一些API来管理预览数据，如下：SurfaceTexture(inttexName)：构造函数，用于创建SurfaceTexture对象。voidsetOnFrameAvailableListener(SurfaceTexture.OnFrameAvailableListenerlisten
那些实时音视频开发中会用到开源项目攻城狮百里音视频音视频音视频开发 webrtc ffmpeg
实时音视频的开发学习有很多可以参考的开源项目。一个实时音视频应用共包括几个环节：采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节，还有更细分的技术模块。比如，前后处理环节有美颜、滤镜、回声消除、噪声抑制等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。我们今天汇总了一些能帮助到正在学习或进行音视频开发的实时音视频开发者们的开源项目与几个也在为开源社区贡
18个实时音视频开发中会用到开源项目【零声教育】音视频开发进阶编程音视频开发程序员实时音视频开源 ffmpeg webrtc c++
实时音视频的开发学习有很多可以参考的开源项目。一个实时音视频应用共包括几个环节：采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节，还有更细分的技术模块。比如，前后处理环节有美颜、滤镜、回声消除、噪声抑制等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。我们今天汇总了一些能帮助到正在学习或进行音视频开发的实时音视频开发者们的开源项目与几个也在为开源社区贡
FFmpeg音视频开发入门--Apple的学习笔记 applecai
之前看过一个流媒体开发的音视频基础，并且搭建过FFmpeg的VS2017调试环境。所以现在要通过使用FFmpeg库来入门。目标会使用基本的FFmpeg命令，实现简易播放--ok通过FFmpeg的API+SDL，实现简易播放--ok关于音视频中的关键步骤解协议：对象为流媒体RTMP等数据。解封装：对象为封装为MP4，AVI等格式的数据。解码：对象为压缩过的包括H.264/AAC等的数据，目的是输出最
音视频知识图谱 2022.05 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看这个合集：音视频面试题集锦。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱，你可以看看这个合集：音视频知识图谱。下面是2022.05月知识图谱新增的内容节选：1）图谱路径：采集/视频采集/对焦策略手动对
音视频开发系列(30)MediaExtractor MediaMuxer 实现视频的解封装与合成音视频开发老马 Android音视频开发音视频开发流媒体服务器视频编解码音视频实时音视频 webrtc c++
一、有什么实际应用在我们日常使用短视频软件的时候，对视频的裁剪，拼凑，加入背景是很常用的操作，这些功能是如何实现的呐？其实是将视频多信道的分离出来，比如音轨和视频轨道分隔出来，可以做到二次合成。今天我们通过对来MediaExtractor和MediaMuxer的学习分析和实践来实现“把视频分离（提取&解封装）出纯音频和纯视频文件”、“替换背景音乐，合成新的视频文件”。二、视频解封装和合成的API以
音视频开发（五）：MediaExtractor MediaMuxer 实现视频的解封装与合成程序员老舅音视频开发进阶音视频视频编解码实时音视频 webrtc 实时互动
目录MediaExtractorMediaMuxer能做什么视频解封装和合成的API以及流程介绍三个实践（视频解封装提取纯音轨和视频轨文件、再合成新视频、给视频换个背景音）遇到的问题一、有什么实际应用在我们日常使用短视频软件的时候，对视频的裁剪，拼凑，加入背景是很常用的操作，这些功能是如何实现的呐？其实是将视频多信道的分离出来，比如音轨和视频轨道分隔出来，可以做到二次合成。今天我们通过对来Medi
Qt/C++音视频开发65-切换声卡/选择音频输出设备/播放到不同的声音设备/声卡下拉框 feiyangqingyun Qt/C++音视频相关 qt c++音视频
一、前言近期收到一个用户需求，要求音视频组件能够切换声卡，首先要在vlc上实现，于是马不停蹄的研究起来，马上查阅对应vlc有没有自带的api接口，查看接口前，先打开vlc播放器，看下能不能切换，因为不是所有播放器都有这个功能，试了下vlc当然是可以的，这个是最基本的前提，如果连播放器本身都没有，那就很悬了。vlc的主要播放接口都在libvlc_media_player.h头文件中，音频设备搜索关键
udp（无连接）客户端和服务端代码 warmingsummer 就业班视频学习 udp linux c++
B站就业班视频的代码搬运55课最后部分我正在自学C++跟着这个视频，有同样自学的朋友私信--加个qq一起努力啊。我的以后的努力方向：数据库或者音视频开发。。。以往的网络代码（tcp），必须先开服务器端，（服务器代码中，步骤如下：socket函数创建套接字描述符bind绑定本地（本机当服务器了）上的IP地址和端口一个listen改为监听模式然后你去启动客户端文件，服务器端accept函数接受到新连接
Android AVDemo（4）：音频解封装，从 MP4 中解封装出 AAC丨音视频工程示例关键帧Keyframe
vx搜索『gjzkeyframe』关注『关键帧Keyframe』来及时获得最新的音视频技术文章。塞尚《河流》.jpeg这个公众号会路线图式的遍历分享音视频技术：音视频基础(完成)→音视频工具(完成)→音视频工程示例(进行中)→音视频工业实战(准备)。iOS/Android客户端开发同学如果想要开始学习音视频开发，最丝滑的方式是对音视频基础概念知识有一定了解后，再借助iOS/Android平台的音视
Android音视频开发，详说PCM音频重采样、PCM编码 chezabo6116 音视频 android pcm
直播伴音，两种数据能否合在一起？不能叠加在一起会有噪音合并以后再去编码推流直播的例子客户端播放器，可以开启多个播放器对于我们重采样很多时候就是为了统一格式，就是为了要合并这个流，去推送，他最终要转成同样pcm格式，合并码流可以通过ffmpegamix做混音，支持多音源合并做混音，再做二次编码振幅越大声音越大，观察喇叭开车音乐比较大手比较振振幅波形模拟时间一秒钟我采集多少数据可以1秒钟采集100万次
AAC解码算法原理稚肩音视频开发 aac 算法
关于更多音视频开发内容，请参考专栏音视频开发AAC（AdvancedAudioCoding）是一种高级音频编码标准，它是一种十分流行的音频压缩格式，通常用于存储和传输音频数据。AAC提供了高音质和高压缩效率，广泛应用于音乐、视频流媒体、广播等领域。AAC音频编码原理AAC使用一种先进的音频压缩算法，采用了分析/合成滤波器组合的技术。它主要包括以下步骤：分析滤波器组合（AnalysisFilterB
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

雷神simplest_ffmpeg_player解析（一）

写在前面

链接及参考资料

知识点

封装、编码格式

FFmpeg解码流程及数据结构

FFmpeg数据结构简介

1.simplest_ffmpeg_decoder.cpp

2.simplest_ffmpeg_decoder_pure

你可能感兴趣的:(音视频开发)