hdxbw-wq

FFmpeg库视频解码初探（软硬件解码）

ffmpeg

最近有工作需求用到ffmpeg，分享下。包括一些编码的基础知识，ffmpeg视频解码基础，还有GPU解码的部分。
属于科普工作，并不深入，记录了踩过的一些坑，希望有用
饮水思源：雷霄骅（雷神） &
代码部分参考自同事***（打码）代码，谢谢大神！

FFmpeg是一种功能强大的常用的视频/音频处理开源框架。支持几乎所有主流格式音视频的编解码，并能进行拼接等操作。

基础知识

视频格式：mp4, avi, mkv等，称之为封装格式，可以看成是一种容器。
视频流编码格式：h264, h265等，可以认为是一种压缩手段，减小文件体积。
音频流编码格式：MP3， AAC等，音频压缩方式。
视频像素数据：RGB、YUV（YUV420），实际上的图像编码格式，包括存储亮度和色彩数据。
封装格式和编码格式的关系：封装格式可以理解为存放编码后音视频信息的一种容器，不通的容器对支持的编码格式有所不同。

（侵删）
整体解码流程：

（侵删）
h264 h264参考博客:

（侵删）
- 主要由NALU结构组成
- I帧：帧内编码，适度压缩，类似jpg，大约6:1；P帧：前向预测帧，大约20:1；B帧：双向预测内插编码帧，大约50:1.
YUV420: Y(亮度)，U（色度），V（浓度），Y决定灰度，UV共同决定颜色
- 由于人类对与色彩的感知能力有限，所以通常会选择降低颜色信息密度，即对UV分量进行压缩
  
  （侵删）
- 基于YUV分量在存储方式上的不同，又衍生出YUV420SP,YUV420P等格式

（侵删）

ffmpeg基本组成

术语，这些概念跟上面讲的步骤其实是能找到对用关系的：
- ⾳音/视频流(stream) 一路路⾳音/视频称为⼀一路路流。ffmpeg⽀支持5种流：⾳音频（a），视频（v），字幕（s），数据（d）以及附件（t）。
- 容器对应上文提到的MP4，flv等，包括音频视频各个流。
- 编解码器 用于编解码各个流
- 解/复用 在容器中分离出流
- 过滤器 对音/视频进行特殊处理，比如加水印等
使用：FFmpeg可以通过它的工具，以命令行的形式使用，也支持利用接口进行编码调用。工具调用方式，不赘述，主要分享一下lib库的使用经历。

ffmpeg库的使用

关键结构体：
- AVIOContext（URLContext）: IO类型，主要存储协议类型及状态
- AVFormatContext:主要存储视频音频中包含的封装信息
- AVInputFormat:存储对应音视频使用的封装格式
- AVStream:存储一个视频（或音频）流相关的数据
- AVCodecContext: 每个AVStream对应一个AVCodeContext，存储对应流的解码信息
- AVCodec:每个AVCodeContext对应一个AVCodec，包含对应的解码器
- AVPacket:编码后的数据
- AVFrame:解码后的数据
  
  （侵删）
关键函数：
- av_register_all(新版本废弃):注册可用的编解码器，编解复用器等等
- avformat_alloc_context:分配一个AVFormatContext结构体
- avio_alloc_context：I/O上下文，可以用来定制IO操作
- av_open_input_file：以输入方式打开一个源文件，可以使用文件名作为参数，也可以使用定制I/O
- av_find_stream_info:获取文件流信息
- avcodec_find_decoder(ID)/avcodec_find_decoder_by_name：通过ID或者name查找解码器
- avcodec_open：使用一个给定的codec，初始化AVCodecContext用于解码操作
- av_read_frame：从源文件容器中读取一个packet数据包，并不是每一次读取都是有效的，当返回操作码>=0时，循环调用该函数进行读取，读出来的包需要进行解码操作
- avcodec_decode_video2（新版本中不推荐使用这个函数）：解码，返回frame
- av_send_packet：向解码器发送一个packet数据，并解码
- av_receive_frame：获取解码后的数据，receive并不是每次都可以成功的。
  
  （侵删）
定制I/O,ffmpeg直接在内存中读取视频文件
- 原因：对于网络传输过来的短视频base64文件，希望能够不经过磁盘IO，直接从内存读取。
- 1. 定制IO回调，自定义缓存，IO数据源
- 1. 通过av_probe_input_buffer函数探测当前视频格式信息
- 1. 将探测得到的fmt信息注册到AVFormatContext中，并打开源文件
- 1. 后续按常规方式使用ffmpeg接口即可
通过定制IO获得文件基本信息并确定视频流，解码器信息的代码示例

  struct  buffer_data {
    uint8_t *ptr_;
    size_t size_;
  };
typedef buffer_data BufferData;
	int VideoParseFFmpeg::read_packet(void *opaque, uint8_t *buf, int buf_size) {
	//opaque用户自定义指针
    struct buffer_data *bd = (struct buffer_data *) opaque;
    buf_size = FFMIN(buf_size, bd->size_);

    if (!buf_size)
      return AVERROR_EOF;

    memcpy(buf, bd->ptr_, buf_size);
    bd->ptr_ += buf_size;
    bd->size_ -= buf_size;

    return buf_size;
}
int LoadContent(const std::string &video_content){
  int ret = 0;
  //分配缓存空间
  video_size_ = video_content.size();
  avio_ctx_buffer_size_ = video_size_+AV_INPUT_BUFFER_PADDING_SIZE;
  avio_ctx_buffer_ = (uint8_t *)av_malloc(avio_ctx_buffer_size_);
  
  //bd为自定义结构，指向内存中的视频文件
  bd_.ptr_ = (uint8_t *)video_content.c_str();
  bd_.size_ = video_content.size();

  input_ctx_ = avformat_alloc_context();
  //自定义io
  avio_ctx_ = avio_alloc_context(avio_ctx_buffer_,
                                     avio_ctx_buffer_size_,
                                     0,
                                     &bd_,
                                     &read_packet, //自定义读取回调
                                     NULL,
                                     NULL);
  AVInputFormat *in_fmt{NULL};
//视频格式探测
  if((ret = av_probe_input_buffer(avio_ctx_, &in_fmt_, "", NULL, 0, 0)) < 0) {
        LOGGER_WARN(Log::GetLog(), "fail to prob input, err [{}]", AVERROR(ret));
    return -1;
  }
  //注册iocontext
  input_ctx_->pb = avio_ctx_;

  /* open the input file */
  if ((ret = avformat_open_input(&input_ctx_, "", in_fmt_, NULL)) != 0) {
        LOGGER_WARN(Log::GetLog(), "fail to open input, err [{}]", AVERROR(ret));
    return -1;
  }
//  if ((ret = avformat_open_input(&input_ctx_, "./smoke.mp4", NULL, NULL)) != 0) {
//    LOGGER_WARN(Log::GetLog(), "fail to open input, err [{}]", AVERROR(ret));
//    return -1;
//  }
//获取流信息
  if ((ret = avformat_find_stream_info(input_ctx_, NULL)) < 0) {
        LOGGER_WARN(Log::GetLog(), "fail to find input stream information, err[{}]", AVERROR(ret));
    return -1;
  }

  /* find the video stream information */
  //找到视频流，获取其对应的decoder
  if ((ret = av_find_best_stream(input_ctx_, AVMEDIA_TYPE_VIDEO, -1, -1, &decoder_, 0)) < 0) {
        LOGGER_WARN(Log::GetLog(), "fail to find a video stream from input, err[{}]", ret);
    return -1;
  }
  video_stream_idx_ = ret;
//获取decoder_context，把decoder注册进去
  if (!(decoder_ctx_ = avcodec_alloc_context3(decoder_))) {
        LOGGER_WARN(Log::GetLog(), "fail to alloc avcodec context");
    return -1;
  }
  video_stream_ = input_ctx_->streams[video_stream_idx_];
  
  //新版本不再将音视频流信息直接保存到streams[video_stream_idx_]中，而是存放在AVCodecParammeters中（涉及format，width，height，codec_type等），该函数提供了转换
  if ((ret = avcodec_parameters_to_context(decoder_ctx_, video_stream_->codecpar)) < 0){
        LOGGER_WARN(Log::GetLog(), "fail to convert parameters to context, err [{}]", ret);
    return -1;
  }
	//获取帧率等基本信息
  if(video_stream_->avg_frame_rate.den != 0) {
    fps_ = video_stream_->avg_frame_rate.num / video_stream_->avg_frame_rate.den;
  }
  video_length_sec_ = input_ctx_->duration/AV_TIME_BASE;
//YUV420p等
  pix_fmt_ = (AVPixelFormat)video_stream_->codecpar->format;
//硬解码部分
  if (hw_enable_ && is_hw_support_fmt(pix_fmt_)) {
      for (int i = 0;; i++)
      {
        const AVCodecHWConfig *config = avcodec_get_hw_config(decoder_, i);
        if (!config) {
            LOGGER_WARN(Log::GetLog(), "decoder [{}] does not support device type [{}]", decoder_->name, av_hwdevice_get_type_name(hw_type_));
          return -1;
        }
        if (config->methods & AV_CODEC_HW_CONFIG_METHOD_HW_DEVICE_CTX &&
          config->device_type == hw_type_) {
          hw_pix_fmt_ = config->pix_fmt;
          break;
        }
      }
    decoder_ctx_->pix_fmt = hw_pix_fmt_;

   	  if ((ret = hw_decoder_init(decoder_ctx_, hw_type_)) < 0) {
          LOGGER_WARN(Log::GetLog(), "fail to init hw decoder, err [{}]", ret);
      return -1;
      }
    }

  if ((ret = avcodec_open2(decoder_ctx_, decoder_, NULL)) < 0) {
        LOGGER_WARN(Log::GetLog(), "fail to open decodec, err[{}]", ret);
    return -1;
  }
  }

踩坑记录：
- 由于某些mp4文件的moov文件被放置在文件尾部，需要设置较大的缓存空间才能够顺利解析该文件，否则会在 av_find_best_stream时报找不到流信息。
- 自定义缓存buffer使用完毕后必须主动收回，否则会造成内存泄漏；该buffer在使用过程中，ffmpeg可能根据需要主动重新分配，导致buffer位置大小改变，此时该内存依旧需要外部手动释放，当然的不能使用源buffer指针。
视频解码

 while (true) {
      if ((av_read_frame(input_ctx_, &packet_)) < 0){
        break;
      }

      if (video_stream_idx_ == packet_.stream_index) {
        //std::shared_ptr p_frame = nullptr;
        decode_write(decoder_ctx_, &packet_, &buffer, frames);
        //frames.push_back(p_frame);
      }
    }

    /* flush the decoder */
    packet_.data = NULL;
    packet_.size = 0;
    //std::shared_ptr p_frame = nullptr;
    //cv::Mat *p_frame = NULL;
    decode_write(decoder_ctx_, &packet_, &buffer, frames);
    
    
    ====================================================
   
    //code block in decode_write
    ret = avcodec_send_packet(avctx, packet);
    if (ret < 0) {
        LOGGER_WARN(Log::GetLog(), "error during decodeing, err[{}]", AVERROR(ret));
    return ret;
  }

  while (true)
  {
    auto clear = [&frame, &sw_frame, this]{
      if (frame != NULL)
        av_frame_free(&frame);
      if (sw_frame != NULL)
        av_frame_free(&sw_frame);
      av_packet_unref(&packet_);
    };
    if (!(frame = av_frame_alloc()) || !(sw_frame = av_frame_alloc()))
    {
          LOGGER_WARN(Log::GetLog(), "cant alloc frame, err[{}]", AVERROR(ENOMEM));
      clear();
      return 0;
    }

    ret = avcodec_receive_frame(avctx, frame);
    if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) {
      clear();
      return 0;
    }
    else if (ret < 0) {
          LOGGER_WARN(Log::GetLog(), "error while decoding, err[{}]", AVERROR(ret));
      clear();
      return ret;
    }
    ...
}

视频解码的坑：
- read_frame/send_packet/receive_frame几个函数都有可能出现暂时的不成功（ret>0），可能是因为数据还没哟准备好，此时不能判断为错误，需要继续尝试。
- send_packet和receive_frame并不是一一对应的，大多数情况下解码较慢。所以可能当所有packet都已经发送，但是还有很多解码完的数据并没有通过receive_frame收到，此时需要通过一次flush连续将缓存中解码完的frame都取出来。
硬件解码：
- ffmpeg hw accelerate官网介绍
- 许多平台支持对部分视频处理的工作提供硬件加速能力，包括编码、解码、过滤等操作。通常我们会使用到一些API来进行编解码，这些API对不同硬件的支持各不相同，而ffmpeg对这些API的支持程度也有所不同。
- 通常我们使用NVENC/NVDEC（原名NVDIA）API，在NIVIDIA设备上进行编解码。
- 默认的ffmpeg并没有开启硬件解码的选项，需要我们重新编译ffmpeg库开启。
```
./configure --prefix=./ --bindir=bin/ffmpeg --incdir=include/ffmpeg --libdir=lib64/ffmpeg --disable-x86asm --arch=x86_64 --optflags='-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector-strong --param=ssp-buffer-size=4 -grecord-gcc-switches -m64 -mtune=generic' --extra-ldflags='-Wl,-z,relro' --enable-libx264 --enable-libx265 --enable-avfilter --enable-pthreads --enable-shared --enable-gpl --disable-debug --enable-cuda --enable-cuvid --enable-nvenc --enable-nonfree --enable-libnpp --extra-cflags=-I/usr/local/cuda-8.0/include --extra-ldflags=-L/usr/local/cuda-8.0/lib64
```
- 编译时要预先安装cuda库，然后使用--extra-cflags=-I/usr/local/cuda-8.0/include --extra-ldflags=-L/usr/local/cuda-8.0/lib64选项指定cuda库的版本，cuda8，cuda10在要注意区分
- 整个编译过程中可能会有各种库缺失的问题，查文档安装即可。
- ffmpeg编译选项
- 附一个编译错误解决
  - ERROR: cuda requested, but not all dependencies are satisfied: ffnvcodec
    参考解决
硬件解码代码块

//配置解码器
if (hw_enable_ && is_hw_support_fmt(pix_fmt_)) {
    for (int i = 0;; i++)
    {
    //获取支持该decoder的hw 配置型
      const AVCodecHWConfig *config = avcodec_get_hw_config(decoder_, i);
      if (!config) {
            LOGGER_WARN(Log::GetLog(), "decoder [{}] does not support device type [{}]", decoder_->name, av_hwdevice_get_type_name(hw_type_));
        return -1;
      }
      
      //AV_CODEC_HW_CONFIG_METHOD_HW_DEVICE_CTX使用hw_device_ctx API
      //hw_type_支持的硬件类型（cuda）
      if (config->methods & AV_CODEC_HW_CONFIG_METHOD_HW_DEVICE_CTX &&
          config->device_type == hw_type_) {
        hw_pix_fmt_ = config->pix_fmt;
        break;
      }
    }
    //decoder_ctx_->get_format = &get_hw_format;
    decoder_ctx_->pix_fmt = hw_pix_fmt_;

    if ((ret = hw_decoder_init(decoder_ctx_, hw_type_)) < 0) {
          LOGGER_WARN(Log::GetLog(), "fail to init hw decoder, err [{}]", ret);
      return -1;
    }
  }
  ret = avcodec_open2(decoder_ctx_, decoder_, NULL))
  ...
  
  int VideoParseFFmpeg::hw_decoder_init(AVCodecContext *ctx, const enum AVHWDeviceType type) 
  {
  int err = 0;
  if ((err = av_hwdevice_ctx_create(&hw_device_ctx_, type,NULL, NULL, 0)) < 0)
  {
        LOGGER_WARN(Log::GetLog(), "fail to create specified HW device, err[{}]", AVERROR(err));
    char buf[1024] = { 0 };
    av_strerror(err, buf, 1024);
    return err;
  }
  //注册硬解码上下文
  ctx->hw_device_ctx = av_buffer_ref(hw_device_ctx_);

  return err;
}

//解码
//receive_frame以后
if (frame->format == hw_pix_fmt_ &&
    hw_enable_ &&
    is_hw_support_fmt(pix_fmt_)) {
  /* retrieve data from GPU to CPU */
  if ((ret = av_hwframe_transfer_data(sw_frame, frame, 0)) < 0) {
    LOGGER_WARN(Log::GetLog(), "error transferring the data to system memory, err[{}]", ret);
    clear();
    return ret;
  }
  tmp_frame = sw_frame;
} else {
  tmp_frame = frame;
}
p_mat_out.push_back(avFrame2Mat(tmp_frame,
                                avctx,
                                (AVPixelFormat) tmp_frame->format));
clear();

硬解码踩坑：
- CUDA只支持YUV420和YUV444格式图片的解码，不支持YUV422 。此时程序会直接在avcodec_send_packet函数core出，cuda库显示错误。应该有相关接口可以直接判断，但是我还没找到。
- 对于不支持的格式，依旧需要使用软件解码。也可以提前转成420再解码，对信息损失敏感的话，还是用软解码好了。
- 在将不同格式转换到RGB时需要使用到 ffmpeg的sws_scale格式转换接口，注意部分格式命名新版ffmpeg已经不支持，需要在进一步转换，参考FFmpeg deprecated pixel format used，接口使用不复杂，不再赘述
格式转换接口的坑：
在ffmpeg 4.1.4库使用过程中发现，旧版本中
avpicture_get_size
avpicture_fill
两个函数已经被废弃，网上常见教程依然使用这两个函数，新版本使用这两个函数转换图片会失真
应该使用以下函数替代之：
av_image_get_buffer_size
av_image_fill_arrays

【Qt | 音视频学习路线（高薪路线 AI）】 Qt历险记 Qt 高级开发工程师 qt 音视频学习
Answer学习Qt音视频开发的学习路线可以分为以下几个阶段：1.基础知识准备C++编程基础：Qt主要使用C++，因此需要有扎实的C++编程基础。计算机图形学基础：了解基本的图形学概念，如图像处理、渲染等。音视频基础：了解音视频的基本概念，如编码、解码、格式等。2.学习Qt框架Qt基础：学习Qt的基本概念，如信号与槽、事件处理、界面布局等。QtWidgets：掌握QtWidgets模块，用于创建传
C++音视频学习路线高力士等十万人音视频开发 c++音视频学习
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。作者：姚冬链接：http://www.zhihu.com/question/31156766/answer/54645514来源：知乎我们先假设某人在音视频方面是零基础，也没学过任何数字信号处理相关知识，数学基础基本是高中水准，但是熟悉C/C++开发，至少熟悉某一个平台下的编译调试IDE。着重研究两个开源项目ffmpeg和webR
音视频学习(三)Shell脚本入门主音King
介绍Shell是用C语言编写的程序，用户使用Linux桥接。Shell是命令语言，又是程序设计语言。访问操作系统内核服务。Shell入门学习打开编辑器(vi/vim命令来创建文件)，新建test.sh，扩展名为sh。第一个Shell脚本./test.sh如果有权限问题，则赋予脚本执行权限chmod+x./test.sh#!是一个约定的标记，需要什么解释器来执行。echo向窗口输出文本变量定义变量时
音视频学习之路--NDK交叉编译解析蜗牛是不是牛
前言在说C/C++项目时必须要涉及编译问题，本章就来系统的说一下这些知识点，包括linux编译、常用linux指令、交叉编译等等。正文为了方便使用Linux环境，我这里直接在VMWare中安装了一个ubuntu，具体安装的步骤在网上非常多，安装完就是这样：由于好久不玩Linux系统了，这里我也是边搞边学习总结。编译原理这里主要说的是一个C/C++文件要经过下面4个步骤菜能变成可执行文件：预处理(p
音视频学习(一)JNI入门主音King
前言Android平台从一开始就支持C/C++了，Android支持JNI编程方式第三方应用完全可以通过JNI调用自己的C动态库，于是NDK(NativeDevelopKit)就诞生了。介绍JNI是Java程序设计语言功能最强的特征，允许Java类的某些方法原生实现(C/C++)。环境配置安装AS+NDK+CMAKE+LLDBAS：AndroidStudio4.0NDK：允许Android使用C和
音视频学习之路--C++ 蜗牛是不是牛
前言C和C++作为学习音视频技术首要具备的语言基础，所以十分必要学习和复习一下之前学习C++语言基础。这里IDE和环境配置在前面C语言复习的文章里已经说过了，还是使用CLion这个软件，话不多说，直接开始学习。正文C++作为一门用途更广、功能更齐全的语言，其知识深度很深，所以这里也就复习、学习一些基本知识点，等后续在实际项目中有遇到难点再进行补充。helloworld创建完一个C++项目，还是打印
Android 音视频学习基础--1.1 音视频基础知识神农笔记
基础数据通过上图可以了解播放器的原理，其实就是将一个压缩数据还原成一个基础数据的过程。那么什么时基础数据，基础数据就是硬件所能识别的数据，音频硬件所能识别的是pcm。下面分开将。视频yuvrgbyuv420rgb视频的基本数据，就是显示器能识别的数据，最早以前的是rgb通过串口，显示到显示器上比如最简单的用前三位表示红色中间三位表示绿色后面表示蓝色，这样就组成了基本的图案。后来又发明了yuv，YU
音视频学习之基础概念整理（rgb/yuv,pcm,采样频率，帧率，码率，i帧p帧b帧，dts/pts） yun6853992 音视频音视频
1：常用的视频压缩算法： MPEG2===>MPEG阵营 H264===>MPEG阵营 H265===>MPEG阵营 AVS===>中国阵营 VP8===>Google阵营 VP9===>Google阵营2：图像表示方法：2.1：RGB红绿蓝每个像素8bit色彩：256256256=16,777,216 一个1280*720的照片，用RGB存储,大小：1280×720*3=2.637
推荐几个堪称教科书级别的 Android 音视频入门项目 glumes
在直播中有提到几个不错的开源项目，这里再重点推荐一下：目前，市面上关于音视频学习的相关书籍并不多，而且即使看了书籍学了理论，最终还是要回归到代码上来。毕竟IT行业实践性要求高，强调动手能力，音视频这方面就更得多操作和探索了。推荐下面几个项目会各有侧重，分别涵盖了Android音视频录制API、OpenGL渲染和综合运用的例子。GPUImageGithub地址：https://github.com/
2021-12-29晨间日记 bbf75beb07a4
今天是什么日子起床：04:30起床，看了2小时书，拍了一条视频，写下一篇书中重要笔记，这会躺在床上回笼觉顺便复盘一下书中的点就寝：11点睡觉天气：阴心情：很好纪念日：任务清单昨日完成的任务，最重要的三件事：更新小红书笔记一篇，抖音视频一条。给小孩准备了一周的辅食肉丸还有面点改进：复盘笔记完成的很敷衍习惯养成：早上4；30起床；读书后笔记；中途回想复盘周目标·完成进度日更小红书笔记/抖音视频学习·信
WebRTC实现1对1音视频通信原理十年编程老舅音视频开发 webrtc 音视频 C++音视频视频编解码音视频通话 srs 流媒体服务器
什么是WebRTC？WebRTC（WebReal-TimeCommunication）是Google于2010以6829万美元从GlobalIPSolutions公司购买，并于2024年01月10日将其开源，旨在建立一个互联网浏览器间的实时通信的平台，让WebRTC技术成为H5标准之一。我们看官网（https://webrtc.org）的介绍本文福利，免费领取C++音视频学习资料包+学习路线大纲、
RTMP vs SRT：延迟与最大带宽的比较十年编程老舅音视频开发 ffmpeg RTSP RTMP 音视频开发音视频 SRT
引言文来自Haivision的白皮书，比较了RTMP和SRT两种流媒体协议的优缺点，并通过实验测试了两种协议在延迟和最大带宽两方面的表现。本文福利，免费领取C++音视频学习资料包+学习路线大纲、技术视频/代码，内容包括（音视频开发，面试题，FFmpeg，webRTC，rtmp，hls，rtsp，ffplay，编解码，推拉流，srs）↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓介绍对于希望在IP上
android 实时流媒体实时流媒体播放十年编程老舅音视频开发 android 音视频开发音视频流媒体服务器实时流媒体
场景描述将实时流采集终端的视频数据实时推送到另外一个（多个）播放终端，完成远距离实时视频播放的功能。典型场景：（1）远程查看监控摄像头。选择指定摄像头，将该摄像头采集到的实时数据推送到指定播放终端，供值班（监控中心）人员查看。包括实时视频上墙，推送到指定大屏幕上；（2）直播系统。用户在PC上安装推流工具，抓取屏幕（麦克风）实时数据，推送给观看直播的观众。本文福利，免费领取C++音视频学习资料包+学
2021-11-10晨间日记沐溪呀
今天是什么日子起床：8:00就寝：预计23:00天气：晴心情：很好，感觉一切依旧美好如初纪念日：无（我们家现在只有小一一宝宝配拥有仪式感和纪念日……）任务清单昨日完成的任务，最重要的三件事：1.按时下班2.当日所有学习完成3.完成本学期雨露行动方案、计划、九月份帮扶记录表和简报改进：早睡时间习惯养成：阅读、日更、普通话打卡、学习强国、音视频学习周目标·完成进度把APP里该刷的课全部刷完学习·信息·
音视频学习(二十二)——rtmp发流(tcp方式) 却道天凉_好个秋音视频学习音视频学习 tcp/ip rtmp
前言本文主要介绍自研的RtmpStreamSender.dll，rtmp库提供接口接收裸流数据，支持将裸流数据封装为flv格式并通过rtmp协议发流。关于rtmp协议基础介绍可查看：https://blog.csdn.net/www_dong/article/details/131026072关于rtmp收流介绍可查看：https://blog.csdn.net/www_dong/article/
音视频学习笔记廖燊
前言自己都是对直播这个模块很好奇，觉得是很深的，一直没有学习的机会，没有再项目中运用到，现在根据自己网上看到的文章推流：指的是把采集阶段封包好的内容，传输到服务器的过程。拉流：指服务器已有直播内容，用指定地址进行拉取的过程。主流的推送协议RTMP：视频必须是H264编码，音频必须是AAC或MP3编码，且多以flv格式封包。优点：对CDN支持良好，实现难度较低缺点：不支持浏览器HLS：基于HTTP的
mp4文件格式解析音视频开发老马流媒体服务器 Android音视频开发音视频开发音视频实时音视频视频编解码语音识别计算机视觉
目录概述mp4文件基本信息封装格式重要概念重要box介绍其他box介绍实用技术开源软件参考【文末扫马进君羊，领取音视频学习资料】[1]ISO/IEC14496-12:2015[2]wikipedia/MPEG-4[3]wikipedia/ISObasemediafileformat[4]wikipedia/MPEG-4Part14[5]Tocy/多媒体文件格式之MP4[6]PhilCluff/Wh
音视频学习(二十一)——rtmp收流(tcp方式) 却道天凉_好个秋音视频学习音视频学习 tcp/ip rtmp
前言本文主要介绍rtmp协议收流流程，在linux上搭建rtmp服务器，通过自研的rtmp收流库发起取流请求，使用ffmpeg+qt实现视频流的解码与播放。关于rtmp协议基础介绍可查看：https://blog.csdn.net/www_dong/article/details/131026072环境搭建nginx-rtmp-module下载#下载地址,下载zip包即可https://githu
flv.js解析与使用程序员老舅音视频开发进阶实时音视频视频编解码音视频 webrtc linux
简介Flv.js是HTML5Flash视频（FLV）播放器，纯原生JavaScript开发，没有用到Flash。由bilibili网站开源。它的工作原理是将FLV文件流转码复用成ISOBMFF（MP4碎片）片段，然后通过MediaSourceExtensions将MP4片段喂进浏览器。本文福利，免费领取C++音视频学习资料包、技术视频，内容包括（音视频开发，面试题，FFmpeg，webRTC，rt
音视频学习（二十）——rtsp收流(udp方式) 却道天凉_好个秋音视频学习音视频学习 udp c++
前言本文主要介绍通过udp方式实现rtsp拉流。流程图流程说明：相较于tcp方式“信令+数据”复用同一连接拉流，udp方式拉流“信令+数据”采用不同的连接，信令传输采用tcp，流数据传输采用udp；客户端向服务端（设备等）发起tcp请求，用于后续信令交互；tcp连接成功后，开始rtsp信令交互（describe、setup、play等），rtsp链路需要保活；客户端选择两个未用的端口创建udp链路
音视频学习从零到整--视频解码思路 _小迷糊_997
作者：CC老师_HelloCoder原文地址：https://www.jianshu.com/p/c99ce47f4280音视频编解码处理流程,这个问题经常是面试官抛砖引玉的问题.他们渴望能从这个流程中看到你的宏观思考和微观技术处理.采集编码解码渲染一.解码的思路:解析数据(NALUUnit)I/P/B...初始化解码器将解析后的H264NALUUnit输入解码器解码完成回调,输出解码数据解码数据
音视频学习之路--一些基础概念蜗牛是不是牛
前言本章还是继续了解一些音视频基础的名词等，因为这方面内容非常多，所以还是多阅读、多复习。正文视频编码根据之前的播放器原理，视频编码也就是通过特定的压缩技术，将某个视频格式文件转换为另一种视频格式文件，这个编码技术主要分为2类，一类是H.264、H.265等，还有一种是MPEG。MPEG系列：MPEG其实就是MovingPictureExpertsGroup，即运动图像专家组。它在视频编码主要有M
音视频学习之路--JNI全面解析蜗牛是不是牛
前言复习完C和C++的基础就可以来进行NDK相关的开发了，也就是又回到Java，但是用Java来调用C/C++。所以本章先仔细学习一下JNI，在很久之前我做过有关JNI的开发，但是比较少，没有深入过，所以本篇文章就先介绍一下JNI。在文章正式开始之前，先给大家分享一个B站上非常不错的视频教程，该视频教程从基础知识讲解再到直播推流实战，非常全面讲的也很细致，大家可以去看看。音视频开发全系列教程：ht
【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件（下） glumes
音视频学习入门技术文章连载：技术开发故事会连载【音视频连载-001】基础学习篇-SDL介绍以及工程配置【音视频连载-002】基础学习篇-SDL创建窗口并显示颜色【音视频连载-003】基础学习篇-SDL消息循环和事件响应【音视频连载-004】基础学习篇-SDL加载图片并显示【音视频连载-005】基础学习篇-SDL加载YUV文件并显示【音视频连载-006】基础学习篇-SDL播放YUV视频文件【音视频连
音视频学习之路--Shell脚本基础蜗牛是不是牛
前言脚本语言非常重要，尤其是在编译的时候，因为之前都是搞的Android应用层开发，很少搞shell脚本这种，顶多就是gradle脚本的编写，这方面比较薄弱，所以这里重点学习一下Shell脚本。正文首先Shell是一个程序，它是用C语言编写的，通过Shell可以更好的使用Linux。HelloWorld还是从HelloWorld开始，vim创建一个test.sh，在里面写入：然后保存，再给这个sh
Android音视频学习系列(八) — 基于Nginx搭建(rtmp、http)直播服务器金戈鐡馬 Android Nginx rtmp http 服务器搭建流媒体服务
系列文章Android音视频学习系列(一)—JNI从入门到精通Android音视频学习系列(二)—交叉编译动态库、静态库的入门Android音视频学习系列(三)—Shell脚本入门Android音视频学习系列(四)—一键编译32/64位FFmpeg4.2.2Android音视频学习系列(五)—掌握音频基础知识并使用AudioTrack、OpenSLES渲染PCM数据Android音视频学习系列(六
音视频学习(十九)——rtsp收流(tcp方式) 却道天凉_好个秋音视频学习音视频 tcp/ip rtsp
前言本文主要介绍以tcp方式实现rtsp拉流。流程图流程说明:客户端发起tcp请求，如向真实相机设备请求，端口一般默认554；tcp连接成功，客户端与服务端开始rtsp信令交互；客户端收到play命令响应后，开启线程等待接收数据，同时开启定时器，定时向服务端发送命令用于心跳保活；服务端向客户端发送音视频数据；客户端接收rtp数据并进行解复用；设计发送tcp请求创建socketconnect设置非阻
音视频学习（十四）——rtsp详解却道天凉_好个秋音视频学习音视频 rtsp
概念rtsp（RealTimeStreamingProtocol，RFC2326），实时流传输协议，是TCP/IP协议体系中的一个应用层协议。该协议主要规定了一对多应用程序如何有效地通过IP网络传送多媒体数据。RTSP体系结位于RTP和RTCP之上（RTCP用于控制传输，RTP用于数据传输），使用TCP或UDP完成数据传输！基本流程OPTIONSC—>S：客户端向服务器端发现OPTIONS，请求可
音视频学习笔记（雷神）—技术解析小小小小邱视频传输音视频学习网络协议
音视频技术解析封装技术+视频压缩编解码+音频压缩编解码这是技术层流媒体传输协议这是网络层视频播放器解析解协议从视频播放器的角度做解析，拿到传输而来的视频数据后，首先要解协议（传输协议）自然的本地视频经过硬盘传输数据自然没有解协议的过程解协议的作用，就是将流媒体协议的数据，解析为标准的相应的封装格式数据。视音频在网络上传播的时候，常常采用各种流媒体协议，例如HTTP，RTMP，或是MMS等等。这些协
ffmpeg播放器实战（播放器流程）十年编程老舅音视频开发 ffmpeg 音视频开发音视频 C++音视频开发音视频编解码播放器开发
1.流程图1.main窗口创建程序窗口程序窗口构造函数执行下面内容2.开启播放3.开启解码4.开启渲染5.反馈给ui本文福利，免费领取C++音视频学习资料包+学习路线大纲、技术视频/代码，内容包括（音视频开发，面试题，FFmpeg，webRTC，rtmp，hls，rtsp，ffplay，编解码，推拉流，srs）↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

FFmpeg库视频解码初探（软硬件解码）

ffmpeg

基础知识

ffmpeg基本组成

ffmpeg库的使用

你可能感兴趣的:(音视频学习)