Jian_Cao

VVC/H.266代码阅读（VTM8.0）(二. non-VCLU解码)

本文是本系列的第二篇博客，内容是分析non-VCLU解码的相关代码。
该系列相关博客为：
VVC/H.266代码阅读（VTM8.0）(一. NALU提取)
VVC/H.266代码阅读（VTM8.0）(二. non-VCLU解码)
VVC/H.266代码阅读（VTM8.0）(三. Slice到CTU的处理 )
VVC/H.266代码阅读（VTM8.0）(四. CU划分 )

VVC/H.266常见资源为：
VVC/H.266常见资源整理（提案地址、代码、资料等）

注:

考虑到从解码端分析代码，一是更加简单（解码流程无需编码工具和编码参数的择优），二是可以配合Draft文本更好地理解视频编解码的流程（解码端也都包含预测、量化、环路滤波、熵解码等流程），所以本系列从解码端入手分析VVC解码大致流程。等到解码端代码分析完后，再从编码端深入分析。

本文分析的bin文件是利用VTM8.0的编码器，以All Intra配置（IBC 打开）编码100帧得到的二进制码流（TemporalSubsampleRatio: 8，实际编码 ⌈100 / 8⌉ = 13帧）。

解码用最简单的：-b str.bin -o dec.yuv

在上一篇博客中，我分析了解码端将收到的二进制码流bin文件提取成一个个NALU的过程。上一篇博客的最后写道 “ 调用DecLib::decode()进行当前NALU的核心解码流程。该函数内，会根据当前NALU的类型进行针对性地解码。” 本篇博客就是对该函数的部分展开，即针对non-VCLU解码进行分析，如SPS、PPS等non-VCLU。

1. 什么是non-VCLU？non-VCLU一般包含什么内容？
(1) 万帅老师在书籍《新一代高效视频编码H.265HEVC原理、标准与实现》的第三章51页有过以下介绍：

NAL单元根据是否装载视频编码数据被分为VCLU和non-VCLU。
非编码数据的参数集作为non-VCLU进行传输，为传递关键数据提供了高鲁棒机制。
参数集的独立使得其可以提前发送，也可以在需要增加新参数集的时候再发送，可以被多次重发或者采用特殊技术加以保护，甚至采用带外（Out-of-band）发送的方式。

(2) 也就是说，non-VCLU内部一般装载了VPS、SPS、PPS等参数信息。这部分数据非常重要，所以优先级也比较高，draft里有过以下要求：

The value of TemporalId for non-VCL NAL units is constrained as follows:
// non-VCLU的时域ID要求如下（0为最高级，增加优先级下降）：
– If nal_unit_type is equal to DCI_NUT, VPS_NUT, or SPS_NUT, TemporalId shall be equal to 0 and the TemporalId of the AU containing the NAL unit shall be equal to 0.
// DCI、VPS、PPS的时域ID应该设为0。
– Otherwise, if nal_unit_type is equal to PH_NUT, TemporalId shall be equal to the TemporalId of the PU containing the NAL unit.
– Otherwise, if nal_unit_type is equal to EOS_NUT or EOB_NUT, TemporalId shall be equal to 0.
– Otherwise, if nal_unit_type is equal to AUD_NUT, FD_NUT, PREFIX_SEI_NUT, or SUFFIX_SEI_NUT, TemporalId shall be equal to the TemporalId of the AU containing the NAL unit.
– Otherwise, when nal_unit_type is equal to PPS_NUT, PREFIX_APS_NUT, or SUFFIX_APS_NUT, TemporalId shall be greater than or equal to the TemporalId of the PU containing the NAL unit.

注：关于代码和草案的下载地址，可以参考：
VVC/H.266常见资源整理（提案地址、代码、资料等）

我们再看看draft（我参考的是JVET-Q2001-vE）里面non-VCLU的大致内容，可以参考7.4.2.2 Table 5 – NAL unit type codes and NAL unit type classes。

2. non-VCLU解码代码分析
(1) 细节回顾：

和上一篇博客VVC/H.266代码阅读（VTM8.0）(一.NALU提取)使用的bin文件相同，从00 00 00 01开始到DC 0D 56 81是一个NALU的内容。
在提取完该NALU的数据后，调用read() 、readNalUnitHeader()函数分析了该NALU的NalUnitHeader。该NALU中，除去前缀和起始码，前两个字节为0x00 和 0x79 (01111 001)，所以nal_unit_type为 01111 = 15 （SPS_NUT），时域ID为0最高级。该部分相关代码在上一篇博客中分析过。

(2) 现在从DecLib::decode()分析。
① 首先，根据nal_unit_type调用不同的函数针对性地解码。以该NALU为例，nalu是SPS，调用xDecodeSPS( nalu );

switch (nalu.m_nalUnitType)
  {
    case NAL_UNIT_VPS:
      xDecodeVPS( nalu );
      return false;

    case NAL_UNIT_DPS:
      xDecodeDPS( nalu );
      return false;

    case NAL_UNIT_SPS:
      xDecodeSPS( nalu );
      return false;

    case NAL_UNIT_PPS:
      xDecodePPS( nalu );
      return false;

    case NAL_UNIT_PH:
      xDecodePicHeader(nalu);
      return !m_bFirstSliceInPicture;

    case NAL_UNIT_PREFIX_APS:
    case NAL_UNIT_SUFFIX_APS:
      xDecodeAPS(nalu);
      return false;

    case NAL_UNIT_PREFIX_SEI:
      m_prefixSEINALUs.push_back(new InputNALUnit(nalu));
      return false;

    case NAL_UNIT_SUFFIX_SEI:
      if (m_pcPic)
      {
        m_seiReader.parseSEImessage( &(nalu.getBitstream()), m_pcPic->SEIs, nalu.m_nalUnitType, nalu.m_temporalId, m_parameterSetManager.getActiveSPS(), m_HRD, m_pDecodedSEIOutputStream );
      }
      else
      {
        msg( NOTICE, "Note: received suffix SEI but no picture currently active.\n");
      }
      return false;

    case NAL_UNIT_CODED_SLICE_TRAIL:
    case NAL_UNIT_CODED_SLICE_STSA:
    case NAL_UNIT_CODED_SLICE_IDR_W_RADL:
    case NAL_UNIT_CODED_SLICE_IDR_N_LP:
    case NAL_UNIT_CODED_SLICE_CRA:
    case NAL_UNIT_CODED_SLICE_GDR:
    case NAL_UNIT_CODED_SLICE_RADL:
    case NAL_UNIT_CODED_SLICE_RASL:
      ret = xDecodeSlice(nalu, iSkipFrame, iPOCLastDisplay);
      return ret;

    case NAL_UNIT_EOS:
      m_associatedIRAPType = NAL_UNIT_INVALID;
      m_pocCRA = 0;
      m_pocRandomAccess = MAX_INT;
      m_prevLayerID = MAX_INT;
      m_prevPOC = MAX_INT;
      m_prevSliceSkipped = false;
      m_skippedPOC = 0;
      return false;

    case NAL_UNIT_ACCESS_UNIT_DELIMITER:
      {
        AUDReader audReader;
        uint32_t picType;
        audReader.parseAccessUnitDelimiter(&(nalu.getBitstream()),picType);
        return !m_bFirstSliceInPicture;
      }

    case NAL_UNIT_EOB:
      return false;

    case NAL_UNIT_RESERVED_IRAP_VCL_11:
    case NAL_UNIT_RESERVED_IRAP_VCL_12:
      msg( NOTICE, "Note: found reserved VCL NAL unit.\n");
      xParsePrefixSEIsForUnknownVCLNal();
      return false;
    case NAL_UNIT_RESERVED_VCL_4:
    case NAL_UNIT_RESERVED_VCL_5:
    case NAL_UNIT_RESERVED_VCL_6:
    case NAL_UNIT_RESERVED_NVCL_26:
    case NAL_UNIT_RESERVED_NVCL_27:
      msg( NOTICE, "Note: found reserved NAL unit.\n");
      return false;
    case NAL_UNIT_UNSPECIFIED_28:
    case NAL_UNIT_UNSPECIFIED_29:
    case NAL_UNIT_UNSPECIFIED_30:
    case NAL_UNIT_UNSPECIFIED_31:
      msg( NOTICE, "Note: found unspecified NAL unit.\n");
      return false;
    default:
      THROW( "Invalid NAL unit type" );
      break;
  }

② 进入DecLib::xDecodeSPS()。

void DecLib::xDecodeSPS( InputNALUnit& nalu )
{
  SPS* sps = new SPS();
  //创建SPS
  m_HLSReader.setBitstream( &nalu.getBitstream() );
  //将nalu内读取出的码流信息放入m_HLSReader中，HLS是高层语法的缩写
  m_HLSReader.parseSPS( sps );
  //解析SPS
  m_parameterSetManager.storeSPS( sps, nalu.getBitstream().getFifo() );
  //m_parameterSetManager中存储相关的参数集
}

此时，按照draft 7.3.2.3 和 7.4.3.3相关的章节进行SPS的解码。（仅截取部分）

void HLSyntaxReader::parseSPS(SPS* pcSPS)
{
  uint32_t  uiCode;
  READ_CODE(4,  uiCode, "sps_decoding_parameter_set_id");    pcSPS->setDecodingParameterSetId( uiCode );
  READ_CODE(4,  uiCode, "sps_video_parameter_set_id" );      pcSPS->setVPSId( uiCode );
  READ_CODE(3, uiCode, "sps_max_sub_layers_minus1");         pcSPS->setMaxTLayers   (uiCode + 1);
  READ_CODE(4, uiCode, "sps_reserved_zero_4bits");
  READ_FLAG(uiCode, "sps_ptl_dpb_hrd_params_present_flag");  pcSPS->setPtlDpbHrdParamsPresentFlag(uiCode);
  ……

其中，READ_CODE()核心调用了InputBitstream::read() 函数，是连续读取无符号n位。READ_UVLC()是0阶指数哥伦布编码。下面详细分析二者代码。

u(n): unsigned integer using n bits.
ue(v): unsigned integer 0-th order Exp-Golomb-coded syntax element with the left bit first.

void InputBitstream::read (uint32_t uiNumberOfBits, uint32_t& ruiBits)
{
  //uiNumberOfBits就是读n位，ruiBits返回参数值。
  m_numBitsRead += uiNumberOfBits;
  //m_numBitsRead 记录了读过bits的位数。
  //比如说，如果用u(4)解析SPS的第一个语法sps_seq_parameter_set_id。之前读取NALU header使用了2个Bytes = 16bits,所以解析完该4个bits后，该值会变成20。
  uint32_t retval = 0;
  if (uiNumberOfBits <= m_num_held_bits)
  {
  //m_num_held_bits 记录了一个完整的Byte剩下未读完的位数。
  //比如说，之前只读了1个bit，所以m_num_held_bits = 8 - 1 = 7，如果现在要读的位数 < 7(m_num_held_bits), 直接位操作读取出来即可。
  //下面X表示已读位，VH是未读位，V是需要读的位数
  //n=1, len(H)=7:   -X(已读位) VHH HHHH, shift_down=6, mask=0xfe=11111110
  //n=3, len(H)=7:   -X(已读位) VVV HHHH, shift_down=4, mask=0xf8=11111000
    retval = m_held_bits >> (m_num_held_bits - uiNumberOfBits);
    //m_held_bits表示了该Byte的数据。
    //右移m_num_held_bits - uiNumberOfBits，排除后面不用读的bits
    retval &= ~(0xff << uiNumberOfBits);
    //利用mask读取需要的数据
    m_num_held_bits -= uiNumberOfBits;
    //m_num_held_bits 记录了一个完整的Byte剩下未读完的位数。进行更新。
    ruiBits = retval;
    return;
  }

  //m_num_held_bits 记录了一个完整的Byte剩下未读完的位数。能进行下面步骤，说明超过了目前的Byte范围，目前Byte留下的有效未读bits需要全部读取。
  //下面X表示已读位，V是该Byte需要读的位数, H是后续Bytes需要读的bits
  //n=5, len(H)=3: ---- -XXXXX(已读位) VVV HH, mask=0x07, shift_up=5-3=2,
  //n=9, len(H)=3: ---- -XXXXX(已读位) VVV HHHHHH, mask=0x07, shift_up=9-3=6
  uiNumberOfBits -= m_num_held_bits;
  //减去剩下的bits, uiNumberOfBits变成后续Bytes需要读的bits
  retval = m_held_bits & ~(0xff << m_num_held_bits);
  //利用mask读取需要的数据
  retval <<= uiNumberOfBits;
  //左移uiNumberOfBits，方便和后面bits进行拼接

  /* number of whole bytes that need to be loaded to form retval */
  /* n=32, len(H)=0, load 4bytes, shift_down=0
   * n=32, len(H)=1, load 4bytes, shift_down=1
   * n=31, len(H)=1, load 4bytes, shift_down=1+1
   * n=8,  len(H)=0, load 1byte,  shift_down=0
   * n=8,  len(H)=3, load 1byte,  shift_down=3
   * n=5,  len(H)=1, load 1byte,  shift_down=1+3
   */
  uint32_t aligned_word = 0;
  uint32_t num_bytes_to_load = (uiNumberOfBits - 1) >> 3;
  //num_bytes_to_load 看看还需要后续几个Bytes进行拼接读取
  
  switch (num_bytes_to_load)
  {
  //根据num_bytes_to_load，从码流里读取出来对应数量的Bytes
  case 3: aligned_word  = m_fifo[m_fifo_idx++] << 24;
  case 2: aligned_word |= m_fifo[m_fifo_idx++] << 16;
  case 1: aligned_word |= m_fifo[m_fifo_idx++] <<  8;
  case 0: aligned_word |= m_fifo[m_fifo_idx++];
  }

  uint32_t next_num_held_bits = (32 - uiNumberOfBits) % 8;
  //next_num_held_bits是读取完后续Bytes后，最后一个Byte还剩几个未读的bits
  retval |= aligned_word >> next_num_held_bits;
  //右移next_num_held_bits，就是读取到的后续Bytes的相关数据，进行拼接
  
  m_num_held_bits = next_num_held_bits;
  //m_num_held_bits 记录了一个完整的Byte剩下未读完的位数。也就是next_num_held_bits。
  m_held_bits = aligned_word;
  //截断aligned_word的最后一个Byte，赋给m_held_bits 

  ruiBits = retval;
}

READ_UVLC()是0阶指数哥伦布编码，流程很简单，简单的处理前缀后缀即可。
万帅老师在书籍《新一代高效视频编码H.265HEVC原理、标准与实现》的第八章236页有过以下介绍：

void VLCReader::xReadUvlc( uint32_t& ruiVal, const char *pSymbolName)
{
  uint32_t uiVal = 0;
  uint32_t uiCode = 0;
  uint32_t uiLength;
  m_pcBitstream->read( 1, uiCode );
  //读第一个bit
  if( 0 == uiCode )
  {
    uiLength = 0;
	
    while( ! ( uiCode & 1 ))
    {
      m_pcBitstream->read( 1, uiCode );
      uiLength++;
      //读取前缀连续0的个数，如果有0，一直往下读
    }

    m_pcBitstream->read( uiLength, uiVal );
    //读取后缀，此处后缀bits数目就是前缀的连续0的个数uiLength。

    uiVal += (1 << uiLength)-1;
    //根据公式，后缀 + 前缀 - 1
  }

  ruiVal = uiVal;
}

从上可知，SPS语法主要的编码方法u(n)和ue(v)已经分析完毕。
VPS、PPS等其他non-VCLU的解码原理基本相同，此处不再赘述。
在下一篇博客中，会展开分析VCLU中CU划分的相关代码，敬请期待。

端到端神经网络视频编解码器介绍码流怪侠音视频基础深度学习-PyTorch 神经网络视频编解码人工智能 github DCVC 端到端神经网路音视频
一、技术演进：从模块优化到全局智能的范式跃迁传统编解码器的效率天花板（1990-2017）架构局限：H.264/HEVC依赖手工设计的运动估计、DCT变换、熵编码模块，各模块独立优化导致全局效率损失。高分辨率瓶颈：4K/8K视频普及后，码率与画质矛盾激化，HEVC在VR场景下码率仍需>20Mbps才能保持无伪影画质。端到端神经编解码的爆发期（2017-2024）2017奠基年：Ballé团队提出超
python视频工具包 ffmpeg 使用示例 pythonffmpeg
1.简介FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。2.ffmpeg的常用方法将某文件下所有ts文件按顺序合并，转换成MP4格式存储：importffmpegdeftest2():ts_folder='path/ts_files/ceshi/'output_mp4="pa
ffmpeg的常见使用 pythonffmpeg
1.简介FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。2.ffmpeg的常用方法将某文件下所有ts文件按顺序合并，转换成MP4格式存储：importffmpegdeftest2():ts_folder='path/ts_files/ceshi/'output_mp4="pa
HTML5里video标签支持哪些格式的视频文件 Lucky_chengzi
video标签支持的视频格式：Ogg、MPEG4、WebMMP4=MPEG4文件使用H264视频编解码器和AAC音频编解码器WebM=WebM文件使用VP8视频编解码器和Vorbis音频编解码器Ogg=Ogg文件使用Theora视频编解码器和Vorbis音频编解码器
嵌入式视频编解码入门保姆级教程大模型大数据攻城狮视频编解码 cocos2d 游戏引擎 b帧 p帧 H.264 h.265
目录章节1：视频编解码的“榨汁机”是怎么回事？1.1为什么需要视频编解码？1.2视频编解码的核心原理1.3嵌入式设备上的挑战章节2：认识视频数据的基本“零件”2.1像素、帧和分辨率2.2帧的类型：I、P、B帧2.3码流和容器章节3：H.264编解码的“魔法书”3.1H.264的核心技术3.2嵌入式设备上的H.2643.3动手实践：用FFmpeg编码H.264视频3.4调试小技巧章节4：帧间预测与运
WebRTC基础介绍
WebRTC全称为：WebReal-TimeCommunication。它是为了解决Web端无法捕获音视频的能力，并且提供了peer-to-peer（就是浏览器间）的视频交互。WebRTC汇集了先进的实时通信技术，包括：先进的音视频编解码器（Opus和VP8/9），强制加密协议（SRTP和DTLS）和网络地址转换器（ICE＆STUN）。根据最初的定义，WebRTC被指定为P2P（peer-to-p
WebRTC H.265 浏览器支持情况（2025年7月2日） illuspas h.265 webrtc
WebRTCH.265浏览器支持情况简介WebRTC技术在现代实时通信中扮演着重要角色，而H.265（HEVC）作为高效的视频编解码器，能够显著降低带宽需求。以下是当前各平台浏览器对WebRTCH.265支持情况的总结：支持情况总表操作系统浏览器内核版本支持状态WindowsChrome138.0.7204.50✅支持Edge138.0.3351.55❌不支持Firefox140.0.2❌不支持3
高性能AI核心板Z3588CV1：基于瑞芯微RK3588的旗舰级解决方案——8K视觉处理 · 6TOPS NPU算力 · 多场景边缘计算九鼎创展科技嵌入式硬件边缘计算 arm开发 android
RK3588处理器技术细节计算单元CPU：4×[email protected]（大核集群）4×[email protected]（能效集群）支持ARMDynamIQ混合架构，可实现任务智能调度GPU：Mali-G610MP4，支持OpenGLES3.2/2.0/1.1、Vulkan1.28KVPU视频编解码：H.265/H.264/AV1格式，支持60fps实时处理NPU：6TOPS算力（INT
瑞芯微RK3288、RK3399、RK3568、RK3368芯片性能介绍与对比分析不对法硬件编程嵌入式硬件 linux 单片机 mcu
目录标题RK3568RK3288RK3368RK3399RK3568是瑞芯微2020年底最新发布的一款定位中高端的通用型SoC，采用22nm工艺制程，支持Android11和Linux操作系统（Linux+qt/Fedora/Debian/Ubuntu），主要面向行业应用市场，如视频会议、智慧安防、商业显示、边缘计算、物联网网关、视频编解码等领域。集成4核arm架构A55处理器和MaliG522E
WebRTC（七）：媒体能力协商却道天凉_好个秋 WebRTC webrtc
目的在WebRTC中，每个浏览器或终端支持的音视频编解码器、分辨率、码率、帧率等可能不同。媒体能力协商的目的就是：确保双方能“听得懂”对方发的媒体流；明确谁发送、谁接收、怎么发送；保障连接的互操作性和兼容性。P2P的基本流程参与角色角色说明peerA发起连接的端（通常是主叫）peerB接收连接的端（通常是被叫）signal信令服务器，用于中转SDP和ICE信息，但不参与媒体传输stun/turnS
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
GPU 服务器：高性能计算的强大引擎海域云李潮海服务器运维云计算
一、GPU服务器概述GPU服务器是一种专门为处理复杂计算任务而设计的服务器。它配备了高性能的图形处理单元（GPU），能够在深度学习、科学计算、视频编解码等多个领域发挥强大的作用。据统计，在深度学习领域，GPU服务器能够将模型训练时间缩短数倍甚至数十倍。在科学计算方面，它可以快速处理大规模数据，例如在气象预测中，能够加速复杂的计算过程，提高预测的准确性。同时，GPU服务器具有出色的稳定性，可长时间连
FFmpeg编译安装（Mac、Linux）特巨大聪明 ffmpeg ffmpeg macos linux
FFmpeg简介FFmpeg是一款常用的多媒体框架，支持音视频编解码、格式转换等功能。安装FFmpeg可以通过多种不同的方式进行，包括使用包管理器、源代码安装以及使用预编译二进制文件等。不同方式安装FFmpeg的区别：包管理器：使用包管理器安装FFmpeg最为简便，通常只需要执行几条命令即可完成安装。包管理器会自动处理依赖关系，并为用户管理软件包的更新。然而，这种方法可能不能提供最新的FFmpeg
FFmpeg中视频 Filters 使用文档介绍码流怪侠 ffmpeg 音视频 Filters 深度学习 vmaf 滤镜 FFmpeg
FFmpeg中Filters简介FFmpeg是一个强大的多媒体框架，它支持多种音视频编解码器、容器格式、协议等。其中，FFmpeg的Filters（过滤器）是FFmpeg中一个非常强大的功能，它允许用户对音视频数据进行各种处理，包括但不限于视频滤镜、音频效果、视频转换等。到目前为止，FFmpeg中视频的Filters有296种之多，可以利用其中一种或组合Filters对视频进行各种处理。视频Fil
【FFmpeg 系列】音视频解复用与复用实战码流怪侠 ffmpeg 音视频解复用复用时间戳直播音视频转码
FFmpegFFmpeg是一个功能强大、广泛使用的多媒体处理工具，可以处理音频、视频、字幕以及多种容器格式的操作。它支持解码、编码、复用、解复用、流式传输、过滤等功能。以下是关于FFmpeg的一些核心信息和操作说明：核心组件FFmpeg是由以下几个主要库组成的：libavcodec：用于各种音视频编解码器的实现。libavformat：处理各种音视频文件和流的容器格式（如MP4、MKV、AVI）。
EasyRTC音视频实时通话WebP2P技术赋能的全场景实时通信解决方案 EasyDSS EasyRTC 音视频人工智能
一、技术背景在数字化浪潮席卷全球的当下，实时通信技术凭借其即时性、高效性的优势，已然成为推动各行业创新发展的核心动能。EasyRTC深度融合WebP2P技术，构建起去中心化的通信架构，实现了低延迟、高可靠的数据传输，为多场景应用提供了强有力的技术支撑。二、EasyRTC技术特点1）低延迟与高实时性：EasyRTC通过优化的音视频编解码算法和网络传输策略，实现了端到端延迟控制在300ms以内，为用户
03 视频编解码器智算菩萨视频编解码人工智能
1.基本概念和原理1.1什么是视频编解码器视频编解码器(VideoCodec)是一种用于压缩或解压数字视频的软件、硬件或两者的结合。"编解码器"这个术语是"编码器"(encoder)和"解码器"(decoder)的组合。编码器负责压缩(编码)视频数据,以便于存储或传输。解码器则负责解压缩(解码)视频数据,以便播放或处理。1.2为什么需要视频编解码器视频编解码器的主要目的是减小视频文件的大小,同时尽
视频编解码学习十二之Android疑点小虎卫远程打卡app 视频编解码视频编解码学习
一、android.view.SurfaceControl.setDisplaySurface的作用android.view.SurfaceControl.setDisplaySurface是Android系统中一个native层级别的API，主要用于设置某个物理显示屏（Display）的输出Surface，属于SurfaceFlinger的一部分功能。这个API并不是应用开发常用的接口，而是系统
视频编解码学习10之成像技术原理小虎卫远程打卡app 视频编解码视频编解码学习计算机视觉
一、空中有各种方向的光，每个地方都有光线交叉，为什么大部分不能形成像？这是一个光学中的基本问题，涉及成像原理和光的传播规律。虽然空中到处都有来自不同方向的光线，但大多数情况下这些光线不能形成清晰的像，原因如下：原因总结：1.没有经过聚焦（汇聚）成像的关键是光线必须有序地汇聚在一点（或一组点）上。比如在凸透镜、摄像机或人眼中，来自物体某一点的光线被透镜聚焦到感光面（如视网膜或相机传感器）上的某一点，
各种音视频编解码学习详解 h264 ，mpeg4 ，aac 等所有音视频格式 wishfly 视频 ffmpeg
编解码学习笔记（一）：基本概念媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起，在运营商和应用开发商中，媒体业务份量极重，其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系，需要理清媒体的codec，比较搞的是，在豆丁网上看运营商的规范标准，同一运营商同样的业务在不同文档中不同的要求，而且有些要求就我看来应当是历史的延续，也就是现在已经很少采用了。所以
视频编解码学习六之视频采集和存储小虎卫远程打卡app 视频编解码视频编解码学习音视频
视频采集的核心原理是用光学元件（如摄像头）将光信号转换为电信号进行传输和存储。摄像头的主要功能是将光学图像转换为电信号（模拟或数字），核心流程如下：1.光学成像镜头组：聚焦光线到感光元件上，通过调整焦距、光圈控制进光量和景深。红外滤波：多数摄像头配备IR-cut滤光片，阻挡红外光干扰色彩还原（尤其在CMOS传感器中）。2.光电转换感光传感器：CCD（电荷耦合器件）：通过光电效应生成电荷，逐行转移电
FFmpeg音视频处理指南，提升Android程序员月薪的关键技巧 EtwCpp ffmpeg 音视频 android
作为一名Android程序员，如果你擅长音视频编解码相关的开发，那么你的技能将会变得更加独特和有价值。本文将介绍如何使用FFmpeg库在Android应用中进行音视频处理，并分享一些提升月薪的秘籍。了解FFmpegFFmpeg是一个强大的开源音视频处理工具，它提供了一组用于编解码、转换和处理音视频的库和工具。在Android平台上，我们可以使用FFmpeg库来实现各种音视频处理功能。集成FFmpe
视频编解码基础概念音视频开发老马 Android音视频开发音视频开发流媒体服务器视频编解码音视频 webrtc 实时音视频计算机视觉
1.概述音视频领域早期采用模拟化技术，目前已发展为数字化技术。数字化的主要好处有：可靠性高、能够消除传输及存储损耗，便于计算机处理及网络传输等。数字化后，音视频处理就进入了计算机技术领域，音视频处理本质上就是对计算机数据的处理。图像信息经采集后生成的原始视频数据，数据量非常大，对于某些采集后直接本地播放的应用场合，不需要考虑压缩技术。但现实中更多的应用场合，涉及视频的传输与存储，传输网络与存储设备
视频编解码相关资料汇总 cg101202 图形硬件加速视频编解码 Windows 图形 linux
相关概念window图形和显示相关概念GraphicsAPIsinWindows自Windows早期以来，图形编程的主要API就是图形设备接口（GDI）。此API设计用于处理大量2D输出设备，它构成了Windows用户界面体验的基础。DirectDraw和Direct3D作为替代API引入，以支持全屏游戏和3D渲染，作为当时现有硬件的扩展。与GDI的相互作用是复杂的。这种设计限制了传统GDI元素与
视频编解码学习9之照相机历史小虎卫远程打卡app 视频编解码数码相机
照相机的发展历史可以追溯到19世纪初，至今已有200多年。以下是照相机技术演进的主要阶段和里程碑：1.早期探索阶段（1820s-1880s）1826年：法国人尼埃普斯（NicéphoreNiépce）用沥青感光法拍摄《窗外风景》，完成人类首张永久性照片（曝光8小时）。1839年：达盖尔（LouisDaguerre）发明"银版摄影法"（Daguerreotype），曝光时间缩短至30分钟，摄影术正式
视频编解码学习一之相关学科小虎卫远程打卡app 视频编解码计算机视觉人工智能深度学习
RGB、YUV等颜色空间（ColorSpace）以及图像的显示、表示、编码等相关的学科通常属于以下领域：图像处理（ImageProcessing）包括图像的表示（如RGB、YUV、HSV等颜色模型）、转换、压缩（如JPEG、PNG）、增强、滤波等基础技术。颜色科学（ColorScience）研究颜色的感知、表示（如CIEXYZ、sRGB、AdobeRGB）、色彩管理、颜色空间转换等。计算机图形学（
YUV原理讲解 SuperW 音视频开发 linux
一、什么是YUV格式YUV是一种常见的视频像素格式，经常用在视频编解码上面，YUV分别由Y分量和U、V分量(红色投影Cr)组成。Y分量指的是亮度分量，也就是我们经常说的灰阶值，相当于一副灰色的图像。而U分量和V分量表示的是色度分量，它的作用就是用于影像的色彩以及饱和度，常用于指定像素的颜色，U分量是图像蓝色部分去掉亮度Y，V分量是图像红色部分去掉亮度Y。换言之如果一副图像只有Y分量，没有UV分量就
H.266/VVC变换代码学习：xT函数涵小呆 VVC/H.266 H.266/VVC
H.266/VVC的变换代码中，xT函数是进行主变换的函数，主要是先进行水平和垂直变换核选择然后分别进行水平和垂直变换。基本流程如下：通过调用getTrTypes()函数获取垂直和水平变换核类型（默认为DCT-2）；根据垂直和水平变换核类型以及宽度和高度确定SkipWidth和SkipHeight（主要是用来进行高频调零操作：对于使用DCT2的大尺寸(64)变换块进行高频调零，只保留低频系数(32
鸿蒙5.0&next开发【典型场景的视频编码配置】音视频编解码是秃子总会反光鸿蒙系列视频编解码音视频 harmonyos 华为鸿蒙系统
典型场景的视频编码配置此文档描述了AVCodec视频编码能力在不同应用场景下的推荐配置参数，供调用者根据实际应用场景进行视频编码应用的开发。视频编码在视频通话、视频会议、直播、视频编辑、视频分享等场景均有广泛使用，按照体验要求，上述场景可归纳划分为低时延、实时流媒体、离线编码三大类别应用场景。本文将给出三大类别应用场景下视频编码的推荐参数配置，供调用者根据不同的应用场景下的需求进行参数配置选择。通
音视频编解码——音频编解码格式AAC（Advanced Audio Coding）墨影清泉视频编解码音视频 aac 音频编解码
AAC（AdvancedAudioCoding）是一种广泛使用的音频编解码格式，它采用了先进的压缩算法，旨在提供更高的音频质量和更低的比特率。一、原理：AAC基于声学模型和感知编码原理，利用人耳对声音的感知特性，对音频信号进行压缩。它主要采用了以下技术：1、频域分析：将音频信号转换为频域表示，通常使用快速傅里叶变换（FFT）进行频谱分析。2、时频掩蔽效应：利用人耳的掩蔽特性，对较弱的信号在较强的信
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

VVC/H.266代码阅读（VTM8.0）(二. non-VCLU解码)

你可能感兴趣的:(H.266/VVC,视频编解码)