ericbars

AAC 文件解析及解码流程

原文地址

感谢博主的分享， https://blog.csdn.net/wlsfling/article/details/5876016

AAC概述

AAC是高级音频编码（Advanced Audio Coding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术。由Fraunhofer IIS、Dolby Laboratories、AT&T、Sony等公司共同开发，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术（PS,SBR），为区别于传统的MPEG-2 AAC，故含有SBR或PS特性的AAC又称为MPEG-4 AAC。

AAC是新一代的音频有损压缩技术，它通过一些附加的编码技术（比如PS,SBR等），衍生出了LC-AAC,HE-AAC,HE-AACv2三种主要的编码，LC-AAC就是比较传统的AAC，相对而言，主要用于中高码率(>=80Kbps)，HE-AAC(相当于AAC+SBR)主要用于中低码(<=80Kbps)，而新近推出的HE-AACv2(相当于AAC+SBR+PS)主要用于低码率(<=48Kbps）,事实上大部分编码器设成<=48Kbps自动启用PS技术，而>48Kbps就不加PS,就相当于普通的HE-AAC。

AAC规格简述

AAC共有9种规格，以适应不同的场合的需要：

   MPEG-2 AAC LC 低复杂度规格（Low Complexity）--比较简单，没有增益控制，但提高了编码效率，在中等码率的编码效率以及音质方面，都能找到平衡点
   MPEG-2 AAC Main 主规格
   MPEG-2 AAC SSR 可变采样率规格（Scaleable Sample Rate）
   MPEG-4 AAC LC 低复杂度规格（Low Complexity）------现在的手机比较常见的MP4文件中的音频部份就包括了该规格音频文件
   MPEG-4 AAC Main 主规格 ------包含了除增益控制之外的全部功能，其音质最好
   MPEG-4 AAC SSR 可变采样率规格（Scaleable Sample Rate）
   MPEG-4 AAC LTP 长时期预测规格（Long Term Predicition）
   MPEG-4 AAC LD 低延迟规格（Low Delay）
   MPEG-4 AAC HE 高效率规格（High Efficiency）-----这种规格适合用于低码率编码，有Nero ACC 编码器支持
   目前使用最多的是LC和HE(适合低码率)。流行的Nero AAC编码程序只支持LC，HE，HEv2这三种规格，编码后的AAC音频，规格显示都是LC。HE其实就是AAC（LC）+SBR技术，HEv2就是AAC（LC）+SBR+PS技术；

Hev1和HEv2用此图简单表示：
(图中AAC即指的是原来的AAC-LC)

HE：“High Efficiency”（高效性）。HE-AAC v1（又称AACPlusV1，SBR)，用容器的方法实现了AAC（LC）+SBR技术。SBR其实代表的是Spectral Band Replication(频段复制)。简要叙述一下，音乐的主要频谱集中在低频段，高频段幅度很小，但很重要，决定了音质。如果对整个频段编码，若是为了保护高频就会造成低频段编码过细以致文件巨大；若是保存了低频的主要成分而失去高频成分就会丧失音质。SBR把频谱切割开来，低频单独编码保存主要成分，高频单独放大编码保存音质，“统筹兼顾”了，在减少文件大小的情况下还保存了音质，完美的化解这一矛盾。

HEv2：用容器的方法包含了HE-AAC v1和PS技术。PS指“parametric stereo”（参数立体声）。原来的立体声文件文件大小是一个声道的两倍。但是两个声道的声音存在某种相似性，根据香农信息熵编码定理，相关性应该被去掉才能减小文件大小。所以PS技术存储了一个声道的全部信息，然后，花很少的字节用参数描述另一个声道和它不同的地方。

AAC特点

 (1)AAC是一种高压缩比的音频压缩算法，但它的压缩比要远超过较老的音频压缩算法，如AC-3、MP3等。并且其质量可以同未压缩的CD音质相媲美。
 (2)同其他类似的音频编码算法一样，AAC也是采用了变换编码算法，但AAC使用了分辨率更高的滤波器组，因此它可以达到更高的压缩比。
 (3)AAC使用了临时噪声重整、后向自适应线性预测、联合立体声技术和量化哈夫曼编码等最新技术，这些新技术的使用都使压缩比得到进一步的提高。
 (4)AAC支持更多种采样率和比特率、支持1个到48个音轨、支持多达15个低频音轨、具有多种语言的兼容能力、还有多达15个内嵌数据流。
（5）AAC支持更宽的声音频率范围，最高可达到96kHz，最低可达8KHz，远宽于MP3的16KHz-48kHz的范围。
（6）不同于MP3及WMA，AAC几乎不损失声音频率中的甚高、甚低频率成分，并且比WMA在频谱结构上更接近于原始音频，因而声音的保真度更好。专业评测中表明，AAC比WMA声音更清晰，而且更接近原音。 
（7）AAC采用优化的算法达到了更高的解码效率，解码时只需较少的处理能力。

AAC音频文件格式

AAC的音频文件格式有ADIF ＆ ADTS：
ADIF：Audio Data Interchange Format 音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始，不需进行在音频数据流中间开始的解码，即它的解码必须在明确定义的开始处进行。故这种格式常用在磁盘文件中。
ADTS：Audio Data Transport Stream 音频数据传输流。这种格式的特征是它是一个有同步字的比特流，解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。
简单说，ADTS可以在任意帧解码，也就是说它每一帧都有头信息。ADIF只有一个统一的头，所以必须得到所有的数据后解码。且这两种的header的格式也是不同的，目前一般编码后的和抽取出的都是ADTS格式的音频流。两者具体的组织结构如下所示：

AAC的ADIF格式见下图：

AAC的ADTS的一般格式见下图：

图中表示出了ADTS一帧的简明结构，其两边的空白矩形表示一帧前后的数据。
ADIF和ADTS的header
ADIF 的头信息：

ADIF头信息位于AAC文件的起始处，接下来就是连续的 raw data blocks。
组成ADIF头信息的各个域如下所示：

ADTS 的固定头信息：

ADTS的可变头信息：

（1）帧同步目的在于找出帧头在比特流中的位置，13818-7规定，aac ADTS格式的帧头同步字为12比特的“1111 1111 1111”.
（2）ADTS的头信息为两部分组成，其一为固定头信息，紧接着是可变头信息。固定头信息中的数据每一帧都相同，而可变头信息则在帧与帧之间可变。

3.AAC元素信息
在AAC中，原始数据块的组成可能有六种不同的元素：
SCE: Single Channel Element单通道元素。单通道元素基本上只由一个ICS组成。一个原始数据块最可能由16个SCE组成。
CPE: Channel Pair Element 双通道元素，由两个可能共享边信息的ICS和一些联合立体声编码信息组成。一个原始数据块最多可能由16个SCE组成。
CCE: Coupling Channel Element 藕合通道元素。代表一个块的多通道联合立体声信息或者多语种程序的对话信息。
LFE: Low Frequency Element 低频元素。包含了一个加强低采样频率的通道。
DSE: Data Stream Element 数据流元素，包含了一些并不属于音频的附加信息。
PCE: Program Config Element 程序配置元素。包含了声道的配置信息。它可能出现在ADIF 头部信息中。
FIL: Fill Element 填充元素。包含了一些扩展信息。如SBR，动态范围控制信息等。

4.AAC文件处理流程
(1)　判断文件格式，确定为ADIF或ADTS
(2)　若为ADIF，解ADIF头信息，跳至第6步。
(3)　若为ADTS，寻找同步头。
(4)解ADTS帧头信息。
(5)若有错误检测，进行错误检测。
(6)解块信息。
(7)解元素信息。

AAC解码流程

AAC解码流程图

在主控模块开始运行后，主控模块将AAC比特流的一部分放入输入缓冲区，通过查找同步字得到一帧的起始，找到后，根据ISO/IEC 13818-7所述的语法开始进行Noisless Decoding(无噪解码)，无噪解码实际上就是哈夫曼解码，通过反量化(Dequantize)、联合立体声（Joint Stereo），知觉噪声替换（PNS）,瞬时噪声整形（TNS），反离散余弦变换（IMDCT），频段复制（SBR）这几个模块之后，得出左右声道的PCM码流，再由主控模块将其放入输出缓冲区输出到声音播放设备。

 技术解析：
     1.主控模块：
     所谓的主控模块，它的主要任务是操作输入输出缓冲区，调用其它各模块协同工作。
 其中，输入输出缓冲区均由DSP控制模块提供接口。输出缓冲区中将存放的数据为解码出来的PCM数据，代表了声音的振幅。它由一块固定长度的缓冲区构成，通过调用DSP控制模块的接口函数，得到头指针，在完成输出缓冲区的填充后，调用中断处理输出至I2S接口所连接的
 音频ADC芯片（立体声音频DAC和DirectDrive耳机放大器）输出模拟声音。
     2.Noisless Decoding(无噪解码)：
     无噪编码就是哈夫曼编码，它的作用在于进一步减少尺度因子和量化后频谱的冗余，
 即将尺度因子和量化后的频谱信息进行哈夫曼编码。全局增益编码成一个8位的无符号整数，
 第一个尺度因子与全局增益值进行差分编码后再使用尺度因子编码表进行哈夫曼编码。后续
 的各尺度因子都与前一个尺度因子进行差分编码。量化频谱的无噪编码有两个频谱系数的划分。     其一为4元组和2元组的划分，另一个为节划分。对前一个划分来说，确定了一次哈夫曼表
 查找出的数值是4个还是2个。对后一个划分来说，确定了应该用哪一个哈夫曼表，一节中
 含有若干的尺度因子带并且每节只用一个哈夫曼表。
     ——分段
     无噪声编码将输入的1024个量化频谱系数分为几个段（section），段内的各点均使用
 同一个哈夫曼表，考虑到编码效率，每一段的边界最好同尺度因子带的边界重合。所以每一段
 必段传送信息应该有：段长度，所在的尺度因子带，使用的哈夫曼表。
     ——分组和交替
     分组是指忽略频谱系数所在窗，将连续的，具有相同尺度因子带的频谱系数分为一组放在
 一起，共享一个尺度因子从而得到更好的编码效率。这样做必然会引起交替，即本来是以
c[组][窗][尺度因子带][ 系数索引]
为顺序的系数排列，变为将尺度因子带同的系数放在一起：
c[组][尺度因子带][窗][ 系数索引]
这样就引起了相同窗的系数的交替。
    ——大量化值的处理
    大量化值在AAC中有两种处理方法：在哈夫曼编码表中使用escape标志或使用脉冲
escape方法。前者跟mp3编码方法相似，在许多大量化值出现时采用专门的哈夫曼表，这个表
暗示了它的使用将会在哈夫曼编码后面跟跟一对escape值及对值的符号。在用脉冲escape
方法时，大数值被减去一个差值变为小数值，然后使用哈夫曼表编码，后面会跟一个脉冲结构
来帮助差值的还原.
    3.尺度因子解码及逆量化
  在AAC编码中，逆量化频谱系数是由一个非均匀量化器来实现的，在解码中需进行其逆运算。      即保持符号并进行4/3次幂运算。
  在频域调整量化噪声的基本方法就是用尺度因子来进行噪声整形。尺度因子就是一个用来改
  变在一个尺度因子带的所有的频谱系数的振幅增益值。使用尺度因子这种机制是为了使用非
  均匀量化器在频域中改变量化噪声的比特分配。
          ——尺度因子带（scalefactor-band）
  频率线根据人耳的听觉特性被分成多个组，每个组对应若干个尺度因子，这些组就叫做尺度
  因子带。为了减少信息含有短窗的边信息，连续的短窗可能会被分为一组，即将若干个短窗
  当成一个窗口一起传送，然后尺度因子将会作用到所有分组后的窗口去。
     4.联合立体声(Joint  Stereo)
       联合立体声的是对原来的取样进行的一定的渲染工作，使声音更”好听”些。
     5.知觉噪声替换（PNS）
       知觉噪声替换模块是一种以参数编码的方式模拟噪声的模块。在判别出音频值中的噪
  声后，将些噪声不进行量化编码，而是采用一些参数告诉解码器端这是某种噪声，然后解
  码器端将会对这些噪声用一些随机的编码来制造出这一类型的噪声。
       在具体操作上，PNS模块对每个尺度因子带侦测频率4kHz以下的信号成分。如果这个
  信号既不是音调，在时间上也无强烈的能量变动，就被认为是噪声信号。其信号的音调及能
  量变化都在心理声学模型中算出。
       在解码中，如果发现使用了哈夫曼表13(NOISE_HCB)，则表明使用了PNS。由于M/S立体
  声解码与PNS解码互斥，故可以用参数ms_used来表明是否两个声道都用同样的PNS。如果 
  ms_used参数为1，则两个声道会用同样的随机向量来生成噪声信号。PNS的能量信号用
  noise_nrg来表示，如果使用了PNS，则能量信号将会代替各自的尺度因子来传送。噪声能量
 编码同尺度因子一样，采用差分编码的方式。第一个值同样为全局增益值。它同强度立体声位
 置值及尺度因子交替地放在一起，但对差分解码来说又彼此忽略。即下一个噪声能量值以上一
 个噪声能量值而不是强度立体声位置或尺度因子为标准差分解码。随机能量将会在一个尺度
 因子带内产生noise_nrg所计算出的平均能量分布。此项技术只有在MPEG-4 AAC中才会使用。
       6.瞬时噪声整形（TNS）
       这项神奇的技术可以通过在频率域上的预测，来修整时域上的量化噪音的分布。在一
 些特殊的语音和剧烈变化信号的量化上，TNS技术对音质的提高贡献巨大！
       TNS瞬态噪声整形用于控制一个转换窗口内的瞬时噪声形态。它是用一个对单个通道的
滤波过程来实现的。传统的变换编码方案常常遇到信号在时域变化非常剧烈的问题，特别是语
音信号，这个问题是因为量化后的噪声分布虽然在频率域上得到控制，但在时域上却以一个常数分布在一个转换块内。如果这种块中信号变化得很剧烈却又不转向一个短块去，那这个常数
分布的噪声将会被听到。
      TNS的原理利用了时域和频域的二元性和LPC(线性预测编码)的时频对称性，即在其中的任意一个域上做编码与在另一域上做预测编码等效，也就是说，在一个域内做预测编码可以在另一域内增加其解析度。量化噪声产生是在频域产生的，降低了时域的解析度，故在这里是在频域上做预测编码。在AACplus中，由于基于AAC profile LC，故TNS的滤波器阶数被限制在12阶以内。
       7.反离散余弦变换（IMDCT）
      将音频数据从频域转换到时域的过程主要是由将频域数据填入一组IMDCT滤波器来实现的。在进行IMDCT变换后，输出数值经过加窗，叠加，最后得到时域数值。
       8.频段复制（SBR）
       简要叙述，音乐的主要频谱集中在低频段，高频段幅度很小，但很重要，决定了音质。如果对整个频段编码，若是为了保护高频就会造成低频段编码过细以致文件巨大；若是保存了低频的主要成分而失去高频成分就会丧失音质。SBR把频谱切割开来，低频单独编码保存主要成分，高频单独放大编码保存音质，“统筹兼顾”了，在减少文件大小的情况下还保存了音质，完美的化解这一矛盾。
       9.参数立体声(PS）
       对于之前的立体声文件来说，其文件大小是单声道的两倍，但是两个声道的声音存在某种相似性，根据香农信息熵编码定理，相关性应该被去掉才能减小文件大小。所以PS技术存储了一个声道的全部信息，之后，用很少的字节当作参数来描述另一个声道和它不同的地方。

术语说明：

AAC: Advanced Audio Coding 高级音频编码
AAC LC: AAC with Low Complexity AAC的低复杂度配置
AAC plus: 也叫HE-AAC, AAC+,MPEG4 AAC LC加入SBR模块后形成的一个AAC版本
MPEG：Motion Picture Expert Group
IMDCT：反离散余弦变换
ADIF：Audio Data Interchange Format 音频数据交换格式
ADTS：Audio Data Transport Stream 音频数据传输流
SCE: Single Channel Element单通道元素
CPE: Channel Pair Element 双通道元素
CCE: Coupling Channel Element 藕合通道元素
DSE: Data Stream Element 数据流元素
PCE: Program Config Element 程序配置元素
FIL: Fill Element 填充元素
ICS: Individual Channel Stream 独立通道流
PNS: Perceptual Noise Substitution 知觉噪声替换
SBR: Spectral Band Replication 频段复制
TNS: Temporal Noise Shaping 瞬时噪声整形
ch：channel 通道
PS：parametric stereo 参数立体声
SBR：Spectral Band Replication 频段复制

QML音视频实时通信 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++音视频
QML音视频实时通信使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频实时通信概述1.1QML音视频技术发展背景1.1.1QML音视频技
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
即时通讯项目 NingDream816 即时通讯项目网络 redis 数据库服务器缓存设计模式
即时通讯项目需求分析功能约束可行解更优解高性能接入层优化存储层优化消息时序一致性高可用需求分析功能添加好友聊天会话列表单聊AB群聊多设备登录消息漫游消息已读，查看已读/未读列表视频通话(学音视频技术时补上)语音通话约束DAU(DailyActiveUsers，日活跃用户数量)10亿假设每人平均每天发100条消息，1000Mli*100/86400=12MliQPS(Queriespersecond
2024 泛娱乐企业出海音视频选型攻略音视频开发_AIZ 行业解决方案泛娱乐社交海外直播技术出海RTC 抗弱网能力通话质量东南亚北美
前言在全球化扩张的大潮中，精准选择音视频技术平台对出海企业至关重要。本文将聚焦于评估即构音视频解决方案在关键的五大出海区域的性能表现，并深度解析各地区的市场特征及对应战略。旨在为志在全球市场扩张的企业提供详细的分析和策略指导，助力他们在多元复杂的国际市场环境中做出准确的技术选择，从而促进其海外业务的稳健发展和持续增长。一、出海五大热门地区特性分析泛娱乐出海市场正迎来快速增长，尤其是东南亚凭借其庞大
淘天集团顶尖人才T-Star计划正式启动阿里巴巴淘系技术团队官网博客
¤拓展阅读¤3DXR技术|终端技术|音视频技术服务端技术|技术质量|数据算法
红鲸音视频SDK：免费、安全、私有化，你值得拥有 HJ_SDK 音视频安全
在这个数字化飞速发展的时代，音视频通讯已成为连接人与人、企业与企业的关键桥梁。从远程办公到在线教育，从直播带货到远程医疗，音视频技术的应用场景日益丰富，在追求高效便捷的同时，数据安全与成本控制成了很多企业考虑的重中之重。红鲸音视频SDK结合企业的实际场景和需求，以“永久免费使用，纯私有化，安全可控，支持私有化应用集成”为核心优势，重新定义了音视频通讯领域的价值标准，为各行各业带来技术支持。永久免费
红鲸音视频SD助力企业实现音视频技术 HJ_SDK 音视频
在数字化、信息化高速发展的今天，音视频技术已成为各行业不可或缺的一部分。从在线教育、远程会议到娱乐直播，音视频技术的应用场景日益丰富，对音视频处理技术的要求也越来越高。红鲸音视频SDK以其独特的全面私有云或内网部署、支持信创操作系统等特性，深受众多企业的追捧和欢迎。一、红鲸音视频SDK的技术特点全面私有云或内网部署红鲸音视频SDK的一大亮点是支持全面私有云或内网部署。这一特性使得用户可以将音视频处
音视频常见问题（七）：首开慢即构开发者
本文主要讨论音视频应用中的首开慢问题，文章介绍了首开慢的产生原因：DNS解析耗时、网络传输协议耗时、传输网络调度耗时，并提供了排查方式和解决方案。即构科技的ExpressSDK和MSDN网络可以有效的解决首开慢问题，且节省开发成本。一、前言对于音视频开发者来说，掌握排查问题的技术技巧方法是非常必要的，排查问题的技术方法也能够帮助开发者更好地了解音视频技术的原理和工作机制，从而更加深入地理解音视频开
LiveVideoStack公众号内容改版通知 LiveVideoStack_ 编程语言大数据人工智能 python 比特币
LiveVideoStack公众号已经陪伴大家走过了四年多的时间，在过去四年里，我们为读者朋友推送了各类音视频技术文章，这些文章获得了很多读者的喜爱和推荐。在这里，我们非常感谢大家的支持。为了让我们的读者获得更丰富、更有深度的音视频信息，LiveVideoStack编辑部决定做一次尝试，在内容上推陈出新，呈现更多精彩的阅读栏目给大家。经过认真讨论，我们将推出以下音视频栏目：l主编观察：记录对音视频
音视频开发学习之路--C语言（二）蜗牛是不是牛
前言C和C++作为学习音视频技术首要具备的语言基础，所以十分必要学习和复习一下之前学习的C语言基础。视频教程：音视频开发全系列教程_哔哩哔哩_bilibili正文前面有一篇文章已经介绍了不少关于C的知识点，下面我们继续。结构体不论是C还是Java，都不能只有那几种基本数据类型，当然也需要一种类的概念，在Java中是面向对象，也就是类，在C中我们需要使用结构体。结构体允许C语言创建一种自定义的数据类
IM音视频技术方案建议环信张翼
环信即时通讯平台提供了基于互联网和移动终端的实时语音、实时视频等通讯能力。环信将移动即时通讯能力通过API和客户端SDK包的方式提供给企业，帮助企业在自己的产品中便捷、快速的实现通讯和社交功能。2.1基础功能2.1.1视频能力环信支持基于IP网络的点对点实时语音和视频。通过多种技术包括自动增益控制、回声消除、抖动控制、丢包策略、动态带宽自适应等增强算法，保证高质量实时语音和视频体验。对于主流的多版
如何在影音行业使用IP定位 IP数据云官方网络安全 IP归属地反欺诈 tcp/ip 网络协议网络
随着数字音视频技术的发展，用户对于音视频运营团队的运营效率、信息安全、用户体验等需求也与日俱增。IP地址数据服务可有效帮助企业优化全球流量路径，实现更快更顺畅的内容分发，有效辅助核验用户身份，防范虚假账号，在直播电商等场景下保障在线交易的安全性，同时利用IP地址数据可实现基于位置的内容分发与个性化营销。适配近距离服务器节点流媒体服务商可以根据用户请求访问IP地址归属地，判断用户的地理位置，就近匹配
音视频知识图谱 2022.05 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看这个合集：音视频面试题集锦。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱，你可以看看这个合集：音视频知识图谱。下面是2022.05月知识图谱新增的内容节选：1）图谱路径：采集/视频采集/对焦策略手动对
应用智能家居领域中的低功耗蓝牙模块 nanfeng775a 电子元器件芯片智能家居低功耗蓝牙模块蓝牙模组蓝牙模块
智能家居（smarthome,homeautomation）是以住宅为平台，利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成，构建高效的住宅设施与家庭日程事务的管理系统，提升家居安全性、便利性、舒适性、艺术性，并实现环保节能的居住环境。换句话说,智能家居并不是一个单一的产品，而是通过技术手段将家中所有的产品连接成一个有机的系统，主人可随时随地控制该系统
Javacv 音视频小工具 - 下载抖音视频声网实时音视频互动应用开发教程音视频 ffmpeg Java
一、前言大家好，俗话说的好，学习新的知识后要学以致用，在学习音视频的过程中，你有没有疑问，不知道音视频可以用来做什么。下面举几个例子，比较耳熟能详，被吹到风口的一些场景有：AI视觉计算,AI人脸识别.细化到一些小的领域，如现在直播技术，摄像头监控拉流；其他还有抖音中的美颜，滤镜，其背后是使用的音视频领域的数字化妆技术。由此可见，音视频技术应用已经应用于我们生活的方方面面。二、开发背景想写这篇文章的
音视频学习之路--C++ 蜗牛是不是牛
前言C和C++作为学习音视频技术首要具备的语言基础，所以十分必要学习和复习一下之前学习C++语言基础。这里IDE和环境配置在前面C语言复习的文章里已经说过了，还是使用CLion这个软件，话不多说，直接开始学习。正文C++作为一门用途更广、功能更齐全的语言，其知识深度很深，所以这里也就复习、学习一些基本知识点，等后续在实际项目中有遇到难点再进行补充。helloworld创建完一个C++项目，还是打印
Android AVDemo（4）：音频解封装，从 MP4 中解封装出 AAC丨音视频工程示例关键帧Keyframe
vx搜索『gjzkeyframe』关注『关键帧Keyframe』来及时获得最新的音视频技术文章。塞尚《河流》.jpeg这个公众号会路线图式的遍历分享音视频技术：音视频基础(完成)→音视频工具(完成)→音视频工程示例(进行中)→音视频工业实战(准备)。iOS/Android客户端开发同学如果想要开始学习音视频开发，最丝滑的方式是对音视频基础概念知识有一定了解后，再借助iOS/Android平台的音视
2019年值得再看一次的网易技术干货 | 年终盘点网易智企网易编程语言 nokia 3d xhtml
2019极致匠心2020精益求精年度技术干货盘点30+网易技术干货精彩未完待续01开篇引言02干货文章03演讲实录04视频教程开/篇/引/言转眼又是一年末，2019年，我们迎来了成立四周年的里程碑。从技术输出起步的网易云信，逐步将场景化深度融合，涉足了越来越多的垂直行业，进而由点及面地向各产业赋能。目前，我们已经为80w+企业开发者提供了技术服务。作为以IM和音视频技术为核心，通过PaaS化服务模
中国音视频SaaS第一股，百家云(RTC)正式登陆纳斯达克，估值达8.4亿美元 AIoT科技物语音视频实时音视频
中国音视频技术服务商百家云宣布与富维薄膜的合并上市交易正式完成。至此，百家云正式登陆纳斯达克挂牌交易，成为中国音视频SaaS第一股。百家云股票代码RTC，即“RealTimeCommunication”的缩写。据公告中还透露，根据2022年7月18日富维薄膜与百家云之间的合并协议和计划，新的董事会和管理层将由以下成员组成，且这一聘任将于合并交割上市之日立即生效：百家云创始人李钢江，被任命公司董事会
对话阿里云：解锁视频云的新技术、新场景 LiveVideoStack_ 算法大数据编程语言人工智能区块链
点击上方“LiveVideoStack”关注我们伴随着视频技术的进步和标准的迭代，视频产业从模拟进入到数字时代，完成了从电影电视到互联网的媒介转换，并且衍生出了超高清、3D、AR/VR等多种创新形态。特别是在后疫情的当下，我们可以看到音视频技术领域的诸多新变化，云与端的协同互动、算法创新与工程应用的深度交合、场景与需求的渗透促进，在严峻的挑战下，为各行各业带来了新的场景与活力。在即将举办的Live
LiveVideoStackCon2021 北京站专访：从上云到创新，视频云的新技术、新场景阿里云视频云阿里云视频云视频云阿里云音视频视频编码视频处理
伴随着视频技术的进步和标准的迭代，视频产业从模拟进入到数字时代，完成了从电影电视到互联网的媒介转换，并且衍生出了超高清、3D、AR/VR等多种创新形态。特别是在后疫情的当下，我们可以看到音视频技术领域的诸多新变化，云与端的协同互动、算法创新与工程应用的深度交合、场景与需求的渗透促进，在严峻的挑战下，为各行各业带来了新的场景与活力。在即将举办的LiveVideoStackCon2021北京站，来自阿
Android AVDemo（13）：视频渲染丨音视频工程示例关键帧Keyframe
vx搜索『gjzkeyframe』关注『关键帧Keyframe』来及时获得最新的音视频技术文章。iOS/Android客户端开发同学如果想要开始学习音视频开发，最丝滑的方式是对音视频基础概念知识有一定了解后，再借助iOS/Android平台的音视频能力上手去实践音视频的采集→编码→封装→解封装→解码→渲染过程，并借助音视频工具来分析和理解对应的音视频数据。塞尚《查德布凡光秃的树木》iOS/Andr
Android AVDemo（6）：音频渲染，免费获得源码丨音视频工程示例关键帧Keyframe
vx搜索『gjzkeyframe』关注『关键帧Keyframe』来及时获得最新的音视频技术文章。塞尚《自助餐》.jpeg这个公众号会路线图式的遍历分享音视频技术：音视频基础(完成)→音视频工具(完成)→音视频工程示例(进行中)→音视频工业实战(准备)。iOS/Android客户端开发同学如果想要开始学习音视频开发，最丝滑的方式是对音视频基础概念知识有一定了解后，再借助iOS/Android平台的音
网易视频云余利华：以用户体验为核心，深耕PaaS云生态 vcloud163 技术开发互联网科技网易视频云云计算视频云
如果说2016年互联网科技圈最热门的词汇,“直播”必定是最佳候选之一。来势汹汹的直播，正在与各式各样的行业联姻，形成“直播+”的经济模式，一度引发了全民直播的热潮。与此同时，网易也瞄准了这个行业，悄然上线了网易视频云，将扎实的音视频技术产品化，低调迈入云服务市场。承接了网易15年音视频技术积淀的网易视频云以PaaS服务模式，向开发者提供音视频编解码SDK和开放API，适用于在线教育、远程医疗、娱乐
网易视频云CEO余利华：云服务的核心仍是用户体验 vcloud_163 云计算技术开发视频云网易视频云网易
如果说2016年互联网科技圈最热门的词汇,“直播”必定是最佳候选之一。来势汹汹的直播，正在与各式各样的行业联姻，形成“直播+”的经济模式，一度引发了全民直播的热潮。与此同时，网易也瞄准了这个行业，悄然上线了网易视频云，将扎实的音视频技术产品化，低调迈入云服务市场。承接了网易15年音视频技术积淀的网易视频云以PaaS服务模式，向开发者提供音视频编解码SDK和开放API，适用于在线教育、远程医疗、娱乐
电视盒子什么品牌好？实体店主总结线下热销网络电视盒子排行榜 xzjkl66 电视盒子
电视盒子是我店内销量最多的产品，这几年我销售过各个品牌的电视盒子，对电视盒子了如指掌，网友们在讨论电视盒子什么品牌好，我按照店内的销量整理了网络电视盒子排行榜，实体店最受欢迎的电视盒子品牌是以下这些：一：泰捷WEBOXWE40S电视盒子好评指数：★★★★★泰捷在音视频技术处理、解码、传输领域这方面已经自主研发了超过十年的时间，是国内少有的在该领域以技术著称的企业，同时也是专门做电视盒子的厂商。据权
在线课堂解决方案公有云服务商腾讯云阿里云云计算 aws
基于腾讯多年的音视频技术积累，提供在线直播、点播、互动多场景的在线课堂方案，帮助机构快速搭建自己的在线课堂平台。应用场景精品小班课1v1私教课低延时大班课双师课堂
音视频技术开发周刊 | 326 LiveVideoStack_
每周一期，纵览音视频技术领域的干货。新闻投稿：[email protected]。全球最强「开源版Gemini」诞生！全能多模态模型Emu2登热榜，多项任务刷新SOTA最强的全能多模态模型来了！就在近日，智源研究院重磅发布了开源界的「Gemini」——Emu2，一口气刷新多项SOTA。成立2年融资近9亿！AINPC引爆游戏行业巨变，微软等大厂已经入局成立2年融资近9亿！AI
云手机快速发展的原因 Ogcloudnet 智能手机云计算
云手机之所以迅速崛起，根本原因在于5G技术的广泛应用以及音视频技术的不断发展，这些因素共同推动了云手机的使用体验取得显著提升，引发了越来越多公司对云手机的深入研究。那么，为何云手机成为当前和未来的热门趋势呢？以下将简要介绍这一新趋势的四大关键因素。1、在5G时代，更广泛的流量和数据需求使服务器资源面临更高的弹性要求。5G为多终端入网创造了基础，而智能家居、智能穿戴、智能车等智能终端的普及导致每人每
音视频技术：连接感官的奇妙纽带若忘即安音视频
音视频技术，作为现代信息社会中不可或缺的一部分，通过数字化、网络化的手段，极大地拓展了人类的感官体验和信息传播方式。本文将深入探讨音视频技术的基本原理、发展历程、关键技术、应用领域以及未来趋势，带领读者走进这个连接感官、推动娱乐、通讯、教育等多个领域创新的奇妙领域。1.音视频技术的基本原理1.1音频技术音频技术涉及声音的数字化、传输、合成和处理等方面。声音是通过声波传播的，而数字音频技术通过对声波
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1