houxiaoni01

WAV系列之二：ADPCM编解码原理及代码实现

参考自：《adpcm编解码原理及其代码实现》
　　　　《ADPCM编码与解码学习笔记》
　　　　《音频编码：ADPCM》

文章目录

1、PCM

1.1、采样
1.2、量化编码

2、DPCM
3、ADPCM
4、IMA-ADPCM 的编解码原理

4.1、adpcm编码原理
4.2、adpcm解码原理
4.3、源代码

5、ADPCM数据存放形式

5.1、adpcm 数据块介绍
5.2、单通路pcm格式
5.3、双通路pcm格式

6、参考资料

1、PCM

PCM (Pulse Code Modulation)，脉冲编码调制。

PCM是把声音从模拟信号转化为数字信号的技术，把一个时间连续取值连续的模拟信号变换成时间离散取值离散的数字信号，模拟信号转化为数字信号需要三个步骤：采样、量化、编码。

1.1、采样

采样用一个固定的频率对模拟信号进行提取样值。

常用采样率为8KHz，16kHz，22.05kHz，32kHz，44.1kHz，48kHz，192kHz。

人耳能够感觉到的最高频率为20kHz，要满足人耳的听觉要求，根据奈奎斯特采样定律则，需要每秒进行40k次采样，即40kHz。

8Khz的采样率就可以达到人的对话程度，通常电话的采样率为8kHz/16kHz。

常见的无线电广播采样率为22.05KHz，CD采样率为44.1kHz，DVD采样率为48kHz，Hi-Res音频采样率为192kHz

1.2、量化编码

量化编码就是把采样得到的声音信号幅度转换成数字值。这个过程会产生失真，量化的精度越高失真越小。常见的量化位数为8bit，16bit，24bit。

PCM约定俗成为无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。

2、DPCM

DPCM（Differential Pulse Code Modulation），差分脉冲编码调。

PCM是不压缩的，通常数据量比较大，存储和通讯都必需付出比较大的代价，早期的通讯是不能传输那么大的数据量的，所以就要想办法把数据压缩一下，以减少带宽和存储的压力。

假设我们以8kHz的采样率，16bit量化编码，则1秒的数据量为8000 * 16 = 128000 bit 。一般音频信息都是比较连续的，不会突然很高或者突然很低，两点之间差值不会太大，所以这个差值只需要很少的几个位（比如4bit）即可表示。这样，我们只需要知道前一个点的值，又知道它与下一个点的差值，就可以计算得到下一个点了。这个差值就是所谓的Differential ，将PCM数据转成DPCM数据，数据量会小很多，如上面所说的用4bit的表示差值，则1秒的(8kHz采样率16bit量化编码) PCM数据转成DPCM则只需要大约32000bit , 压缩比大约4:1。

3、ADPCM

ADPCM (Adaptive Differential Pulse Code Modulation)、自适应差分脉冲编码调。

音频信号虽然是比较连续性的，有些差值比较小，有些差值比较大，如果差值比较大有可能用4bit表示不了，如果增大表示差值的位数（例如8bit\16bit）是可以解决这个问题，但就导致数据量变大，没起到压缩的目的，而且这种差值比较大的只是少数，大部分还是差值比较小的。

为了解决这个问题，前辈们就想出了 ADPCM，定义一个因子，用差值除以因子的值来表示两点之差，如果两点之间差值比较大，则因子也比较大。通过因子引入，可以使得DPCM编码自动适应差值比较大的数据。

ADPCM算法并没用固定标准，最经典的就是IMA ADPCM。

4、IMA-ADPCM 的编解码原理

ADPCM(Adaptive Differential Pulse Code Modulation 差分脉冲编码调制)主要是针对连续的波形数据的, 保存的是相临波形的变化情况, 以达到描述整个波形的目的。本文的以IMA的ADPCM编码标准为例进行描述，IMA-ADPCM 是Intel公司首先开发的是一种主要针对16bit采样波形数据的有损压缩算法，压缩比为 4：1，它与通常的DVI-ADPCM是同一算法。 (对8bit数据压缩时是3.2：1，也有非标准的IMA-ADPCM压缩算法，可以达到5：1甚至更高的压缩比) 4：1的压缩是目前使用最多的压缩方式。结尾附adpcm编解码的源代码adpcm.h与adpcm.c。

ADPCM编码本质是一种预测编码，那么它是怎么样进行预测的呢？预测编码利用相邻的音频数据在时间上的相关性，相邻采样点的音频数据具有相似的特点。因此，经过压缩后的数据并不是音频数据本身，而是该数据的预测值与实际值之差。偏差需要量化器进行量化，假如我们对于16bit的音频数据采用16bit的量化，那么偏差与实际的数据值占据的位数一样则无法达到压缩数据的目的，如果采用4bit的量化位数，其最大的量化步数只能是16，显然是不能满足使用要求，因此ADPCM应运而生，ADPCM是一种采用变步长的量化器的预测编码算法，它的本质是根据预测值与实际的偏差范围，在量化表格中选择出合适的量化值，使预测变化的幅度保持在4bit的范围内。ADPCM的核心公式如下，其中 delta 代表为量化后的值，step 为量化步长，vpdiff 代表经过量化后有效的偏差值，vpdiff 加上本次的预测值做为下一次的运算的预测值：

整个ADPCM的编码过程分三步进行：

第一步为计算出当前实际值与预测值的偏差diff，val 代表了当前数据的实际值，valpred 为当前数的预测值。delta 为量化后的带符号的有效数据为4bit的数据，其最高位代表的数据的方向，bit3为1代表负数，代表-7~7的整型数据。

当 diff 小于0， delta bit3被置1。

第二步通过index（首次编码index为0）求出step，通过diff和step求出delta。

第三步为对 diff 进行量化，简易实现不考虑计算效率的情况下完全可以直接参考上面的公式，因为是在计算机平台进行了除法运算与小数运算，该作者很巧妙的把这些运算使用与或非来实现了，提高了运算的效率，有兴趣的读者可以看看代码，学习一下这种思路。我们细看一下公式，

可以发现公式可以拆分为两部分实现，小数部分的量化被转换为了固定的step/8，因此节约了计算的成本。vpdiff 就是对应这部分的值。

 vpdiff = (step >> 3);

4.1、adpcm编码原理

编码步骤：

求出输入的pcm数据与预测的pcm数据（第一次为上一个pcm数据）的差值diff；
通过差分量化器算出delta（通过index（首次编码index为0）求出step，通过diff和step求出delta)。delta即为编码后的数据；
通过逆量化器求出vpdiff(通过求出的delta和step算出vpdiff）；
求出新的预测valpred，即上次预测的valpred+vpdiff；
通过预测器（归一化），求出当前输入pcm input的预测pcm值，为下一次计算用；
量化阶调整（通过delta查表及index，计算出新的index值）。为下次计算用；

4.2、adpcm解码原理

解码步骤（其实解码原理就是编码的第三到六步）：

通过逆量化器求出vpdiff(通过存储的delta和index，求出step，算出vpdiff）；
求出新的预测valpred，即上次预测的valpred+vpdiff；
通过预测器（归一化），求出当前输入pcm input的预测pcm值，为下一次计算用。预测的pcm值即为解码后的数据；
量化阶调整（通过delta查表及index，计算出新的index值）。为下次计算用；

注释说明：

通过编码和解码的原理我们可以看出其实第一次编码的时候已经进行了解码，即预测的pcm。
因为编码再解码后输出的数据已经被量化了。根据计算公式delta = diff*4/step; vpdiff = (delta+0.5)*step/4;考虑到都是整数运算，可以推导出：pcm数据经过编码再解码生成的预测pcm数据，如果预测pcm数据再次编码所得的数据与第一次编码所得的数据是相同的。故pcm数据经过一次编码有损后，不论后面经过几次解码再编码都是数据一样，音质不会再次损失。即相对于第一次编码后，以后数据不论多少次编解码，属于无损输出。

4.3、源代码

adpcm.h

#ifndef ADPCM_H
#define ADPCM_H

struct adpcm_state
{
    int valprev;
    int index;
};

extern void adpcm_coder(short *indata, signed char *outdata, int len, struct adpcm_state *state);
extern void adpcm_decoder(signed char *indata, short *outdata, int len, struct adpcm_state *state);

#endif /*ADPCM_H*/

adpcm.c

/***********************************************************
Copyright 1992 by Stichting Mathematisch Centrum, Amsterdam, The
Netherlands.

                        All Rights Reserved

Permission to use, copy, modify, and distribute this software and its 
documentation for any purpose and without fee is hereby granted, 
provided that the above copyright notice appear in all copies and that
both that copyright notice and this permission notice appear in 
supporting documentation, and that the names of Stichting Mathematisch
Centrum or CWI not be used in advertising or publicity pertaining to
distribution of the software without specific, written prior permission.

STICHTING MATHEMATISCH CENTRUM DISCLAIMS ALL WARRANTIES WITH REGARD TO
THIS SOFTWARE, INCLUDING ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND
FITNESS, IN NO EVENT SHALL STICHTING MATHEMATISCH CENTRUM BE LIABLE
FOR ANY SPECIAL, INDIRECT OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT
OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.

******************************************************************/

/*
** Intel/DVI ADPCM coder/decoder.
**
** The algorithm for this coder was taken from the IMA Compatability Project
** proceedings, Vol 2, Number 2; May 1992.
**
** Version 1.2, 18-Dec-92.
**
** Change log:
** - Fixed a stupid bug, where the delta was computed as
**   stepsize*code/4 in stead of stepsize*(code+0.5)/4.
** - There was an off-by-one error causing it to pick
**   an incorrect delta once in a blue moon.
** - The NODIVMUL define has been removed. Computations are now always done
**   using shifts, adds and subtracts. It turned out that, because the standard
**   is defined using shift/add/subtract, you needed bits of fixup code
**   (because the div/mul simulation using shift/add/sub made some rounding
**   errors that real div/mul don't make) and all together the resultant code
**   ran slower than just using the shifts all the time.
** - Changed some of the variable names to be more meaningful.
*/

#include "adpcm.h"
#include  /*DBG*/

#ifndef __STDC__
#define signed
#endif

/* Intel ADPCM step variation table */
static int indexTable[16] = {
    -1, -1, -1, -1, 2, 4, 6, 8,
    -1, -1, -1, -1, 2, 4, 6, 8,
};

static int stepsizeTable[89] = {
    7, 8, 9, 10, 11, 12, 13, 14, 16, 17,
    19, 21, 23, 25, 28, 31, 34, 37, 41, 45,
    50, 55, 60, 66, 73, 80, 88, 97, 107, 118,
    130, 143, 157, 173, 190, 209, 230, 253, 279, 307,
    337, 371, 408, 449, 494, 544, 598, 658, 724, 796,
    876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066,
    2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358,
    5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899,
    15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767
};
    
void adpcm_coder(short *indata, signed char *outdata, int len, struct adpcm_state *state)
{
    short *inp;			/* Input buffer pointer */
    signed char *outp;		/* output buffer pointer */
    int val;			/* Current input sample value */
    int sign;			/* Current adpcm sign bit */
    int delta;			/* Current adpcm output value */
    int diff;			/* Difference between val and valprev */
    int step;			/* Stepsize */
    int valpred;		/* Predicted output value */
    int vpdiff;			/* Current change to valpred */
    int index;			/* Current step change index */
    int outputbuffer;		/* place to keep previous 4-bit value */
    int bufferstep;		/* toggle between outputbuffer/output */

    outp = (signed char *)outdata;
    inp = indata;

    valpred = state->valprev;
    index = state->index;
    step = stepsizeTable[index];
    
    bufferstep = 1;

    for ( ; len > 0 ; len-- ) {
	val = *inp++;

	/* Step 1 - compute difference with previous value */
	diff = val - valpred;
	sign = (diff < 0) ? 8 : 0;
	if ( sign ) diff = (-diff);

	/* Step 2 - Divide and clamp */
	/* Note:
	** This code *approximately* computes:
	**    delta = diff*4/step;
	**    vpdiff = (delta+0.5)*step/4;
	** but in shift step bits are dropped. The net result of this is
	** that even if you have fast mul/div hardware you cannot put it to
	** good use since the fixup would be too expensive.
	*/
	delta = 0;
	vpdiff = (step >> 3);
	
	if ( diff >= step ) {
	    delta = 4;
	    diff -= step;
	    vpdiff += step;
	}
	step >>= 1;
	if ( diff >= step  ) {
	    delta |= 2;
	    diff -= step;
	    vpdiff += step;
	}
	step >>= 1;
	if ( diff >= step ) {
	    delta |= 1;
	    vpdiff += step;
	}

	/* Step 3 - Update previous value */
	if ( sign )
	  valpred -= vpdiff;
	else
	  valpred += vpdiff;

	/* Step 4 - Clamp previous value to 16 bits */
	if ( valpred > 32767 )
	  valpred = 32767;
	else if ( valpred < -32768 )
	  valpred = -32768;

	/* Step 5 - Assemble value, update index and step values */
	delta |= sign;
	
	index += indexTable[delta];
	if ( index < 0 ) index = 0;
	if ( index > 88 ) index = 88;
	step = stepsizeTable[index];

	/* Step 6 - Output value 
	if ( bufferstep ) {
	    outputbuffer = (delta << 4) & 0xf0;
	} else {
	    *outp++ = (delta & 0x0f) | outputbuffer;
	}*/
    if ( bufferstep ) {
	    outputbuffer = delta & 0x0f;
	} else {
	    *outp++ = ((delta << 4) & 0xf0) | outputbuffer;
	}
	bufferstep = !bufferstep;
    }

    /* Output last step, if needed */
    if ( !bufferstep )
      *outp++ = outputbuffer;
    
    state->valprev = valpred;
    state->index = index;
}

void adpcm_decoder(signed char *indata, short *outdata, int len, struct adpcm_state *state)
{
    signed char *inp;		/* Input buffer pointer */
    short *outp;		/* output buffer pointer */
    int sign;			/* Current adpcm sign bit */
    int delta;			/* Current adpcm output value */
    int step;			/* Stepsize */
    int valpred;		/* Predicted value */
    int vpdiff;			/* Current change to valpred */
    int index;			/* Current step change index */
    int inputbuffer;		/* place to keep next 4-bit value */
    int bufferstep;		/* toggle between inputbuffer/input */

    outp = outdata;
    inp = (signed char *)indata;

    valpred = state->valprev;
    index = state->index;
    step = stepsizeTable[index];

    bufferstep = 0;
    
    for ( ; len > 0 ; len-- ) {
	
	/* Step 1 - get the delta value */
	if ( !bufferstep ) {
	    inputbuffer = *inp++;
	    delta = inputbuffer & 0xf;
	} else {
	    delta = (inputbuffer >> 4) & 0xf;
	}
	bufferstep = !bufferstep;

	/* Step 2 - Find new index value (for later) */
	index += indexTable[delta];
	if ( index < 0 ) index = 0;
	if ( index > 88 ) index = 88;

	/* Step 3 - Separate sign and magnitude */
	sign = delta & 8;
	delta = delta & 7;

	/* Step 4 - Compute difference and new predicted value */
	/*
	** Computes 'vpdiff = (delta+0.5)*step/4', but see comment
	** in adpcm_coder.
	*/
	vpdiff = step >> 3;
	if ( delta & 4 ) vpdiff += step;
	if ( delta & 2 ) vpdiff += step>>1;
	if ( delta & 1 ) vpdiff += step>>2;

	if ( sign )
	  valpred -= vpdiff;
	else
	  valpred += vpdiff;

	/* Step 5 - clamp output value */
	if ( valpred > 32767 )
	  valpred = 32767;
	else if ( valpred < -32768 )
	  valpred = -32768;

	/* Step 6 - Update step value */
	step = stepsizeTable[index];

	/* Step 7 - Output value */
	*outp++ = valpred;
    }

    state->valprev = valpred;
    state->index = index;
}

5、ADPCM数据存放形式

本部分为adpcm数据存放说明，属于细节部分，很多代码解码出来有噪音就是因为本部分细节不对，所以需要仔细阅读。

5.1、adpcm 数据块介绍

adpcm数据是一个block一个block存放的，block由block header (block头) 和data 两者组成的。其中block header是一个结构体，它在单声道下的定义如下：

Typedef struct
{
	short  sample0;    //block中第一个采样值（未压缩）
	BYTE  index;     //上一个block最后一个index，第一个block的index=0;
	BYTE  reserved;   //尚未使用
}MonoBlockHeader;

对于双声道，它的blockheader应该包含两个MonoBlockHeader其定义如下：

typedaf struct
{
	MonoBlockHeader leftbher;
	MonoBlockHeader rightbher;
}StereoBlockHeader;

在解压缩时，左右声道是分开处理的，所以必须有两个MonoBlockHeader;
有了blockheader的信息后，就可以不需要知道这个block前面数据而轻松地解出本block中的压缩数据。故adpcm解码只与本block有关，与其他block无关，可以只单个解任何一个block数据。
block的大小是固定的，可以自定义，每个block含的采样数nsamples计算如下：

//
#define BLKSIZE 1024
block = BLKSIZE * channels;
//block = BLKSIZE;//ffmpeg
nsamples = (block  - 4 * channels) * 8 / (4 * channels) + 1;

例如audition软件就是采用上面的，单通路block为1024bytes，2041个samples，双通路block为2048，也是含有2041个sample。
而ffmpeg采用block =1024bytes，即不论单双通路都为1024bytes，通过公式可以算出单双通路的samples数分别为2041和1017；

5.2、单通路pcm格式

byte 0 byte 1	byte 2 byte 3	byte 4 byte 5	byte 6 byte 7	byte 8 byte 9	…
sample0	sample1	sample2	sample3	sample4	…

单通路压缩为adpcm数据为 4bytes block head + raw data：

byte 0 byte 1	byte 2	byte 3	byte 4	byte 5	byte 6	byte 7	byte 8	byte 9	…
sample0	index	reserved	data0	data1	data2	data3	data4	data5	…

其中sample1编码后存data0低4位，sample2编码后存data0高四位...

5.3、双通路pcm格式

byte 0 byte 1	byte 2 byte 3	byte 4 byte 5	byte 6 byte 7	byte 8 byte 9	…
sampleL0	sampleR0	sampleL1	sampleR1	sampleL2	…

双通路压缩为adpcm数据为 4bytes block L head + 4bytes block R head + 4bytes raw L data + 4bytes raw R data…：

adpcm双通路block head：

byte 0 byte 1	byte 2	byte 3	byte 4 byte 5	byte 6	byte 7
sample0L	indexL	reservedL	sample0R	indexR	reservedR

接着双通路raw压缩数据4byte L， 4byte R …：

byte8	byte9	byte10	byte11	byte12	byte13	byte14	byte15	byte16	byte17	byte18	…
data0L	data1L	data2L	data3L	data0R	data1R	data2R	data3R	data4L	data5L	data6L	…

注意：需要特别留意双声道的处理和当数据不够1 block时的处理方式。

6、参考资料

http://www.moon-soft.com/program/FORMAT/windows/wavec.htm
关于wav的头部信息更多解释见这里：http://soundfile.sapp.org/doc/WaveFormat/

ESP32 S3音频开发
1.音频硬件框架Codec：音频编解码芯片，一种低功耗单声道音频编解码器，包含单通道ADC、单通道DAC、低噪声前置放大器、耳机驱动器、数字音效、模拟混音和增益功能。它通过I2S和I2C总线与ESP32-S3-WROOM-1模组连接，以提供独立于音频应用程序的。PA：音频功率放大器，用于放大来自音频编解码芯片的音频信号，以驱动扬声器。2.音频软件框架ESP32提供了几个简单的高级API，可以参考例
ESP32设备驱动——使用I2S播放音频的物联网应用 JmwvOverflow 音视频物联网
在物联网应用中，使用嵌入式设备进行音频播放是一个常见的需求。ESP32是一款功能强大的嵌入式开发板，它集成了Wi-Fi和蓝牙功能，适用于物联网应用。本文将介绍如何在ESP32上使用I2S（Inter-ICSound）接口来播放音频。I2S是一种串行音频接口，用于高质量音频数据的传输。ESP32的I2S接口可以直接与音频编解码器、数字信号处理器（DSP）等设备连接，实现音频的输入和输出。下面我们将逐
HTML5里video标签支持哪些格式的视频文件 Lucky_chengzi
video标签支持的视频格式：Ogg、MPEG4、WebMMP4=MPEG4文件使用H264视频编解码器和AAC音频编解码器WebM=WebM文件使用VP8视频编解码器和Vorbis音频编解码器Ogg=Ogg文件使用Theora视频编解码器和Vorbis音频编解码器
联咏NT98567高度集成边缘IPC应用SoC规格特性 weixin_Todd_Wong2010 边缘计算人工智能计算机视觉 python c++神经网络
联咏NT98567MQG是一款高度集成的SoC，具有高图像质量、低比特率和低功耗的特点，适用于电池应用，目标是2Mp至5Mp/8Mp边缘IP摄像头应用。该SoC集成了双核ARMCortexA7CPU、新一代ISP、H.265/H.264视频压缩编解码器、视频处理引擎（VPE）用于双传感器拼接和鱼眼去畸变、高性能硬件DLA模块、图形引擎、显示控制器、以太网PHY、USB2.0主机/设备、音频编解码器
SBC编解码器库：蓝牙音频传输的核心草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：SBC编解码器库是一个软件工具集，提供在蓝牙技术中核心使用的音频编解码功能。该库以C语言实现，包含编码、解码以及相关设置控制功能，使得开发者可以在应用中集成SBC编解码能力，如蓝牙音频播放器或耳机。SBC编解码工作原理基于子带编码理论，通过量化和编码音频信号的各个子带，实现高效的数据传输。SBC支持多种比特率、采样率和声道配置，并包含错误检测与恢复机制，控制接
Audio Codec的I2S时序或PCM时序，代表什么意思张海森_168820 音视频
AudioCodec的I2S时序或PCM时序，代表什么意思答案摘自豆包：AudioCodec（音频编解码器）中的I2S时序和PCM时序是两种用于数字音频数据传输的标准接口协议，它们在时序结构、数据传输方式上有明显区别，下面从定义、时序特点、应用场景等方面详细说明：一、I2S时序（Inter-ICSound）1.定义与背景I2S是飞利浦（Philips）开发的专用数字音频传输协议，主要用于连接音频编
常见音频主控芯片以及相关厂家总结路溪非溪音视频
音频主控芯片是音频设备（如蓝牙耳机、音箱、功放等）的核心组件，负责音频信号的解码、编码、处理和传输。以下是常见的音频主控芯片及其相关厂家，按应用领域分类：蓝牙音频芯片主要用于无线耳机、音箱等设备，支持蓝牙协议和音频编解码（如SBC/AAC/aptX/LDAC等）。主流厂家及芯片：高通（Qualcomm）QCC系列：如QCC3040、QCC5141（支持蓝牙5.2、主动降噪ANC、aptXAdapt
音频编解码-speex库的使用方法 weixin_34402090
Speex是近年来开发出的一套功能强大的语音引擎，能够实现高质量和低比特率的编码。它不仅提供了基于码激励线性预测（CELP）算法的编/解码模块，而且在其最新发布的版本中还提供了声音预处理和声学回声消除模块，为保障IP网络中的语音通信质量提供了技术手段。此外，Speex还具有压缩后的比特率低（2~44kbps）的特点，并支持多种比特率。这些特点使得Speex特别适合VoIP的系统。虽然是开源的，但是
ffmpeg 多路同时解码_ffmpeg入门教程阿兹猫 ffmpeg 多路同时解码
@[TOC]##首先推荐几本必参考的书《FFmpeg从入门到精通》，命令行居多《FFmpeg基础库编程开发》，各种标准发展历史及原理居多《音视频开发进阶指南基于Android与iOS平台的实践》##视频播放器原理此处摘抄部分为CSDN博主「雷霄骅」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：[[总结]视音频编解码技术零基础学习方法_雷霄骅(leixiao
音视频编解码——音频编解码格式AAC（Advanced Audio Coding）墨影清泉视频编解码音视频 aac 音频编解码
AAC（AdvancedAudioCoding）是一种广泛使用的音频编解码格式，它采用了先进的压缩算法，旨在提供更高的音频质量和更低的比特率。一、原理：AAC基于声学模型和感知编码原理，利用人耳对声音的感知特性，对音频信号进行压缩。它主要采用了以下技术：1、频域分析：将音频信号转换为频域表示，通常使用快速傅里叶变换（FFT）进行频谱分析。2、时频掩蔽效应：利用人耳的掩蔽特性，对较弱的信号在较强的信
Opus——基于Python实现opus音频编解码 Irving.Gao python python 开发语言
文章目录安装环境编解码程序安装环境安装环境：sudoapt-getupdatesudoapt-getinstallbuild-essential#pyaudiosudoapt-getinstalllibportaudio2libportaudiocpp0portaudio19-dev#pythonopuslibsudoapt-getinstalllibopus-dev安装python包：pipin
探索Android移动开发：音视频处理技术移动开发前沿 CSDN android 音视频 ai
探索Android移动开发：音视频处理技术关键词：Android开发、音视频处理、MediaCodec、FFmpeg、OpenGLES、音频编解码、视频渲染摘要：本文深入探讨Android平台上的音视频处理技术，从基础概念到高级应用全面解析。我们将分析Android音视频处理的核心组件和工作原理，详细介绍MediaCodec、AudioTrack等关键API的使用，并探讨FFmpeg在Androi
深入解析音频编解码器（Audio CODEC）：硬件、接口与驱动开发嵌入式Jerry 内核音视频驱动开发 linux 嵌入式硬件
音频编解码器（AudioCODEC）是音频处理系统中的核心组件，负责模拟信号与数字信号的相互转换，广泛应用于智能音箱、嵌入式系统、消费电子产品等设备。本篇文章将从硬件结构、接口解析、驱动开发和软件配置等方面，深入讲解如何正确理解和使用音频编解码器。1.音频编解码器的基本概念CODEC（Coder-Decoder），即编解码器，是一种模数转换（ADC）和数模转换（DAC）的组合设备，用于处理音频信号
FFMPEG实现音频重采样 QQ_1695710968 音频重采样 FFMPEG PCM
技术在于交流、沟通，转载请注明出处并保持作品的完整性。原文：https://blog.csdn.net/hiwubihe/article/details/81259134[音频编解码系列文章]音频编解码基础FFMPEG实现音频重采样FFMPEG实现PCM编码(采用封装格式实现)FFMPEG实现PCM编码(不采用封装格式实现)FAAC库实现PCM编码FAAD库实现RAW格式AAC解码FAAD库实现R
【FFMPEG】各种音视频编解码学习详解 h264 ，mpeg4 ，aac 等所有音视频格式 weixin_30906425 ffmpeg 大数据操作系统
目录(?)[-]编解码学习笔记二codec类型编解码学习笔记三Mpeg系列Mpeg1和Mpeg2编解码学习笔记四Mpeg系列Mpeg4编解码学习笔记五Mpeg系列AAC音频编解码学习笔记六H26x系列编解码学习笔记七微软WindowsMedia系列编解码学习笔记八Real系列编解码学习笔记九QuickTime系列编解码学习笔记十Ogg系列编解码学习笔记十一FlashVideo系列编解码学习笔记十二
推荐开源项目：media-codec - 视频与音频编解码库强妲佳Darlene
推荐开源项目：media-codec-视频与音频编解码库media-codecVideoandaudiodeconde/encodelibraries.项目地址:https://gitcode.com/gh_mirrors/me/media-codec1、项目介绍media-codec是一个强大的开源项目，专注于视频和音频的编解码库。它为开发者提供了一套完善的工具，帮助他们在各种平台上处理多媒体数
Opus编解码协议入门弱冠少年嵌入式软件嵌入式硬件
主要参考资料：走进音视频的世界——Opus编解码协议:https://blog.csdn.net/u011686167/article/details/126647876目录1.简介2.码率与音质、延时的关系2.1音质与码率比较2.2码率与延时对比3.Opus编解码框架4.DTX非连续传输5.FEC前向纠错1.简介Opus是一种开源免费的音频编解码器，支持音乐和语音，具有低延时、带内FEC、DTX
FFmpeg源码解析系列（一）目录和编译头快撑不住了 FFmpeg 源码解析 ffmpeg 音视频视频编解码实时音视频图像处理
引言当我们欣赏一部电影、观看一段视频或者享受一首音乐时，很少有人会停下来思考这一切是如何呈现在我们眼前的。然而，在每一帧的画面、每一秒的声音背后，有着一个不可思议的技术世界这个充满音视频的世界的核心之一，就是FFmpeg。FFmpeg是一个强大而复杂的多媒体处理工具，它为视频和音频编解码、流媒体传输、格式转换等提供了优秀的解决方案。在这个系列博客中，我们将深入探讨FFmpeg源码，解析它的工作原理
音频基础知识 littlezls audio 多媒体开发类音视频网络 android
系列文章目录多媒体音频基础知识及格式的介绍文章系列：音频基础知识介绍：音频基础知识https://blog.csdn.net/littlezls/article/details/135917303音频基础知识介绍：音频几个相关概念及心理声学模型https://blog.csdn.net/littlezls/article/details/135499627音频编解码格式介绍：音频编码格式介绍htt
学习笔记 2019-04-30 段勇_bf97
HousePrices-bagging_xgboost+lasso+ridgeKaggle入門級賽題：房價預測FFMPEG视音频编解码零基础学习方法35岁程序员的独家面试经历公司名称公司介绍薪水车辆工程专业33岁简历有些传感器方面的东西20k-35k非渣硕是如何获得百度、京东双SP一些面试经验20k-40k吴以均的简历一个大牛的简历北京航空航天大学毕业生的简历厦门大学软件学院毕业生的简历名称介绍H
音频网络传输 1 _Rye_ 音频技术音视频语音识别人工智能
09｜音频编解码器是如何工作的？今天介绍一下什么是音频编/解码器，以及它背后的原理。不妨先设想一下：如果没有音频编/解码器，直接给对方发送原始数据，会发生什么事情呢？假设一个在线会议有10个人，每个人要发给另外9个人的音频信号是48kHz采样率的单通道音频。每个采样点用16位的浮点来表示。那么上行通道中需要每秒发送48000乘以16bit的音频信号，也就是大约768kbps；而接收的下行通路的信号
音频编码格式介绍 littlezls audio 开发类多媒体音视频嵌入式硬件
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍：音频编码格式介绍https://blog.csdn.net/littlezls/article/details/135862140音频编解码格式介绍(1)ADPCM：adpcm编解码原理及其代码实现https://blog.csdn.net/littlezls/article/details/83501580音频编解码格式介绍(2)MP3：音
音频几个相关概念及心理声学模型 littlezls 多媒体 audio 开发类音视频
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍：音频几个相关概念及心理声学模型https://blog.csdn.net/littlezls/article/details/135499627音频编解码格式介绍：音频编码格式介绍https://blog.csdn.net/littlezls/article/details/135862140音频编解码格式介绍(1)ADPCM：adpcm编解
【音视频原理】音频编解码原理 ③ ( 音频比特率 / 码率 | 音频帧 / 帧长 | 音频帧采样排列方式 - 交错模式和非交错模式 ) 韩曙亮音视频原理音视频音频比特率码率帧帧长度交错模式
文章目录一、音频比特率/码率1、音频比特率2、音频比特率案例3、音频码率4、音频码率相关因素5、常见的音频码率6、视频码率-仅做参考二、音频帧/帧长1、音频帧2、音频帧长度三、音频帧采样排列方式-交错模式和非交错模式1、交错模式2、非交错模式一、音频比特率/码率1、音频比特率"音频比特率"指的是每秒传输的音频的比特数;单位是bps,BitPerSecond;"音频比特率"是衡量音频质量的标准;原始
使用ffmpeg进行AAC音频解码稚肩音视频开发 ffmpeg aac 音视频
关于更多音视频开发内容，请参考专栏音视频开发AAC（AdvancedAudioCoding）是一种常见的音频编解码格式，用于高效压缩音频数据。要进行AAC解码，可以使用常用工具或库来实现。使用FFmpeg进行AAC解码在安装ffmpeg后，可以使用以下命令行解码AAC文件：ffmpeg-iinput.aacoutput.wav这个命令将输入的AAC文件(input.aac)解码为WAV文件(out
展锐T618/T610安卓4G核心板/开发板/方案定制 newmobi 4G模块展锐T618 展锐T610 智能模块展锐模块方案定制
XY610（以UMS512为主芯片）是一款基于UNISOC平台、工业级高性能、可运行安卓操作系统的4G智能模块，支持TDD-LTE/LTE-FDD/WCDMA/TD-SCDMA/CDMA2000/GSM等多种制式；支持WiFi802.11a/b/g/n/ac，BT5.0LE近距离无线通信，支持GPS/GLONASS/Galileo/Beidou多种制式卫星定位；支持多种语音和音频编解码器，内部集成
音频格式之MP3：（1)MP3封装格式简介 littlezls audio vs 开发类 c++音视频数据结构
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍(1)ADPCM：adpcm编解码原理及其代码实现音频编解码格式介绍(2)MP3：音频格式之MP3：(1)MP3封装格式简介音频编解码格式介绍(2)MP3：音频格式之MP3：(2)MP3编解码原理详解音频编解码格式介绍(3)AAC：音频格式之AAC：(1)AAC简介音频编解码格式介绍(3)AAC：音频格式之AAC：(2)AAC封装格式ADIF,
音频格式之AAC：(3)AAC编解码原理详解 littlezls audio aac 开发类 aac 网络音视频
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍(1)ADPCM：adpcm编解码原理及其代码实现音频编解码格式介绍(2)MP3：音频格式之MP3：(1)MP3封装格式简介音频编解码格式介绍(2)MP3：音频格式之MP3：(2)MP3编解码原理详解音频编解码格式介绍(3)AAC：音频格式之AAC：(1)AAC简介音频编解码格式介绍(3)AAC：音频格式之AAC：(2)AAC封装格式ADIF,
音频格式之AAC：（1)AAC简介 littlezls audio aac aac 网络音视频 linux c++
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍(1)ADPCM：adpcm编解码原理及其代码实现音频编解码格式介绍(2)MP3：音频格式之MP3：(1)MP3封装格式简介音频编解码格式介绍(2)MP3：音频格式之MP3：(2)MP3编解码原理详解音频编解码格式介绍(3)AAC：音频格式之AAC：(1)AAC简介音频编解码格式介绍(3)AAC：音频格式之AAC：(2)AAC封装格式ADIF,
音频格式之MP3：（2)MP3编解码原理详解 littlezls audio vc 开发类网络音视频 mpeg-1
系列文章目录音频格式的介绍文章系列：音频编解码格式介绍(1)ADPCM：adpcm编解码原理及其代码实现音频编解码格式介绍(2)MP3：音频格式之MP3：(1)MP3封装格式简介音频编解码格式介绍(2)MP3：音频格式之MP3：(2)MP3编解码原理详解音频编解码格式介绍(3)AAC：音频格式之AAC：(1)AAC简介音频编解码格式介绍(3)AAC：音频格式之AAC：(2)AAC封装格式ADIF,
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不