音频信号处理技术学习笔记

音频信息处理技术主是多媒体技术的主要组成之一。本文主要介绍音频信息处理技术的基本原理和应用。

1、音频基础概念

  • 声音是由震动产生的,并以声波的形式通过介质传播。
  • 音色的频率,两个波峰(波谷)的时间间隔为周期 T T T,频率为 f = 1 / T f= 1/T f=1/T ,即每秒钟震动的次数,单位为赫兹(Hz)。
  • 声音三要素
    • 音调 反应声音的到底程度,由频率决定,频率越大,音调越高,频率越小,音调越低,
    • 音强 反映声音的强度,由振幅决定
    • 音色 反映声音的品质,由声源的材料决定,在声音信号中表现为声音的频率组合
  • 音频(Audio),指人耳可以听到的声音频率在20HZ~20kHz之间的声波。

2、音频数字化和编码

模拟音频:在时间和幅度上都是连续变化的。
数字音频:在时间和幅度上都是离散、不连续的。
计算机中使用的是数字音频。自然界的声音一般都是模拟音频,所以在计算机中需要对模拟信号进行数字化。具体过程包括采样、量化、编码。

  • 采样:指把时间域或空间域的连续量转化成离散量的过程。也就是每间隔一段时间读取一次信号的值。每秒钟的采集的样本数叫做采样频率。
  • 采样定理:在进行模拟/数字信号的转换过程中,当采样频率 f s f_s fs大于信号中最高频率 f m a x f_{max} fmax的2倍时 f s > f m a x f_s>f_{max} fs>fmax,采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的2.56~4倍;采样定理又称奈奎斯特定理。
    不同音质数字音频的常用采样频率:
采样率 音质 频率范围
8KHz 电话 0~4KHz
11.025KHz 低于AM广播 0~5.512KHz
22.05KHz 接近于AM广播 0~11.025KHz
32KHz 优于于FM广播 0~16KHz
44KHz CD-DA 0~22KHz
48KHz 标准DVD 0~24KHz
96KHz 高端DVD 0~48KHz
  • 量化:采样得到的声音信号幅度转换为数字值,声音信号在幅度上被离散化。
  • 量化等级 : 2 n 2^n 2n
  • 动态范围: 20 l o g 10 ( V m a x / V m i n ) 20log_{10}(V_{max}/V_{min}) 20log10(Vmax/Vmin)
量化位数 音质 量化等级 动态范围
8bit 电话 256 48dB
16bit CD 65,536 96dB
24bit DVD 16,777,216 144dB
32bit 顶级 4,294,967,296 192dB
  • 声道 :单声道 双声道 多声道

2.1 PCM(Pulse Code Modulation,脉冲编码调制)

这种方法通过用脉冲编码量化后的值来代表模拟信号的幅度,即用二进制的大小来代表模拟信号的幅度。在接收端再将这些编码的二进制数还原为原来的模拟信号。

%% 
clear 
close all
clc
 
%% 
dt = 0.00001; %时间间隔
f = 20;%信号频率
T = 1/f;%周期
t = 0:dt:3*T;%显示3个周期
w = 2*pi/T;%
A = 2 ;
Vt = A*(cos(w*t)+1)+A*(cos(0.5*w*t)+1);%产生原始信号,随便写的
figure;
plot(t,Vt);%显示原始函数
%%
fs = 100;%采样频率 fs>= 2*f

t1 = 0:1/fs:3*T;%显示3个周期
Vs = A*(cos(w*t1)+1)+A*(cos(0.5*w*t1)+1);
hold on; 
stem(t1,Vs,'r');%显示采样
hold on; 
plot(t1,Vs,'b');%显示采样后的函数
%%
M=15; %0~15 4bit
PCM=round(M*Vs/M);
hold on; 
plot(t1,PCM,'g');%PCM数据

  • 均匀量化
  • 非均匀量化

一段PCM数据是需要几个参数配合使用:

  • 采样率
  • 位数
  • 通道
  • 大小端

2.2 DM(Delta Modulation,增量调制)

DM是继PCM后出现的又一种模拟信号数字化的方法。
(1)在比特率较低时,增量调制的量化信噪比高于PCM的量化信噪比;
(2)增量调制的抗误码性能好。能工作于误码率为 1 0 − 2 10^{-2} 102 ~ 1 0 − 3 10^{-3} 103的信道中,而PCM要求误比特率通常为 1 0 − 4 10^{-4} 104 ~ 1 0 − 6 10^{-6} 106
(3)增量调制的编译码器比PCM简单。

增量调制是用一位二进制码表示相邻抽样值相对大小的一种A/D转换方式。它对当前信号瞬时值与前一个抽样值的差值进行量化,并且是对这个差值的符号进行编码,而不是对差值的大小进行编码。

2.3 DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)

对输入对相邻样本之差编码而不是对样本本身编码,由于相邻样本之差比实际样本幅度小,所以表示差信号需要较小的位数。

2.4 ADPCM(Adaptive Differential Pulse Code Modulation,自适应差分脉冲编码调制)

一种性能比较好的波形编码。它的核心想法是:1.利用自适应改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值。2.使用过去的样本值估算下一个输入样本的预测值,使实际样本也预测值之间的差值总是最小。
##常见编码格式

你可能感兴趣的:(音频信号处理技术学习笔记)