音频特征

公式图片来自网络!!!

参考https://www.cnblogs.com/xingshansi/p/6815217.html

信号(信息,数据)分两种:数字信号和模拟信号。(信号本来是数据的传递方式,这里不加区别)

数字信号:是指用离散的,不连续的物理量来表示的信息。

模拟信号(连续信号):是指用连续变化的物理量所表达的信息。

他们之间是可以互相转换

(1)采样频率:在原有的模拟信号上每隔一段时间进行一次取点,并且赋予这个点一个数字,将其变为数字信号。

取点操作就称为采样,,在单位时间内采样的次数就称为采样频率。

(2)比特率(一般应该是用采样精度表示):是将模拟信号的轻响(影响声音响度的是振幅)划分到一个等级中,比特率就是反应这个等级的,比如16比特就是讲声音波形的振幅划分到2^16个等级中。

(3)通道数:声音的通道数量,单通道的声音一般用一个喇叭,不能判断生源的具体位置,立体声可以感受空间的位置(比如人的双耳通过声音传到耳朵的时间差来辨别生源位置)。

(4)帧率:单位时间内声音帧的个数,一帧可能包含多个声音样本。

(5)过零率:每帧信号内信号过零的次数(找零点之前要对信号进行中心化处理,要不然哪有负数值呢),体现的是音频的频率特征。

音频特征_第1张图片

N表示一阵的长度,n为帧的序号。 

(6)短时能量:体现信号在不同时刻的强弱程度,计算公式为:

音频特征_第2张图片

(7)短时自相关系数:信号的相关信号系数为,一信号与另一信号的翻转的卷积,计算公式:

w代表窗函数,窗函数的定义为:为了减少频谱能量泄漏,可采用不同的截取函数对信号进行截断,截断函数称为窗函数

未完,待续

 

 

你可能感兴趣的:(音频)