为什么倒谱可以分析回声

为什么倒谱可以分析回声_第1张图片

一个有趣的现象:倒谱上的第一个峰,恰好对应回声相比原声的延时。

回声 y y y 是原始声音 x x x 延迟 t 0 t_0 t0 秒后的、带有衰减 α α α 的副本

y = α x ( t − t 0 ) y = αx (t - t_0) y=αx(tt0)

方便起见,这里取 α = 1 α = 1 α=1

原始声音 x x x 可以理解成一堆不同频率的正弦波的和:
x = a 1 s i n ( f 1 ) + a 2 s i n ( f 2 ) + . . . x = a_1sin (f_1) + a_2sin (f_2) + ... x=a1sin(f1)+a2sin(f2)+...回声 y y y 等价于把上面各个正弦波向后推移 t 0 t_0 t0,表示成附加一个相位 φ φ φ
y = a 1 s i n ( f 1 + φ 1 ) + a 2 s i n ( f 2 + φ 2 ) + . . . y = a_1sin (f_1+φ_1) + a_2sin (f_2+φ_2) + ... y=a1sin(f1+φ1)+a2sin(f2+φ2)+...
最终麦克风接收到的信号记为 z = x + y z=x+y z=x+y

考察 z z z 的任何一个频率成分

f n : a n s i n ( f n ) + a n s i n ( f n + φ n ) f_n: a_nsin (f_n) + a_nsin (f_n+φ_n) fn:ansin(fn)+ansin(fn+φn)

可以看到,向后推移 t 0 t_0 t0 对任何频率成分的幅度影响是不同的。

这个影响将以周期为 1 / t 0 1/t_0 1/t0 的正弦扰动的形式,在幅度谱上被观察到。


举例而言,取 t 0 = 0.01 t_0 = 0.01 t0=0.01 s s s

z z z 100 H z 100Hz 100Hz 频率成分的幅度刚好翻倍, 50 H z 50Hz 50Hz 刚好抵消,

因为:

原来的 100 H z 100Hz 100Hz 正弦波加上延时 10 10 10 m s ms ms 后的 100 H z 100Hz 100Hz,刚好峰-峰对齐

原来的 50 H z 50Hz 50Hz 正弦波加上延时 10 10 10 m s ms ms 后的 50 H z 50Hz 50Hz,刚好峰-谷对齐

为什么倒谱可以分析回声_第2张图片

以此推类,相比 x x x 的幅度谱, z z z 的幅度谱上

200 H z / 300 H z / 400 H z . . . 200Hz / 300Hz /400 Hz... 200Hz/300Hz/400Hz... 都会翻倍

50 H z / 150 H z / 250 H z . . . 50Hz / 150Hz / 250Hz ... 50Hz/150Hz/250Hz... 都会相消

相当于回声给 x x x 的幅度谱上附加一个周期为 100 H z 100Hz 100Hz 的正弦扰动成分


由上面的讨论可知,迟滞 t 0 t_0 t0 的回声的存在

会使得 z z z 的幅度谱上多出了一个周期为 1 / t 0 1/t_0 1/t0 、频率为 t 0 t_0 t0 的正弦扰动。

为什么倒谱可以分析回声_第3张图片


那么如何表示这个幅度谱上频率为 t 0 t_0 t0 的正弦波?

可以把幅度谱当作一个信号,对其进行傅里叶变换,观察能量最高的成分。

这样得到的便是倒谱,谱上频率为 t 0 t_0 t0 的高峰,将恰好代表幅度谱上的扰动。

为什么倒谱可以分析回声_第4张图片

你可能感兴趣的:(音频处理,音频,自然语言处理)