如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)

因为最近一直在学习语音信号的处理,看了Haytham Fayek的一篇博客后关于什么是傅里叶变换感到很迷惑,所以就专门写下一篇文章,整理一下我从网页上搜集的内容。

短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每个更短的段上计算傅里叶变换, 即傅里叶频谱。

实现时, 短时傅里叶变换被计算为一系列加窗数据帧的快速傅里叶变换 (Fast Fourier Transform, FFT),其中窗口随时间 “滑动” (slide) 或“跳跃” (hop) 。

  • 傅立叶变换可以将时间0~t内采集的信号(时域,横轴时间、纵轴大小)分解为不同频率上的信号分量(频域,横轴频率、纵轴大小)。
  • 短时傅立叶采用滑动窗口机制,设定窗口大小和步长,让窗口在时域信号上滑动,分别计算每个窗口的傅立叶变换,形成了不同时间窗口对应的频域信号,拼接起来就成为了频率随时间变化的数据(时频信号)。

如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)_第1张图片

 

你可能感兴趣的:(语音信号处理,语音识别,机器学习,人工智能)