《数字语音处理》- 实验2. 基于MATLAB分析语音信号频域特征(附代码)

声明
本文仅在CSDN发布,其他均为盗版。请支持正版!

正版链接:
https://blog.csdn.net/meenr/article/details/117629772
基于MATLAB分析语音信号频域特征

实验2 基于MATLAB分析语音信号频域特征

目录

  • 实验2 基于MATLAB分析语音信号频域特征
    • 1 实验目的及要求
    • 2 实验原理
      • 2.1 短时傅立叶变换
      • 2.2 复倒谱和倒谱
      • 2.3 语谱图
      • 2.4 基因周期估计
    • 3 实验结果及分析
      • 3.1 短时谱
      • 3.2 语谱图
      • 3.3 加矩形窗的倒谱和复倒谱
      • 3.4 加汉明窗的倒谱和复倒谱
    • 4 总结分析
    • 实验代码
      • 途径1
      • 途径2

1 实验目的及要求

本实验要求:按所学相关语音处理的得知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的短时谱、倒谱、语谱图的分析结果,并借助频域分析方法检测所分析语音信号的基音周期或共振峰,写出实验报告(按一般科学论文的写作规范)。

2 实验原理

2.1 短时傅立叶变换

由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为:

在这里插入图片描述

(1.1)

其中w(n-m)是实窗口函数序列,n表示某一语音信号帧。令n-m=k’,则得到

在这里插入图片描述
(1.2)

于是可以得到

在这里插入图片描述

(1.3)

假定

在这里插入图片描述
(1.4)

则可以得到

在这里插入图片描述
(1.5)

同样,不同的窗口函数,将得到不同的傅立叶变换式的结果。由上式可见,短时傅立叶变换有两个变量:n和ω,所以它既是时序n的离散函数,又是角频率ω的连续函数。与离散傅立叶变换逼近傅立叶变换一样,如令ω=2πk/N,则得离散的短时傅立叶吧如下:

在这里插入图片描述
(1.6)

2.2 复倒谱和倒谱

复倒谱
在这里插入图片描述
是x(n)的Z变换取对数后的逆Z变换,其表达式如下:
在这里插入图片描述
(1.7)

倒谱c(n)定义为x(n)取Z变换后的幅度对数的逆Z变换,即

在这里插入图片描述
(1.8)

在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。声道系统相当于参数缓慢变化的零极点线性滤波器。这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系:
在这里插入图片描述
(1.9)

由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系:

在这里插入图片描述
(1.10)

2.3 语谱图

语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反。

宽带语谱图可以获得较高的时间分辨率,反映频谱的快速时变过程;窄带语谱图可以获得较高的频率分辨率,反映频谱的精细结构。两者相结合,可以提供与语音特性相关的信息。

2.4 基因周期估计

浊音信号的倒谱中存在峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用倒谱的这个特点,我们可以进行语音的清浊音判决,并且可以估计浊音的基音周期。

3 实验结果及分析

3.1 短时谱

《数字语音处理》- 实验2. 基于MATLAB分析语音信号频域特征(附代码)_第1张图片

图3.1 短时谱

总结分析:

本实验采用长度为256的汉明窗对语音信号进行截断处理,然后对截断后的语音信号进行快速傅里叶变换,为了加大幅频特性的对比度,使其间关系更加明显,我们对振幅取对数并画图。

3.2 语谱图

《数字语音处理》- 实验2. 基于MATLAB分析语音信号频域特征(附代码)_第2张图片

图3.2 语谱图

总结分析:

语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值。被视为可视语言。水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短时谱。语谱图上因其不同的灰度,形成不同的纹路,称之为“声纹”。声纹因人而异,因此可以在司法、安全等场合得到应用。

3.3 加矩形窗的倒谱和复倒谱

《数字语音处理》- 实验2. 基于MATLAB分析语音信号频域特征(附代码)_第3张图片

图3.3 加矩形窗的倒谱和复倒谱

3.4 加汉明窗的倒谱和复倒谱

《数字语音处理》- 实验2. 基于MATLAB分析语音信号频域特征(附代码)_第4张图片

图3.4 加汉明窗的倒谱和复倒谱

4 总结分析

分别用矩形窗和汉明窗对语音信号进行截断处理,然后用cceps函数对短时语音信号求复倒谱、rceps函数对短时语音信号求倒谱,在进行频率的矫正。浊音信号的倒谱中存在着峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用这个特点我们可以进行清浊音的判断,并且可以估计浊音的基音周期

实验代码

感兴趣的或者需要本文实验代码和实验报告的读者可参考下面两种方式获得。

途径1

优先推荐该途径
第一步:扫描下方二维码,或打开微信搜索并关注“ 2贰进制 ”公众号;
第二步:回复相应的内容可获取本文相关资料。
二维码

途径2

扫描下方二维码,加入学习交流QQ群“ 480558240 ”,遇到问题可联系管理员咨询,还能获取包括但不限于本篇内容的更多学习资料。
在这里插入图片描述
2贰进制–Echo 2020年10月
我认同兴趣是最好的老师,但是除了兴趣其次是侮辱,所以如果您觉得本文还不错,请点赞+评论+收藏,要是关注那更是对我极大地羞辱了,您的羞辱便是我前进的动力!
如果本文对你有所帮助,解决了您的困扰,您可以通过赞赏来给予我更大支持:

在这里插入图片描述
此致
感谢您的阅读、点赞、评论、收藏与打赏。

你可能感兴趣的:(MATLAB,#,MATLAB音频处理,matlab,频域,信号处理,数字信号处理,特征值分解)