语音信号处理(赵力)作业答案1-3章

第一章 语音信号处理的基础知识

  1. 根据发音器官和语音产生机理,语音生成系统可分成哪几个部分?各有什么特点?
    答:根据发音器官和语音产生机理,语音生成系统可分成:
    (1)激励系统:在声门以下,负责产生激励振动,浊音激励是以基音周期为周期的三角脉冲串,具有二阶低通滤波特性,清音激励为随机白噪声;
    (2)声道系统:从声门到嘴唇的呼吸通道,具有谐振特性;
    (3)辐射系统:语音从嘴唇辐射出去,具有一阶高通特性。
  2. 什么是音高?与频率的关系如何?
    答:以Hz为单位所测得的物理量为频率,在听者来说感知为心理量,称为音高,即用人的主观感受来评价所听到的声音是高调还是低调。
    音高随频率的增加而提高。
  3. 在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?
    答:预处理也叫作前端处理,在特征提取之前先对原始语音进行处理,使处理后的信号更能满足实际需要,对提高处理精确度有重要意义。
    预处理包括预加重、加窗和分帧。

第二章 语音信号分析

  1. 短时能量(短时平均幅度值)和短时过零率的定义是什么?这两种时域参数的用途有哪些?窗口函数的长度和形状对它们有什么影响?常用的有哪几种窗口?
    答:(1) 短时能量定义为帧语音信号的幅度值平方和。短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。
    (2) 短时能量和短时平均幅度函数的主要用途有:
    ① 可以区分浊音段和清音段,因为浊音时短时能量值比清音时大得多;
    ② 可以用来区分声母与韵母的分界,无声与有声的分界,连字的分界等;
    ③ 可作为一种超音段信息,用于语音识别中。
    短时过零率的主要用途有:
    ① 区分清/浊音:浊音具有较低的过零率;清音具有较高的过零率
    ② 从背景噪声中找出是否有语音,以及语音的起点。
    (3) 窗口的形状不同,将使得时域分析参数的短时平均能量的平均结果不同。
    窗口的长度如果过长,就等效于很窄的低通滤波器,语音信号通过时,反映波形细节的高频部分被阻碍,短时能量随时间变化很小,不能真实地反映语音信号的幅度变化;反之,窗长过小,滤波器的通带变宽,短时能量随时间有急剧的变化,不能得到平滑的能量函数。
    (4) 常用的窗口:汉明窗、矩形窗。

  2. 短时自相关函数和短时平均幅差函数的定义及其用途是什么? 在选择窗口函数时应考虑什么问题?
    答:
    语音信号处理(赵力)作业答案1-3章_第1张图片

  3. 什么是复倒谱? 什么是倒谱? 已知复倒谱怎样求倒谱? 已知倒谱怎样求复倒谱? 有什么条件限制?
    答:语音信号的对数频谱的傅里叶逆变换称作它的复倒谱。
    语音信号的对数幅度谱的傅里叶逆变换称作它的倒谱。
    已知复倒谱可由复倒谱的偶对称分量得到倒谱。由复倒谱可以反推回倒谱的计算表达式。(将计算的详细过程写出也算正确,具体过程,书第69-70页)
    要让一个语音信号的复倒谱序列是因果稳定序列,需要这个语音信号是最小相位序列。

第三章 语音信号特征提取技术

  1. 为什么要进行端点检测?端点检测容易受什么因素影响?
    答:端点检测可以从一段语音信号中准确地找出语音信号的起始点和结束点,使有效的语音信号和无用的噪声信号得以分离。端点检测容易受到噪声、阈值、模型参数等因素的影响。
  2. 什么叫基音和声调,它们对汉语语音处理有何重要意义?常用的基音周期检测方法有哪些?叙述它们的工作原理。
    答:基音是指发浊音时声带振动所引起的周期性。基音的变化模式成为声调。对于汉语语音而言,它携带非常重要的具有辨意作用的信息。

常用的基音周期检测方法有:
(1) 自相关法:浊音信号的自相关函数在基音周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值,因此检测是否有峰值可判断清音或浊音,检测峰值的位置可提取基音周期。
(2) 平均幅度差函数法:平均幅度差函数也呈现与浊音周期相一致的周期特性,在周期的各个整数倍上具有谷值特性,可通过检测全局最低谷点来确定基音周期。
(3) 倒谱法:可以直接在倒谱域中根据倒谱的基音峰进行检测;也可以采用倒滤波的方法分离出激励信息,并用逆特征系统将其变换回到时域中再进行检测。
(4) 简化滤波法:先对语音信号进行LPC分析和逆滤波,获得语音信号的预测残差,然后将残差信号通过自相关滤波器滤波,再作峰值检测,进而获得基音周期。

  1. 为什么共振峰检测有重要意义?常用的共振峰检测方法有哪些?叙述它们的工作原理。
    答:共振峰是区别不同韵母的重要参数。

常用的共振峰方法有:
(1) 带通滤波器组法:滤波器中心频率按对数规律递增分布在分析频段上,获得类似于人耳的频率分辨特性,在低频段间距小,高频段间距大,带宽也随之增加。滤波器输出经全波整流而用于提供频谱包络估值。辨识逻辑用于对适当频率范围内的峰值进行辨识而获得前三个共振峰。
(2) 倒谱法:采用倒谱的对数运算和二次变换将基音谐波和声道的频谱包络分离开来,用低时窗从语音信号倒谱中截取出声道响应,经DFT得到声道的离散谱曲线,从而得到共振峰参数。
(3) 线性预测法:用线性预测对语音信号进行解卷,即把激励分量归入预测残差中,得到声道响应的全极模型的分量,求出声道响应分量的谱峰,就可以求出共振峰。

你可能感兴趣的:(语音处理)