语音基础知识

语音:以给定自然语言所讲的话音模式或模拟这种模式的声学信号。(语言符号的载体)

四要素:音高(声波频率即振动次数)、音强(声波振幅的大小)、音长(声波振动持续的时间长短)、音色(声音的特色和本质)

 

语音信号:特点(1)语音信号的带宽(约5KHz,主要能量集中在低频段)。

(2)典型的随机信号(通常假设语音信号是短时平稳[5-10ms]  内)

语音信号短时谱分析:

通过短时傅里叶谱分析噪音值还原初始语音得到原始语音。

语谱图:分析语音信号的频率。

浊音普:与基音及谐波相对应的谱线。

基  音:

周期:声带振动的周期,与人的声带长度,质量等物理量有关,人的年龄,性别,情绪等生理状态有关。(音高[听觉量]与基音[物理量]的关系如同冷热与温度的关系)

 

语音时域信号的特点:(1清音段:能量低,过零率高,像随机的噪音常与语音的辅音段对应

  (2浊音段:能量高,过零率低,波形具有周期性,所谓的短时平稳性质就处于这个语音浊音段中

  (3)过渡段:指辅音段像元音段信号变化之间的部分,信号变化快,是语音信号处理中最复杂困难的部分

 

声音根据使用范围分为三级:1.电话语音级:300-3.4KHz         11.025KHz

  2.调幅广播级:50-7KHz 采样频率22.05KHz

    3.高保真立体声级:20-20KHz     44.1KHz

 

 

语音信号的数字化:频率(单位时间内振动的次数)约为300-3400Hz。一种模拟信号,为了使用计算机处理必须将它转换成数字编码的形式。

你可能感兴趣的:(语音基础知识)