语音信号处理基础(一)

#语音信号处理基础(一)

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。

##语音基本声学特性
语音是发声器官发出的一种声波,具有一定音色,音调,音强和音长。
音色:即音质,是一种声音区别另一种声音的基本特性;
音调:声音的高低,取决于声波的频率;
音强:声音的强弱,由声波的振动幅度决定;
音长:取决于发音时间的长短。

##音节
说话时一次发出的,具有一个响亮的中心,并被明显的感觉到的语音片段叫音节。一个音节由一个音素或几个音素构成,音素是语音发音的最小单位,任何语言都有语音的元音(vowel)和辅音(Consonant)。
元音构成一个音节的主干,无论从长度还是能量看,元音在音节中都占主要部分,辅音则只出现在音节的前端或后端或前后两端,时长和能量相对都很小。

###元音
元音是当声带振动发出的声音从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过产生的音。
决定元音音色的主要因素是舌头的形状及其在口腔中的位置和嘴唇的形状等,元音的一个重要特性是共振峰(Formant),声道可以看成是一个根具有非均匀截面的声管,在发音时起共鸣器的作用,当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或共振峰。

###辅音
辅音包含了浊音和清音。
辅音是呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素为辅音。发辅音时由声带是否振动引起浊音和清音的区别,振动的是浊音,不振动的是清音。
辅音:辅音没有明确的共振峰结构,分为以下几类:
(1)塞音又称爆破音:如普通话中[p]、[t]、[k]、[b]、[d]、[g]。
(2)摩擦音:如[f]、[s]、[sh]、[x]、[h]。
(3)塞擦音:如[z]、[zh]。
(4)鼻音:如[m]、[n]。
(5)边音:舌尖形成阻碍不让气流通过,但舌尖两边有空隙能让气流通过的音,如[l]。
(6)颤音:如[ra]、[r]。
(7)通音,又为半元音或半辅音:通音一般是浊音,性质接近元音,如[w]、[y]。

你可能感兴趣的:(语音处理)