说话人识别的主要方法(一)——与文本有关的识别方法

由于识别对象的不同,三大类说话人识别系统(与文本有关、与文本无关、文本提示型)在实现方法上有很大差异

与文本有关的识别方法:

在与文本有关的说话人识别中,由于文本内容已知,识别时可以同时利用语音信号中的语义信息和说话人特征,即使利用较短的语料,也能从中提取出较稳定的说话人特征。

与文本有关的说话人识别方法与语音识别的方法很相似,最常用的也是基于DTW的方法和基于HMM的方法。

以基于HMM的说话人识别系统为例来说明其应用过程:

系统分为两个阶段:训练阶段与识别阶段

训练阶段:针对各使用者对规定语句或关键词的发音进行特征分析,提取说话人语音特征矢量的时间序列。然后利用从左到右HMM建立这些时间序列的声学模型。

识别阶段:先和训练阶段一样,从输入语音信号中提取特征矢量的时间序列,然后利用HMM,计算该输入序列的生成概率,并且根据一定的相似性准则来判定识别结果。

你可能感兴趣的:(语音识别,说话人识别,声纹识别)