语音识别的架构

语音识别的架构

语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。

可以看下方的架构图。

 

语音识别的架构_第1张图片Speech,原始语音信号

Feature Extraction,特征抽取,由原始的语音得到语音向量。

Acoustic Model、Language Model、Pronunciation Dictionary,使用声学模型和、字典、语言模型对语音向量进行解码。

特征提取、模型和搜索算法三部分构成了一个语音识别系统。也可以看这个图。语音识别的架构_第2张图片从AI的架构来理解,就是:

语音识别的架构_第3张图片

基础层:语音信号的采集、降噪等预处理

技术层:语音的特征提取、声学模型训练、解码搜索、语言模型训练

应用层:识别结果输出

 

 

 

 

 

你可能感兴趣的:(AI&Tensorflow)