语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。
可以看下方的架构图。
Feature Extraction,特征抽取,由原始的语音得到语音向量。
Acoustic Model、Language Model、Pronunciation Dictionary,使用声学模型和、字典、语言模型对语音向量进行解码。
特征提取、模型和搜索算法三部分构成了一个语音识别系统。也可以看这个图。从AI的架构来理解,就是:
基础层:语音信号的采集、降噪等预处理
技术层:语音的特征提取、声学模型训练、解码搜索、语言模型训练
应用层:识别结果输出