1-5 语音识别 (笔记)

语音识别(笔记)

自动语音识别的定义:
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
语音识别只有一个核心任务:
搜狗百科

将人类的语音转成文字

语言由单词组成

单词由音素组成

机器要做的就是:

1. 将一段声波按帧切开

2. 用帧组成状态

3. 用状态组成音素

4. 再将音素合成单词

语音就变成了文字

graph LR
语音识别应用-->声纹识别
语音识别应用-->语音合成
声纹识别-->智能音箱
语音合成-->智能音箱
声纹识别-->车载设备
语音合成-->车载设备

声纹识别:即识别说话者是谁

语音合成:即将文字信转换成人类听得懂的语音


影响语音识别的原因很简单

口音、距离、噪音都会影响语音识别的准确度

最好选个安静的环境

视频链接

你可能感兴趣的:(人工智能,神经网络,机器学习,深度学习)