课程概述——李宏毅人类语言处理笔记2

课程概述——李宏毅人类语言处理笔记2_第1张图片
输出一段文字,我们将其想成是N个token,其中token有V种。

输出的部分:

Token

音素(phoneme),需要有语言学知识,来标出对应词典
课程概述——李宏毅人类语言处理笔记2_第2张图片
书写的基本单位,不需要lexicon,使用Graphme风险较大。

课程概述——李宏毅人类语言处理笔记2_第3张图片
课程概述——李宏毅人类语言处理笔记2_第4张图片
语素(Morpheme)
课程概述——李宏毅人类语言处理笔记2_第5张图片
课程概述——李宏毅人类语言处理笔记2_第6张图片
课程概述——李宏毅人类语言处理笔记2_第7张图片
课程概述——李宏毅人类语言处理笔记2_第8张图片

输入的部分:

课程概述——李宏毅人类语言处理笔记2_第9张图片
课程概述——李宏毅人类语言处理笔记2_第10张图片
课程概述——李宏毅人类语言处理笔记2_第11张图片
我们需要多少资料才足够训练一个语音辨识的系统?
课程概述——李宏毅人类语言处理笔记2_第12张图片
课程概述——李宏毅人类语言处理笔记2_第13张图片
课程概述——李宏毅人类语言处理笔记2_第14张图片
课程概述——李宏毅人类语言处理笔记2_第15张图片

你可能感兴趣的:(李宏毅人类语言处理,语音识别,nlp)