NLP 01

NLP 01_第1张图片

1.课程目标:
NLP 01_第2张图片
语音:1sec有16K sample point.
每个sample point 有256个possible value.
同一段话都不可能有相同的声音信号。
Text(文本)

语音->文字:语音辨识 Speech Recognition
文字->语音:语音合成 Text-to-Speech Synthesis
语音->语音:
语音->类别:
文字->文字:
文字->类别:

2.DL模型硬train一发

3.automatic speech recognition(ASR)语音->文字
NLP 01_第3张图片

4.文本->语音:语音合成问题。

5.语音->语音
①speech Separation:
鸡尾酒会效应:不论有多少人说话,哪怕我面前几个人说话的声音大小都比较像,我依然能听到我想听到的那个人的声音,并与之交流,
NLP 01_第4张图片

②Voice conversion:输入一段声音把它转成另外一个人的声音
NLP 01_第5张图片NLP 01_第6张图片
以上做法不行。需要同时获取AB的声音,念一样的句子,该做法可能存在无法获取另一个人的声音。

能不能只听过A的语音,不需要B的语音,不需要说同样的语言。
NLP 01_第7张图片
A提供一句语音C(中文),B提供另一句语音D(日语),实验结果:A以日文讲出一句话D,B以中文说讲出一句话C
NLP 01_第8张图片

6.声音->类别:

NLP 01_第9张图片
应用:1.识别是哪个人讲话。
2.关键词有无:其中最常见是唤醒词(wake up words)技术:Alexa,Siri
比如小爱,难道要时时刻刻让小爱获取环境中的声音,这显然太浪费了。(除了考虑准确率问题,还要求省电、压缩模型)

7.文本–>XXX
bert义军凸起:
NLP 01_第10张图片
模型参数量逐渐增大:
NLP 01_第11张图片
NLP 01_第12张图片
NLP 01_第13张图片

8.Text Generation:
句子怎样生成效果更加好,是rnn的按顺序生成,还是中心词 dream。
NLP 01_第14张图片

9.文本->文本:
应用:翻译、摘要、聊天机器人(输入一句话,输出回答)、问题回答(输入问题和文章,输出答案)
NLP 01_第15张图片
文法剖析(很多问题可以转化成输入一段文字,输出一段文字)
文法剖析树用一段文字来表示,再用输入文字输出文字的方法(比如Seq2Seq的方法)
NLP 01_第16张图片

10.meta learning = learn to learn
让机器去学习如何去学习。
NLP 01_第17张图片
NLP 01_第18张图片
不同风格间的语音转换
不同风格间的文字转化

11.Adversarial attack:


12、Explainable AI
NLP 01_第19张图片

你可能感兴趣的:(NLP,自然语言处理,语音识别,人工智能)