开课通知 | 《AISHELL-3语音合成实战》课程

语音合成技术

开课通知 | 《AISHELL-3语音合成实战》课程_第1张图片

在多个智能语音技术的学习方向中,语音合成又称文本转换(Text To Speech, 简称TTS)即将文字信息转换成为人类可以听得懂、流利的语音技术。在人机语音交互系统中,语音合成作为最后机器将内容转化为语音的输出环节,做到自然和拟人度高,形成完整的交互体验。语音合成技术的应用落地不仅是文字符号到音频信号的转换,如何像人一样表达意图、清晰的语义、标准的口音等等,让虚拟人变的更真实还需要更多的研究。

开课通知 | 《AISHELL-3语音合成实战》课程_第2张图片

语音合成技术被越来越广泛的应用在人机语音交互中,如通知广播、助盲、语音助手、自动配音、新闻/电子书朗读等等,给我们的生活带来了很多帮助。

开课通知 | 《AISHELL-3语音合成实战》课程_第3张图片

随着音视频的流行,更多的应用场景和个性化产品的出现,定制化的语音合成需求不断增长,满足更高的用户体验和贴合场景的契合度。国内语音合成产业也随着市场的需求从提供语音合成开放平台做标准化服务到个性化服务。

Google的DeepMind研究实验室在2016年公布了WaveNet深度神经网络系统,该系统直接用音频信号的原始波形来建模训练,改变了传统的拼接式和参量改频式语音合成技术,并且生成的语音听起来更自然,在音节、字词的发音、声调上更像人类。WaveNet成为了语音合成技术的全新方式,并且应用到歌声、乐器等声音合成领域。随着产业的应用需求,需要更便捷快速的语音合成技术做支持,Google推出了基于端到端的TTS神经网络模型技术即Tacotron、Tacotron 2声码器。目前成为产学研流行的TTS 模型技术,该模型使用长短期记忆网络(Long Short-Term Memory,LSTM)和利用WaveNet做后处理网络,使得语音合成的语音与真实人的发声更接近。语音合成技术的不断迭代发展,产业应用落地逐渐丰富,语音合成的技术人才需求量呈持续增长趋势。

AI工匠学堂-语音合成课程

学习语音合成技术需要优质的数据资源、调优的算法。为了降低语音合成技术的学习门槛,语音之家-AI工匠学堂推出《AISHELL-3语音合成实战》课程,课程定位是通过简洁的代码实践和讲解来实现从0到1语音合成技术,从理论了解语音合成算法开始,到基于AISHELL-3数据库学习Tacotron 2的使用,最终帮助学员掌握和实现多说话人合成系统的工程。

开课通知 | 《AISHELL-3语音合成实战》课程_第4张图片

AISHELL-3数据库是由AISHELL联合昆山杜克大学语音与多模态智能信息处理实验室共同发布的中文普通话语音数据库,语音时长为85小时88035句,可做多说话人合成系统。数据录制过程在安静室内环境中,218名来自中国不同口音区域的发言人,使用高保真麦克风(44.1kHz,16bit)录制。数据集同步发布在OpenSLR数据共享平台,并且开源了多说话人的语音合成技术方案。

开课通知 | 《AISHELL-3语音合成实战》课程_第5张图片

地址:https://openslr.org/93/

开课通知 | 《AISHELL-3语音合成实战》课程_第6张图片

地址:

https://sos1sos2sixteen.github.io/aishell3/

开课通知 | 《AISHELL-3语音合成实战》课程_第7张图片

《AISHELL-3语音合成实战》课程的主讲讲师史尧即为AISHELL-3开源项目的核心开发者和主要维护者。该课程以理论为辅、实战为主的内容设计。

理论部分从语音合成基本概念,例如拼接语音合成、参数语音合成以及神经网络语音合成三个技术发展阶段的详细介绍,到了解语音合成的声学模型、声码器等重要概念知识。

实践部分从基于Seq2Seq的样例实现,学习数据集处理、端到端声学模型结构、解码器的推理等技术,到基于AISHELL-3数据集做Tacotron 2模型,Pytorch代码的实现,包括注意力模块的代码讲解等。

开课通知 | 《AISHELL-3语音合成实战》课程_第8张图片

想要了解语音合成算法的工程师及在校学生,希望从事语音合成和智能语音研发的小伙伴,可以通过学习这门课程高效全面的掌握语音合成的基本原理和实战方法,降低自己摸索的成本,快速构建出高性能的语音合成系统

讲师力量

开课通知 | 《AISHELL-3语音合成实战》课程_第9张图片

课程目录

第1节:语音合成技术简介

理论课

第2节:Tacotron端到端声学模型

第3节:Seq2Seq模型的实现

代码课

第4节:Tacotron-2的实现

课程必备入门基础

开课通知 | 《AISHELL-3语音合成实战》课程_第10张图片

课程收获

开课通知 | 《AISHELL-3语音合成实战》课程_第11张图片

全套课程服务

  • 怎么上课?在哪上课?

报名后,班主任会引导你按时上课。本门课程采取录播的形式,电脑/手机都能随时看课,同时配有微信学习群,授课教师、助教老师在线答疑解惑。

  • 我可以在任何时间学习课程吗?课程有效期是多久?

课程有效期内,任何时间都可以学习。本门课程有效期为开课后1年,可在有效期内反复学习。

  • 有不懂的地方,是否有专门的老师来提供帮助?

除了授课教师外,本门课还配有班主任及助教老师,班主任会督促引导你按时学习,学习中有不懂的地方助教老师或授课老师在线提供帮助。

  • 答疑课中我的问题一定会被回答到么?

课程学习中,会安排老师做在线答疑课,班主任会提前收集学生提问,答疑课后有问题也可以随时在学习群里提问,有问必答。

  • 怎么进入该课程答疑群?

报名后,由班主任邀请进入本门课程学习群。

  • 课程不满意,可以退款吗?

开课学习7天内不满意可无条件退款。

  • 课程学完后,如果还需要求职帮助,怎么办?

在你学完全部课程后,老师会为你做一份专属的学习情况总结,如果你还有求职需要,可以联系你的班主任问询。

你可能感兴趣的:(AI工匠学堂,人工智能,语音识别,合成)