语音驱动表情技术

ASR:automatic speech recognize ,语音识别技术,语音转换为文本

TTS:text to speech ,文本转语音技术

audio2face:音频转表情技术《重点*********》

语音驱动表情技术_第1张图片

其中,audio2face的代表算法有facegood

wav2lip:声音到嘴唇算法

百度安全验证https://baijiahao.baidu.com/s?id=1722621345023280547&wfr=spider&for=pc百度安全验证https://baijiahao.baidu.com/s?id=1722472024679803706&wfr=spider&for=pc

先从最简单的wav2lip研究开始:

嘴型同步模型Wav2Lip_我的个人网站: https://xugaoxiang.com-CSDN博客

ffmpeg工具windows/linux安装离线下载:Builds - CODEX FFMPEG @ gyan.devhttps://github.com/BtbN/FFmpeg-Builds/releases(需要认证,未成功)

 ffmpeg linux版本下载:

Index of /releases

中文的可以使用paddle的预训练wave2lip模型:基于Wav2lip实现精准唇形合成 - 知乎

你可能感兴趣的:(语音识别,人工智能)