Python输入音频wav同步嘴型源码方案

这是由ACM MM2020发表了的一篇论文,提出一个AI模型,只需要一段人物视频和一段目标语音,就能够让音频和视频合二为一,人物嘴型与音频完全匹配。

Python输入音频wav同步嘴型源码方案_第1张图片

【订阅栏目 获取全部的源码方案】

选一张蒙娜丽莎的照片和一段简短的音频,就可以让嘴唇同步,这是静态的照片,所以照片中的人物头部没有任何动作,它还能让视频中的人物与输入的音频同步。我们来看一段视频吧。

其实它的应用非常广,比如好莱坞可以用它来制作多国语音的电源,毫无违和感。然后最近流行的虚拟主播,也是广泛的使用嘴型同步。这个源码它就是通过训练模型,然后将wav匹配到不同的嘴型。

先决条件

  • Python 3.6
  • ffmpeg:sudo apt-get install ffmpeg
  • 使用pip install -r requirements.txt.

人脸检测预训练模型应

你可能感兴趣的:(人脸识别生成合成技术源码分享,人工智能实用软件源码工具等分享,计算机视觉,机器学习,人工智能,自然语言处理,神经网络)