【阅读清单】阶段性待读论文

1 ChoreoNet: Towards Music to Dance Synthesis with Choreographic Action Unit

(利用舞蹈动作单元为音乐生成舞蹈(music to dance),没开源,20年9月CVPR,code:[2009.07637] ChoreoNet: Towards Music to Dance Synthesis with Choreographic Action Unit (arxiv.org)

参考:基于舞蹈单元的音乐驱动舞蹈:《ChoreoNet: Towards Music to Dance Synthesis with Choreographic Action Unit》 - 知乎 (zhihu.com)【论文分享】ChoreoNet: 利用舞蹈动作单元为音乐生成舞蹈(music to dance) - 知乎 (zhihu.com))

2 Soundini: Sound-Guided Diffusion for Natural Video Editing

(用于自然视频编辑的声音引导扩散,没开源,23年8月CVPR,效果:Soundini: Sound-Guided Diffusion for Natural Video Editings (kuai-lab.github.io))

3 Dancing to Music

(GAN,开源,分析合成学习框架,从音乐中生成舞蹈,19年11月CVPR)

4 DAVIS: High-Quality Audio-Visual Separation with Generative Diffusion Models

(没开源,基于生成扩散模型的高质量音频-视觉分离。23年7月CVPR)

5 AADiff: Audio-Aligned Video Synthesis with Text-to-Image Diffusion

(基于文本到图像扩散的音频对齐视频合成,没开源,23年5月CVPR)

6 Long-Term Rhythmic Video Soundtracker

(LORIS,长序列视频配乐模型,开源,23年5月)

7 Prompt-to-Prompt Image Editing with Cross Attention Control

(具有交叉注意力控制的提示对提示图像编辑,开源)

8 DreamPose

9 Style-Controllable Speech-Driven Gesture Synthesis Using Normalising Flows

(基于归一化流的风格可控语音驱动手势合成,2020年计算机图形论坛)

你可能感兴趣的:(计算机视觉)