text-to-video generation(T2V)数据集

各个论文用到的主要数据集

  • MSR-VTT
  • KTH
  • MSVD(Youtube2Text)
  • Kinetic(较难获取)
  • UCF-101
  • VaTEX(Video and TEXt)

Dataset Target task Examples Sentences
MSR-VTT video caption 10000(20 classes) ~20
KTH T2V 2391 -
MSVD video classification 1970 40
Kinetic video class

你可能感兴趣的:(深度学习,深度学习)