(十一):多模态深度学习综述

文献阅读(十一):多模态深度学习综述

  • 摘要
  • 引言
  • 1. 模态表示
    • 1.1 单模态表示(语句模态表示、视觉模态表示)
  • 2. 模态传译
  • 3. 模态融合
  • 4. 模态对齐
    • 4.1 注意力对齐
    • 4.2 语义对齐
  • 5. 实际多模态系统——应用
  • 6. 国内外多模态深度学习公用数据集
  • 7. 多模态深度学习的发展方向
  • 8. 结束语

摘要

多模态深度学习实现过程中的共有问题分为:
模态表示、模态传译、模态融合和模态对齐四类,并对各类问题进行子分类和论述,同时列举了为解决各类问题产生的神经网络模型。最后论述了实际多模态系统、多模态深度学习研究中常用的数据集和评判标准,并展望了多模态深度学习的发展趋势。

引言

多模态是指两个或者两个以上模态各种形式的组合。
多模态研究分为四个发展时期,即人类行为多模态研究、多模态计算机处理研究、多模态互动研究和多模态深度学习研究。

你可能感兴趣的:((十一):多模态深度学习综述)