Understanding and Constructing Latent Modality Structures in Multi-Modal Representation Learning

以下是可以作为分类标准的四个特征:

1. 数据模式。数据模式是指用于训练模型的数据类型。在本例中,数据可以是视觉、文本或视觉和语言。

  • 视觉:这意味着模型仅在图像上进行训练。模型学习以捕捉其视觉内容的方式表示图像。
  • 文本:这意味着模型仅在文本上进行训练。模型学习以捕捉其含义的方式表示文本。
  • 视觉和语言:这意味着模型在图像和文本上进行训练。模型学习以捕捉其含义及其相互关系的方式表示图像和文本。

2. 学习目标。学习目标是指训练过程的目标。在本例中,学习目标可以是监督或无监督。

  • 监督:这意味着模型是在带有正确答案的数据上

你可能感兴趣的:(人工智能,深度学习,机器学习,pip,计算机视觉,算法,学习)