多模态大模型:关于Better Captions那些事儿

Overview

  • Better Captions are important for LMM training
    • 一、ShareGPT4V
      • 1.1、Motivation
      • 1.2、ShareGPT4V数据集构建
      • 1.3、ShareGPT4V-7B模型
    • 二、CAPSFUSION
      • 2.1、Motivation
      • 2.2、CAPsFUSION方法与数据集
      • 2.3、结果
        • 2.3.1、Model Performance
        • 2.3.2、Sample Efficiency

你可能感兴趣的:(多模态大模型,论文阅读,人工智能,AIGC,计算机视觉)