多模态大模型:关于RLHF那些事儿

Overview

  • 多模态大模型关于RLHF的代表性文章
    • 一、LLaVA-RLHF
    • 二、RLHF-V
    • 三、SILKIE

多模态大模型关于RLHF的代表性文章

一、LLaVA-RLHF

题目: ALIGNING LARGE MULTIMODAL MODELS WITH FACTUALLY AUGMENTED RLHF
机构:UC伯克利
论文: https://arxiv.org/pdf/2309.14525.pdf
代码:https://llava-rlhf.github.io/
任务:
特点:
方法:
前置相关工作:

二、RLHF-V

题目:RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback
机构:清华,新加坡国立
论文ÿ

你可能感兴趣的:(多模态大模型,计算机视觉,论文阅读,多模态大模型,AIGC,RLHF)