blip2:Bootstrapping lanuage-image pre-training with frozen image encoders and large lanuage models
中文BLIP2https://modelscope.cn/models/xiajinpeng123/BLIP2-Chinese/summaryBLIP-2:多模态与大模型结合的基础范式-知乎写在前面:本人是一名小红书算法工程师,主要在小红书做多模态内容理解相关的工作,关注多模态相关的工作很多年了,个人认为多模态步入快速发展是从VisualBert这项工作开始的,VisualBert将图像的关键目标