VisionLLaMA: A Unified LLaMA Interface for Vision Tasks
VisionLLaMA:AUnifiedLLaMAInterfaceforVisionTasks相关链接:arxivgithub关键字:VisionLLaMA、visiontransformers、imagegeneration、imageclassification、semanticsegmentation摘要大型语言模型(LLMs)通常基于Transformer架构来处理文本输入。例如,LLa