【论文阅读笔记】InstructDiffusion: A Generalist Modeling Interface for Vision Tasks
LeveragingImage-TextDiffusionModelsforHigh-Fidelity3DAvatarGeneration论文阅读笔记论文信息引言动机挑战方法结果关键发现相关工作1.视觉语言基础模型2.视觉通用模型方法/模型视觉任务的统一说明训练数据构建网络结构实验设计关键点检测分割图像增强图像编辑复杂指令与简单指令多任务学习质量调整的重