论文阅读笔记——Nexus-Gen: A Unified Model for Image Understanding, Generation, and Editing
Nexus-Gen论文Nexus-Gen采用预测图像嵌入作为中间条件,链接自回归模型和扩散模型,通过预填充自回归避免嵌入误差传播,突破传统外界LLM因条件压缩导致信息丢失,提高理解生成模型在理解任务和生成任务上的性能表现。传统的图像生成任务往往局限于Text-to-Image场景,模型侧重于图像质量或局部内容填充。而Nexus-Gen的架构设计突破了这一范式,不仅具备高质量图像生成能力,还可以执行