图片速览 GroupViT: Semantic Segmentation Emerges from Text Supervision
loss函数包含两部分image-textloss+multi-labelcontrastivelosswithtextprompting推理阶段以下为更多参考与解释传统的分割方法经常使用聚类的处理(grouup),这里也采用了一个GroupingBlockpapercode相关2022CVPRhttps://arxiv.org/abs/2202.11094https://github.com/N