MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based VQA 论文阅读 From CVPR 2022
MuKEA:基于视觉问答(VQA)的多模态知识抽取与积累论文下载:https://arxiv.org/abs/2203.09138github代码:https://github.com/AndersonStra/MuKEA一、研究背景结合外部知识的VQA任务(KnowledgebasedVQA)需要AI能够利用到超出输入图像、问题之外的额外知识。近年来,尽管一些KB-VQA的方法取得了一定成果,但