Referring Expression Comprehension(REC)任务介绍以及相关数据集
ReferringExpressionComprehension(REC),即指称表达理解,任务是根据文本描述框出文本中提到的一个特定目标相关数据集:是三个从MSCOCO中选取图像得到的数据集,数据集中对所有的phrase都有bbox的标注RefCOCO有19,994幅图像,包含142,210个引用表达式,包含50,000个对象实例。RefCOCO+共有19,992幅图像,包含49,856个对象实