Referring Expression Comprehension(REC)任务介绍以及相关数据集

  1. Referring Expression Comprehension(REC),即指称表达理解,任务是根据文本描述框出文本中提到的一个特定目标
  2. 相关数据集:
    是三个从 MSCOCO 中选取图像得到的数据集,数据集中对所有的 phrase 都有 bbox 的标注
    RefCOCO 有19,994幅图像,包含142,210个引用表达式,包含50,000个对象实例。
    RefCOCO+ 共有19,992幅图像,包含 49,856 个对象实例的 141,564 个引用表达式。
    Ref COCOg 有25,799幅图像,指称表达式 95,010 个,对象实例 49,822个。

注意,一个表达式只对应一个目标,也就是说一次只会检测出一个目标(也就是一个实例,一个框,会精确到实例),这个和常规的目标检测任务(会检测出所有类别的目标,只精确到类别)是不一样的

REC任务论文:
数据集的标注下载链接:
REC数据集标注

你可能感兴趣的:(人工智能)