图文检索(1):Rethinking Benchmarks for Cross-modal Image-text Retrieval
RethinkingBenchmarksforCross-modalImage-textRetrieval摘要1引言2相关工作2.1Image-Textretrieval2.2Image-TextDatasets3方法3.1更新图像候选池3.1.1准备候选图像3.1.2搜索相似的图像3.1.3组装相似的图像集3.2对粗粒度文本进行翻新3.2.1找到粗粒度的文本3.2.2提示生成细节3.2.3合并新