cs224u 自然语言推理:任务和数据集-2

cs224u 自然语言推理:任务和数据集-2 nli_01_task_and_data.ipynb

__author__ = "Christopher Potts"
__version__ = "CS224u, Stanford, Fall 2020"

目录

    • MultiNLI 属性
    • SNLI 和 MultiNLI

MultiNLI 属性

  • 五种类型的训练:

    • 小说:创作于1912-2010年,跨越多种体裁
    • 政府:来自政府网站的报告、信件、演讲等
    • The Slate website
    • 电话:总机语料库
    • 旅游:Berlitz旅游指南
  • 额外的类型只是为了开发和测试(不匹配的条件):

    • 9/11的报告
    • 《面对面:夏洛特叙事与对话集》
    • 筹款信
    • 非小说,牛津大学出版社
    • 关于语言学的逐字逐句的文章
  • 392702个训练集数据;20K验证集;20K测试集

  • 19,647个示例由另外四个注释器验证

    • 58.2% exampl

你可能感兴趣的:(cs224u 自然语言推理:任务和数据集-2)