【读书节福利】机器阅读理解资料集合 + 送书

写在前面

最近半个月排除万难,带着两只猫从浙江到上海到北京,居家隔离14天后已经入职快一周了。刚入职要学习适应的东西还是挺多的,所以小破号更新的频率会没以前那么高,还希望大家理解哈。

说正事,本来今天是没有发文计划的,服务器上代码还bug满天呢。但是!今天是读书节呀,总得搞点什么事情…于是给大家准备了一些福利,感谢对小破号的支持!(虽然有些粉丝还不知道我是男生,也原谅你们啦

机器阅读理解方向资料

整理自知乎用户@故事尾音和@虹猫少侠

论文

  • 《Neural Reading Comprehension and Beyond》,斯坦福陈丹琦博士论文,对2019年初之前的机器阅读理解进行了很好的总结,特别要注意论文是如何对机器阅读进行数学化描述的,还有文章中提到的机器阅读理解数据集以及模型,都应该好好看一下。
  • 《Neural Machine Reading Comprehension: Methods and Trends》国防科技大学的一篇文章,主要介绍了机器阅读理解研究的现状、发展和新趋势。
  • THUNLP组在github开源的机器阅读理解论文大列表,Must-read papers on Machine Reading Comprehension,大约有80篇论文,从最开始2014年左右的Memory networks、Attention Sum Reader Network等到2018年的BERT都有总结。
  • 一份融入外部知识的阅读理解论文大列表,Papers on Knowledge-based Machine Reading Comprehension

中文机器阅读理解竞赛

  • CMRC 2019/2018/2017
    CMRC 2019也是首次公布了类似英语考试阅读理解“7选5”类型的阅读理解数据集。
  • DuReader 2.0/1.0
    中文类型的开放领域QA数据集。
  • 成语阅读理解大赛
    ChID: A Large-scale Chinese IDiom Dataset for Cloze Test 首次提出了中文成语阅读理解数据集。
  • 莱斯杯:全国第二届“军事智能机器阅读”挑战赛
    目前公开的首个带推理类型的中文机器阅读理解数据集。
  • 法研杯CAIL2019
    SQuAD 2.0类型的中文机器阅读理解数据集。

开源项目

  • CDQA:端到端的close domain QA system,基于huggingface的transformers库;还有一个标注工具,cdQA-annotator
  • Haystack,这个在我们之前的中也有介绍;
  • 搜狗的机器阅读理解框架
  • AllenNLP的机器阅读理解框架
  • 中文机器阅读理解数据集
  • RCZoo:基于Pytorch

送书环节

如果上面的资料还不够过瘾,那我们来点刺激的,直接送书!联合了【机械工业出版社华章公司】为大家带来3本正版新书,书名就叫《机器阅读理解》,作者是斯坦福计算机博士,微软自然语言处理高级研究员,从自然语言处理的基础入手,介绍机器阅读理解的任务和模型架构,剖析机器阅读理解支撑技术、模型架构、前沿算法、模型等。
【读书节福利】机器阅读理解资料集合 + 送书_第1张图片
怎么参与呢?大家可以在NewBeeNLP公众号留言谈谈『自己与NLP的故事』,我们会依据留言质量和点赞数两方面综合考虑,最后选出三位粉丝各送一本正版《机器阅读理解》新书,注意截止至4月24日17点前噢!

没中奖的同学也可以等下次,或者直接点击链接购买。本次是小破号第一次送书活动,以后还会有各种福利,呼朋唤友来关注吧!

你可能感兴趣的:(【读书节福利】机器阅读理解资料集合 + 送书)