标题:精心选择知识解决开卷问答
作者: Pratyay Banerjee, Chitta Baral
备注:Accepted to ACL 2019
链接:https://arxiv.org/abs/1907.10738
构建开卷问答数据集
感觉扩充了以往阅读理解的文章的大小,同时,涉及一个各个文章知识的结合,或者不可回答的问题???
标题:IPRE:一个用于人际关系抽取的数据集
作者: Haitao Wang, Min Zhang
链接:https://arxiv.org/abs/1907.12801
标题:龙舌兰:知识库上的时间问答
作者: Zhen Jia, Gerhard Weikum
备注:CIKM 2018
链接:https://arxiv.org/abs/1908.03650
应该是构建了一个数据集吧,还构建了模型,构建数据集不确定,主要针对问题涉及到时间维度的回答
标题:为什么视觉问题有不同的答案?
作者: Nilavra Bhattacharya, Danna Gurari
链接:https://arxiv.org/abs/1908.04342
视觉问答数据集,分析引起不同回答的原因
标题:推理驱动的自然语言理解问答
作者: Daniel Khashabi
链接:https://arxiv.org/abs/1908.04926
博士论文:问答。创建了两个自然语言问题数据集,其中(i)第一个需要推理多个句子; (ii)第二个需要时间常识推理
标题:语境中的争议
作者: Benjamin Sznajder, Noam Slonim
链接:https://arxiv.org/abs/1908.07491
标题:通用反驳数据集
作者: Matan Orbach, Noam Slonim
备注:EMNLP 2019
链接:https://arxiv.org/abs/1909.00393
标题:基于旅游数据的大规模问答
作者: Danish Contractor, Parag Singla
链接:https://arxiv.org/abs/1909.03527
我们收集了一份QA数据集,其中包含48,147个段落大小的真实用户问题,这些问题来自寻求酒店,景点和餐馆推荐的旅行者。每个候选答案都与一组非结构化评论相关联
标题:用于学习干预在线仇恨言论的基准数据集
作者: Jing Qian, William Yang Wang
链接:https://arxiv.org/abs/1909.04251
标题:WIQA:针对程序文本的“假设......”的数据集
作者: Niket Tandon, Peter Clark
备注:Accepted at EMNLP 2019
链接:https://arxiv.org/abs/1909.04739
标题:PubMedQA:生物医学研究问题解答的数据集
作者: Qiao Jin, Xinghua Lu
备注:EMNLP 2019
链接:https://arxiv.org/abs/1909.06146
MinWikiSplit: A Sentence Splitting Corpus with Minimal Propositions
标题:MinWikiSplit:一种具有最小命题的句子切分语料库
作者: Christina Niklaus, Siegfried Handschuh
链接:https://arxiv.org/abs/1909.12131
BillSum: A Corpus for Automatic Summarization of US Legislation
标题:BillSum:美国立法自动摘要语料库
作者: Anastassia Kornilova, Vlad Eidelman
链接:https://arxiv.org/abs/1910.00523
BHAAV- A Text Corpus for Emotion Analysis from Hindi Stories
标题:BHAAV-一个用于印地语故事情感分析的文本语料库
作者: Yaman Kumar, Debanjan Mahata
链接:https://arxiv.org/abs/1910.04073
Aff-Wild Database and AffWildNet
标题:AFF-Wild数据库和AffWildNet
作者: Mengyao Liu, Dimitrios Kollias
链接:https://arxiv.org/abs/1910.05318
面部表情情感数据集,以效价与唤醒作为标注,目前最大面部表情情感数据集
Building Dynamic Knowledge Graphs from Text-based Games
标题:基于文本游戏的动态知识图构建
作者: Mikulas Zelinka, Xingdi Yuan
备注:NeurIPS 2019, Graph Representation Learning(GRL) Workshop
链接:https://arxiv.org/abs/1910.09532
IPOD: Corpus of 190,000 Industrial Occupations
标题:iPod:190,000个工业职业的语料库
作者: Junhua Liu, Chu Guo
链接:https://arxiv.org/abs/1910.10495
Emotion Generation and Recognition: A StarGAN Approach
标题:情绪产生和识别:StarGAN方法
作者: Aritra Banerjee, Dimitrios Kollias
链接:https://arxiv.org/abs/1910.11090
DENS: A Dataset for Multi-class Emotion Analysis
标题:Denses:一个用于多类情绪分析的数据集
作者: Chen Liu, Anderson de Andrade
备注:Accepted to EMNLP 2019
链接:https://arxiv.org/abs/1910.11769
多分类情感数据集
ViGGO: A Video Game Corpus for Data-To-Text Generation in Open-Domain Conversation
标题:Viggo:用于开放领域对话中数据到文本生成的视频游戏语料库
作者: Juraj Juraska, Marilyn Walker
备注:Accepted to INLG 2019
链接:https://arxiv.org/abs/1910.12129
Seq2Emo for Multi-label Emotion Classification Based on Latent Variable Chains Transformation
标题:基于潜变量链变换的Seq2Emo多标签情感分类
作者: Chenyang Huang, Osmar R. Zaïane
链接:https://arxiv.org/abs/1911.02147
新搜集了一份最大的数据集
iSarcasm: A Dataset of Intended Sarcasm
标题:iSarcasm:有意讽刺的数据集
作者: Silviu Oprea, Walid Magdy
链接:https://arxiv.org/abs/1911.03123
Scaling Robot Supervision to Hundreds of Hours with RoboTurk: Robotic Manipulation Dataset through Human Reasoning and Dexterity
标题:使用RoboTurk将机器人监控扩展到数百小时:通过人类推理和灵巧度的机器人操作数据集
作者: Ajay Mandlekar, Li Fei-Fei
备注:Published at IROS 2019
链接:https://arxiv.org/abs/1911.04052
An Annotation Scheme of A Large-scale Multi-party Dialogues Dataset for Discourse Parsin