yinizhilianlove

「自然语言处理(NLP)」ACL && 阿里（舆论、立场检测）&& 耶鲁（电子邮件主题生成）

来源：AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-8-24

引言

本次为大家推荐两篇文章，第一篇是阿里巴巴团队提出的用于谣言检测和立场分类的多任务学习方法；第二篇耶鲁大学主要研究了电子邮件主题的生成，提出了一种新的电子邮件主题生成模型。

PS：欢迎关注AINLPer微信公众号，论文解读会每日更新，等你来看。

First Blood

TILE: Rumor Detection By Exploiting User Credibility Information, Attention and Multi-task Learning
Contributor : 阿里巴巴（美国团队）
Paper: https://www.aclweb.org/anthology/P19-1113
Code: None

文章摘要

提出一种新的多任务学习方法用于谣言检测和立场分类任务。该神经网络模型具有一个共享层和两个任务特定层。将用户可信度信息纳入谣言检测层，并将注意机制应用于谣言检测过程中。注意力信息不仅包括谣言检测层的隐藏状态，还包括立场检测层的隐藏状态。在两个数据集上的实验表明，本文提出的模型优于目前最先进的谣言检测方法

模型方法介绍

多任务网络结构

下图为我们提出的多任务学习高层网络结构。中间层是一个共享层，由两个任务共享。这一层是通过共享参数提取这两个任务之间的公共模式。上层用于立场检测，下层用于谣言的特定特征。在这个图中，我们假设这些帖子是推文，并将在下面的小节中使用推文作为示例。两个任务特定层的输入是claim(谣言、线程)分支。以下图2中的谣言传播路径为例，这个谣言传播路径有四个分支，每个分支都有一个输入序列 $x_1, x_2，…，x_n]$ ，输入到两个任务特定的层中。 $x_1$ 是源推文)， $x_n$ 是分支中的最后一条推文。

立场（SDQC）检测层

如图1所示，立场检测层使用标准的LSTM模型。输入 $x_i$ 是两种类型的特性的串联:推文嵌入(TE)和推文特性嵌入(FE)。其中TE是通过一个基于注意力的LSTM网络生成。FE是使用(Kochkina et al.， 2017)中描述的相同的特性列表生成的。

谣言验证层

图1的低层显示了谣言验证流程的结构。在每个步骤中，输入 $x_i$ 由两个向量表示:推文嵌入(TE)和用户信息嵌入(UE)。UE代表用户可信度信息。
用户置信度信息： 我们从用户档案中获取可信度信息。我们使用(Liu et al.， 2015)中描述的特性来获得这些信息。一些特征示例包括：验证帐户、配置文件是否包含位置、配置文件是否具有描述等。将这些信息进行处理并连接在一起作为UE嵌入，然后UE与TE连接作为输入。
基于注意力的LSTM： 我们使用一个基于注意力的LSTM来对重要的推文给予更多的关注。对每一步i，来自上层的隐藏状态和来自下层的隐藏状态实际上被连接在一起并一起处理。

实验结果

在RumorEval数据集上，谣言验证结果对比在PHEME数据集上，谣言验证结果对比

Double Kill

TILE: This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation.
Contributor : Yale University（耶鲁大学）
**Paper:**https://www.aclweb.org/anthology/P19-1043
**Code:**None

文章摘要

提出并研究了电子邮件主题行生成任务:从电子邮件正文中自动生成电子邮件主题行。我们为这个任务创建了第一个数据集，并发现电子邮件主题行生成非常抽象，这与新闻标题生成或新闻单个文档摘要不同。然后，我们开发了一种新的深度学习方法，并将其与几种基线以及最新的最先进的文本摘要系统进行了比较。我们还研究了几种基于人类判断相关性的自动评价指标的有效性，并提出了一种新的自动评价指标。

本文三大看点

1、介绍了电子邮件主题行生成(SLG)的任务，并建立了一个基准数据集AESLC.1
2、研究了SLG自动度量的可能性，并研究了它们与人类判断的相关性。我们还介绍了一种新的电子邮件主题质量评估指标（ESQE）。
3、提出了一种新的电子邮件主题生成模型。我们的自动评估和人工评估表明，该模型性能优于竞争基线，并接近于人类水平的质量。

标注后的Enron主题行语料库

为了准备我们的电子邮件主题数据集，我们使用Enron数据集(Klimt and Yang, 2004)，它是Enron公司员工的电子邮件信息的集合。如表2所示，电子邮件主题通常比在以前的新闻数据集中生成的摘要短得多。虽然与新闻标题行生成类似(Rushetal.，2015)，电子邮件主题生成也更具挑战性，因为它处理不同类型的电子邮件主题，而新闻文章的第一句话往往已经是一个很好的标题和总结。

本文模型介绍

模型结构下图1所示。基于新闻摘要的最新进展(Chen and Bansal,2018)，我们的模型分为两个阶段生成电子邮件主题:(1)提取器选择包含显著信息的多个句子来编写主题。(2)摘要器在保留关键信息的同时，将选定的多个句子改写成简洁的主题行。
例如在模型结构图中，输入电子邮件正文由四句话组成，提取器从中选择第二句和第三句。摘要器从所选的句子生成电子邮件主题。质量评估人员通过对邮件主体的主题打分来提供奖励。

实验结果

表3a和表3b中分别表示原始主题和Turkers (human annotations)生成主题的自动度量分数对比 ESQE分数对比人为评估对比人工评估和自动分数度量对比

ACED

Attention

更多自然语言处理相关知识，还请关注AINLPer公众号，极品干货即刻送达。

你可能感兴趣的:(论文推送)

]每日论文推送(有中文摘要或代码或项目地址)---强化学习，机器人，视觉导航晓理紫机器人人工智能算法
[晓理紫]每日论文推送(有中文摘要或代码或项目地址)每日更新论文，请转发给有需要的同学[晓理紫]专属领域论文订阅VX关注晓理紫，获取每日新论文VX关注晓理紫，并留下邮箱可免费获取每日论文推送服务{晓理紫}喜分享，也很需要你的支持，喜欢留下痕迹哦！分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割==VisualNavigation==标题:Explori
秀米基本功能介绍锅炉工的自我修养
论文推送基本架构题目字体设置校徽标题DUT-Wind(海纳百川自强不息厚德笃学知行合一)分割线(红蓝样式)文本阴影>子标题，##有序列表与无序列表二级标题设置###标题下划线颜色设置特殊子标题设置对话框acondesign嵌入图片，动态图片，figtitlesetting后记特殊标题（orfigure）【AI设计】对话框线框字体设置与选择文本背景，网格设置微信公众号推送。内容推送博士答辩新闻Mod
[晓理紫]每日论文推送(有中文摘要，源码或项目地址)--大模型相关、扩散模型、视觉导航晓理紫每日论文机器人
专属领域论文订阅VX关注{晓理紫|小李子}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持。VX关注晓理紫，并留下邮箱可免费获取每日论文推送服务分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割==LLM==标题:ACloserLookatAUROCandAUPRCunderClassImbalance作者:MatthewB.A.McDermot
[晓理紫]每日论文推送(有中文摘要，源码或项目地址)--机器人、视觉相关晓理紫每日论文机器人
专属领域论文订阅VX关注{晓理紫}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持VX关注晓理紫，并留下邮箱可免费获取每日论文推送服务分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割晓理紫今日论文推送==具身智能，机器人==标题:AugmentedRealityUserInterfaceforCommand,Control,andSupervi
[晓理紫]每日论文推送(有中文摘要或代码或者项目地址) 晓理紫每日论文每日论文
[晓理紫]每日论文推送(有中文摘要或代码或者项目地址)每日更新论文，关注晓理紫获取每日最新论文[晓理紫]标题:AComprehensiveStudyofKnowledgeEditingforLargeLanguageModels作者:NingyuZhang,YunzhiYao,BozhongTian摘要:LargeLanguageModels(LLMs)haveshownextraordinary
每日论文推送（有中文摘或源码地址或项目地址）晓理紫每日论文人工智能 chatgpt
***VX搜索“晓理紫”并关注就可以每日获取最新论文***标题:“It’snotlikeJarvis,butit’sprettyclose!”–ExaminingChatGPT’sUsageamongUndergraduateStudentsinComputerScience作者:IshikaJoshi,RitvikBudhiraja,HarshalDAkolekar摘要:Largelanguag
【论文推送】跨域学习、跨域小样本学习Cross-Domain(持续更新...) 诸葛灬孔暗小样本学习 cross-domain 小样本学习
深度神经网络(DNN)的泛化性能相当依赖于训练集的规模(size)和丰富性(variations).但是在很多场景下无法搜集到如此多的数据,如皮肤病,卫星图片(飞机残骸).尽管每种特殊的情况发生的概率很低,人为处理的成本也很低,但当我们有大量的”特殊情况”时,问题就变得复杂了起来.如何利用一个或一些成熟域上的先验知识，去解决另一个样缺少样本域上的复杂任务是跨域少样本学习(Cross-DomainF
【20210122期AI简报】保姆级深度学习环境配置指南、寒武纪首颗AI训练芯片亮相... RT-Thread物联网操作系统芯片编程语言人工智能深度学习 java
导读：本期为AI简报20210122期，将为您带来9条相关新闻，新增论文推送，在文章底部，祝各位牛年大吉~本文一共3700字，通篇阅读结束需要7~10分钟1.保姆级教程：深度学习环境配置指南！（Windows、Mac、Ubuntu全讲解）|极市平台该文章是市面上比较详细的一篇环境配置文章了文章来源于Datawhale，作者Datawhale俗话说，环境配不对，学习两行泪。本文为保姆级别的教程，详细
「自然语言处理(NLP)论文推送」会话响应生成（含源码）【美国卡耐基梅隆大学】 yinizhilianlove 论文推送
来源：AINLPer微信公众号编辑:ShuYini校稿:ShuYini时间:2019-8-24引言本次主要给大家介绍两篇文章。第一篇文章主要讲的是会话响应生成，其主要针对的是当前神经网络对话系统倾向于在语料库中生成响应的问题，这样不利于会话响应的多样性。第二篇文章主要针对的是模型会话一致检测的问题，怎么才能评估呢？作者提出一种自动在数据集提取实例进行评估的方法。PS：欢迎关注AINLPer
「自然语言处理(NLP)论文推送」ACL&&中科院&&微信AI团队 809 Shu灬下雨天
来源：AINLPer微信公众号编辑:ShuYini校稿:ShuYini时间:2019-8-12引言本篇给大家继续介绍中国科学院&&微信AI团队今年入围ACL的两篇文章，这两篇文章都是关于神经网络翻译。其中第一篇主要解释了暴露偏差和过度校正现象，提出了一种新的解决方法并该方法与试图解决该类问题的其他方法进行了对比。第二篇针对神经机器翻译模型，非自回归模型容易产生过翻译和漏翻译错误，作者提出了
「自然语言处理(NLP)论文推送」ACL&&微信AI团队（含源码）808 Shu灬下雨天
来源：AINLPer微信公众号编辑:ShuYini校稿:ShuYini时间:2019-8-8引言本次给大家分享的是今年腾讯微信AI团队入选ACL的两篇文章，第一篇文章主要是针对中文诗歌生成的问题，介绍中文现代诗歌生产的修饰控制编码器，该编码器具有隐喻、拟人化等修辞功能。第二篇文章主要是针对递归神经网络RNNs在全局信息建模上的不足，提出了一种全局上下文增强的深度转换架构（美其名曰：GCDT
中华麻醉播客若萤若水
大家好，欢迎收听《中华麻醉学杂志》播客论文推送，我是播报员张玉强。今天为大家推送的是由上海长征医院袁红斌教授今年发表的综述，题目是《骨关节置换术高龄患者的麻醉与加速康复》。随着我国人口的老龄化，接受骨关节置换的患者越来越多。袁红斌教授研究发现，对于合并心、脑、肺、大血管疾病的高龄患者，手术治疗的结局与麻醉管理密切相关。这就需要麻醉医生对此类患者实施“精准”麻醉，促进术后康复。有效的术前访视可以缓解
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他