CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)

Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction

Zekun Li, Zeyu Cui, Shu Wu, Xiaoyu Zhang, Liang Wang

University of Chinese Academy of Sciences

http://cn.arxiv.org/pdf/1910.05552.pdf

ctr预估在web应用中,比如在线广告和推荐系统,这些应用中的特征通常都是多域形式的,非常重要。

ctr预估中的关键在于对不同特征域的特征交互进行建模。最近提出的基于深度学习的模型遵循这样一种范式,原生的稀疏输入多域特征首先映射到稠密域嵌入向量,然后简单地连接起来喂入深度神经网络或者其他的网络,进而学习高阶特征交互。但是,简单地将特征域进行非结构化的结合不可避免的会限制模型的能力,不能充分灵活精确地捕捉不同域的更加复杂巧妙的交互。

这篇文章提出用图结构来直观表示多域特征,其中每个节点对应一个特征域,不同的域可以通过边来交互。特征交互建模转换为图中节点交互的建模。论文作者们设计了一种新的模型,Fi-GNN。这种模型可以有效利用图的强表示能力,该模型不仅可以灵活清楚的对特征交互进行建模,而且为CTR预估提供了更好的模型解释。

两个真实数据集上的实验结果验证了论文作者们所提模型的有效性。

多域特征及业界主流做法简介如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第1张图片

部分基于深度学习的模型有以下几种

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第2张图片

这篇文章的主要贡献如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第3张图片

基于FM的几种方法分别具有以下特点

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第4张图片

基于深度学习的几种方法简单对比如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第5张图片

部分基于图的方法将图结构数据转为序列结构数据来处理

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第6张图片

部分代表性的图神经网络有以下几种

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第7张图片

模型整体结构图示如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第8张图片

嵌入层流程简介如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第9张图片

多头注意力连接方式如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第10张图片

fi-gnn图示如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第11张图片

节点的状态聚合公式如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第12张图片

边权计算公式是基于注意力机制的

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第13张图片

边权转换公式及更新后的节点更新公式如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第14张图片

利用GRU来更新状态的公式细节如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第15张图片

利用残差连接来更新状态的公式如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第16张图片

注意力打分层细节描述如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第17张图片

目标函数,训练方法以及参数规模如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第18张图片

fi-gnn跟FM的关系如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第19张图片

数据集描述,部分预处理以及分割策略如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第20张图片

数据集统计信息如下

评价指标有以下几个

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第21张图片

参与对比的方法有以下几个

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第22张图片

参数设置细节如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第23张图片

效果对比如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第24张图片

几种变体模型及效果如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第25张图片

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第26张图片

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第27张图片

部分超参数的影响图示如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第28张图片

不同特征之间关系的重要性图示如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第29张图片

不同特征的重要性图示如下

CIKM2019|Fi-GNN图神经网络学习特征交互在CTR预估中的应用(已开源)_第30张图片

代码地址

https://github.com/CRIPAC-DIG/Fi_GNN


              我是分割线


您可能感兴趣

CIKM2019|AutoInt自注意力神经网络自动学习特征交互(已开源)

WSDM2019|近似解耦随机游走RecWalk在top-N推荐中的应用(已开源)

CIKM2013|深层结构语意模型DSSM在web搜索中的应用

WSDM2019|社交注意力记忆网络在推荐系统中的应用(已开源)

SIGIR2020|基于序贯行为的高效迁移学习在用户建模及推荐中的应用(已开源)

WSDM2019|门限注意力自编码在内容感知推荐中的应用(已开源)

WWW2019|对偶图注意力网络在推荐系统中的应用(已开源)

KDD2019|个性化注意力在新闻推荐中的应用

SIGIR2020|序贯元学习方法在重新训练推荐系统中的应用(已开源)

WSDM2019|动态图注意力网络在基于会话的社交推荐中的应用

IJCAI2017|基于注意力机制的FM模型AFM在学习特征交互权重中的应用(已开源)

KDD2020|自动特征交互选择(AutoFIS)分解机模型在CTR预估中的应用(已开源)

SIGIR2020|LightGCN图卷积网络在推荐系统中的应用(已开源)

WWW2019|图神经网络在社交推荐中的应用

AAAI2019|自注意力度量学习在下一个商品推荐中的应用

WWW2020|基于隐含意图的注意力序列模型在下一个商品推荐中的应用

WWW2015|深度学习在推荐系统跨域用户建模中的应用

ICDE2020|多图卷积网络在草药推荐中的应用

ATM|注意力转移模型在预测下一个商品中的应用

IJCAI2019|深层自注意力网络在序列推荐中的应用

AAAI2020|深度学习在表格分析中的应用

NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)

AAAI2020|结合时空信息的分层注意力网络在大规模社交网络中的应用

ICDE2020|基于深度学习的关系抽取

只有正样本和无标签样本时如何构建分类器

ICDE2020|图卷积网络在价格感知推荐中的应用

WSDM2020|基于强化学习的多轮对话推荐系统(EAR, 即将开源)

WWW2020|如何利用未来数据协助训练基于会话的推荐(GRec)

ICML2018|基于自注意力的序列推荐模型SASRec(已开源)

IJCAI2018|分层时空LSTM在位置预测中的应用(HST-LSTM)

IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)

AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)

AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)

ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)

SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)

SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)

SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)

KDD2018|基于GBM的动态定价回归模型

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)

IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN

聊聊CatBoost

聊聊XGBoost CatBoost LightGBM RF GBDT

顶会中深度学习用于CTR预估的论文及代码集锦 (3)

ICML 2018 深度学习论文及代码集锦(5)

深度学习用于机器翻译的论文及代码集锦

你可能感兴趣的:(python,机器学习,深度学习,算法,人工智能)