Mining Unfollow Behavior in Large-Scale Online Social Networks via Spatial-Temporal Interaction
Haozhe Wu, Zhiyuan Hu, Jia Jia, Yaohua Bu, Xiangnan He, Tat-Seng Chua
Tsinghua University, University of Science and Technology of China, National University of Singapore
http://hcsi.cs.tsinghua.edu.cn/Paper/Paper20/AAAI20-WUHAOZHE.pdf
线上社交网络依靠两种广泛分布的行为促成,即关注和取关,这两种行为分别对应关系创建和关系解除。
关于社交网络衍生的研究主要集中在关注行为,取关这种行为基本都是被忽略。对取关行为进行挖掘具有一定的挑战性,这种行为不仅由类似信息互惠这种用户属性的简单组合来决定,也会由比较复杂的交互关系来决定。
另外,之前的数据集很少包含足够的记录来推理复杂交互。为解决这些问题,作者们构建了大规模真实数据集 Weibo1,该数据集记录了详细的转发内容和180万中国用户的关系动态。
作者们对用户属性定义成两类,一类是空间属性,比如用户的社交角色,另一类是时间属性,比如用户的转发内容。利用构建的数据集,作者们对用户的时间和空间属性的交互作用对取关行为的影响进行了系统研究。
作者们提出一种新的带有异构信息的统一模型,UMHI,来预测取关行为。该模型能够通过社交网络结构来捕捉用户的空间属性,利用用户转发内容和取关历史来推理用户的时间属性,利用非线性MLP对用户的时空属性的交互进行建模。
实验结果表明,UMHI模型的准确率超出基准方法16.44%。另外,因子分析表明时空属性对于挖掘取关行为是必要信息。
取关图示如下
这篇文章的主要贡献如下
网络结构图示如下
时空属性的区别如下
下面是一些符号约定
作者们定义了两种时间属性
测试数据集统计信息如下
分层注意力网络图示如下
下面是目标函数的定义
参数设置如下
下面是参与对比的几种方法
结果对比如下
数据集大小对模型效果影响如下
数据集地址
https://github.com/wuhaozhe/Unfollow-Prediction
我是分割线
您可能感兴趣
ICDE2020|基于深度学习的关系抽取
只有正样本和无标签样本时如何构建分类器
ICDE2020|图卷积网络在价格感知推荐中的应用
WSDM2020|基于强化学习的多轮对话推荐系统(EAR, 即将开源)
WWW2020|如何利用未来数据协助训练基于会话的推荐(GRec)
ICML2018|基于自注意力的序列推荐模型SASRec(已开源)
IJCAI2018|分层时空LSTM在位置预测中的应用(HST-LSTM)
IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)
AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)
KDD2019|基于注意力的深度学习如何实时预测购买还是浏览
AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)
ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)
SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)
SIGIR2019|基于注意力机制的新型深度学习模型(采莓树模型BIRD,已开源)
SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)
SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)
KDD2018|基于GBM的动态定价回归模型
KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)
RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET
SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)
IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN
聊聊CatBoost
聊聊XGBoost CatBoost LightGBM RF GBDT
顶会中深度学习用于CTR预估的论文及代码集锦 (3)
ICML 2018 深度学习论文及代码集锦(5)
深度学习用于文本摘要的论文及代码集锦
深度学习用于机器翻译的论文及代码集锦
深度学习用于序列标注中的论文及代码集锦
深度学习在推荐系统中的应用及代码集锦(4)
深度学习在OCR中的应用论文及代码集锦 (2)