DPLink:User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data

这篇文章要解决的问题是从不同结构的轨迹数据中找到相同的用户。(同一个人在不同平台都会产生数据,要根据不同平台上获得的数据来推断这是不是属于同一个人)

三大贡献:

1. 在构建embedding的地方使用了多模态的方式构建,有位置、时间、POI等辅助信息可以融合

2. 在Recurrent Encoder中,对中间隐层进行了pooling操作,使得序列数据embed到定长的向量中(针对每一维度,在所有时序数据的隐层中取最大)

3. co-attention selector,A,B轨迹对,将A的时序隐层表示 与B的轨迹RNN表示(第二点中得到)做attention操作;同时,将B的时序隐层表示表示与A的轨迹RNN表示做attention操作。获得A、B轨迹间的关联程度。

4.在单一数据集上先进行同一用户相近轨迹学习的预训练方法值得学习。

文章的不足:

1. 没有预训练,模型的效果就变得很差

2. 使用dot attention会不会过于简单?

3. 由于数据集限制,并未考虑到文本信息的嵌入(在结论中,作者提出的Future work)

你可能感兴趣的:(DPLink:User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data)