论文地址:https://arxiv.org/abs/2106.07178
上一节:节点检测
下一节:子图检测
与针对单个节点的异常节点检测不同,异常边缘检测 (Anomalous edge detection,ANOS ED)旨在识别异常链路,这些链接通常会通知真实对象之间的意外或异常关系。
核心思想:使用自动编码器和全连接网络(FCN)进行异常边缘检测
Ouyang 等人[1] 通过深层模型对边分布进行建模,其核心思想是基于构成边的两个节点及其邻居节点属性,估算边出现的概率。具体来说,为了估算边出现的概率他们提出了一个名为 UGED 的方法,首先将每个节点编码为低维向量,并通过自身和邻居向量的平均聚集生成节点的表示,之后输入到另外一个 FCN 中来估算概率。该模型的示意图如下:
核心思想:对边分布建模,利用 GCN 可以更好地捕获图形结构信息
Duan 等人[2] 提出异常边的存在阻止了基于 GCN 的传统模型捕捉真实边分布,从而导致次优检测性能。他们认为在进行节点 embedding 的时候需要减轻异常边的负面影响。因此,他们提出一种名为 AANE 的方法,在训练期间迭代更新 embedding 和边检测来提高性能。在每个训练迭代中,AANE 通过 GCN 层生成节点 embedding,并学习指示矩阵以发现潜在的异常边缘。其模型的损失函数包含两个部分:异常感知损失:
和调整拟合损失:
其中,I 为指示矩阵,V是节点集合,N(u) 是u的邻居集合,B 是调整后的邻接矩阵,该矩阵从输入邻接矩阵 A 中移除所有预测异常。
核心思想:直接从图形学习的边表示。
如果边表示能够很好地保留成对节点之间的图形结构和交互内容(例如,在线社交网络中的消息、引文网络中的合著论文),则可以预期增强的检测性能
Xu 等人[3] 在生成边表示方面展现了一部分可能的结果。尽管这个文章不是专门为图异常检测而设计的,但它们指出了一种潜在的 ANOS ED方法。
PS: 当前可能并没有一个代表性的工作可以,因此作者在此处只是简单提及,并未介绍
核心思想:于利用时间信号(例如,图结构的变化),并应用专门设计的统计度量来检测动态图上的异常边。
Eswaran 等人[4] 将动态图建模为边的变化,并利用图结构以及结构演化模式。他们提出了两种异常边:1、连接图形中断开连接的区域的边;2、突然出现的边。
Chang 等人[5] 提出了一种新的频率分解算法,旨在根据观察到的频率的可能性来发现异常的入射边。具体而言,该方法融合了概率模型和矩阵分解的优点,用于捕获节点的时间和结构变化。
核心思想:将动态图形结构信息编码为边缘表示,并将上述传统异常检测技术应用于不规则边缘的检测
Yu 等人提出的 Netwalk [6] 方法也可以检测动态图中的异常边,使用节点嵌入将边编码到共享的潜在空间中,然后根据它们到潜在空间中最近的边簇中心的距离来识别异常。实际上,Netwalk生成的边表示是源节点和目标节点表示的Hadamard乘积。当新边到达或现有边消失时,节点和边表示将根据每个时间戳的临时图中的随机游动进行更新,然后重新计算边簇中心和边异常分数
核心思想:基于图结构构建 embedding 向量
尽管NetWalk能够检测动态图中的异常,但它只更新边表示,而不考虑长/短期节点和图结构的演化模式。Zheng 等人[7] 结合时间、结构和属性信息来度量动态图中边的异常性。他们提出了一个半监督模型 AddGraph,该模型由 GCN 和 GRU 组成,分别从每个时间戳的时态图和它们之间的依赖关系中捕获更具代表性的结构信息。在每个时间戳 t ,GCN 使用上一个时间戳的隐状态生成节点的 embedding,之后 GRU 从节点 embedding 中学习当前隐状态,并关注以前的隐藏状态。在获得所有节点的隐藏状态后,AddGraph 根据与之关联的节点为时态图中的每条边分配一个异常分数。模型示意图如下:
参考文献:
[1] L. Ouyang, Y. Zhang, and Y. Wang, “Unified graph embedding-based anomalous edge detection,” in IJCNN, 2020, pp. 1–8.
[2] D. Duan, L. Tong, Y. Li, J. Lu, L. Shi, and C. Zhang, “Aane: Anomaly aware network embedding for anomalous link detection,” in ICDM, 2020, pp. 1002–1007.
[3] L. Xu, X. Wei, J. Cao, and P. S. Yu, “Icane: Interaction content-aware network embedding via co-embedding of nodes and edges,” Int. J. Data Sci. Anal., vol. 9, no. 4, pp. 401–414, 2020.
[4] D. Eswaran and C. Faloutsos, “Sedanspot: Detecting anomalies in edge streams,” in ICDM, 2018, pp. 953–958.
[5] Y.-Y. Chang, P. Li, R. Sosic, M. Afifi, M. Schweighauser, and J. Leskovec, “F-fade: Frequency factorization for anomaly detection in edge streams,” in WSDM, 2021, pp. 589–597.
[6] W. Yu, W. Cheng, C. C. Aggarwal, K. Zhang, H. Chen, and W. Wang, “Netwalk: A flexible deep embedding approach for anomaly detection in dynamic networks,” in KDD, 2018, pp. 2672–2681.
[7] L.Zheng, Z.Li, J.Li, Z.Li, and J.Gao,“Addgraph:Anomalydetection in dynamic graph using attention-based temporal gcn,” in IJCAI, 2019, pp. 4419–4425.