u010313476

论文翻译 - 深度学习社区发现综述 A Comprehensive Survey on Community Detection with Deep Learning

为大家介绍一篇「深度学习」在社区发现（图聚类/图划分）方面应用的最新综述论文。

作者：Xing Su
原文链接：https://arxiv.org/abs/2105.12584
Github链接：https://github.com/FanzhenLiu/Awesome-Deep-Community-Detection

文章目录

摘要
1 引言
2 相关符号与定义
3 社区发现的发展
4 深度学习社区发现的分类框架
5 基于卷积网络的社区发现
- 5.1 基于CNN的社区发现
- 5.2 基于GCN的社区发现
6 基于图注意力网络GAT的社区发现
7 基于生成对抗网络GAN的社区发现
8 基于自编码器AE的社区发现
- 8.1 基于堆叠自编码器的社区发现
- 8.2 基于稀疏自编码器的社区发现
- 8.3 基于降噪自编码器的社区发现
- 8.4 基于卷积自编码器的社区发现
- 8.5 基于图注意力自编码器的社区发现
- 8.6 基于变分自编码器的社区发现
9 基于深度非负矩阵分解的社区发现
10 基于稀疏滤波的社区发现
11 公开资源
- 11.1 数据集
- - 现实世界数据集
  - 人工合成数据集
- 11.2 评价指标
12 实际应用
13 未来方向
- 13.1 未知的社区数量
- 13.2 社区嵌入
- 13.3 层次化网络
- 13.4 多层网络
- 13.5 异构网络
- 13.6 网络异质性
- 13.7 拓扑不完备的网络
- 13.8 跨域网络
- 13.9 多属性视图网络
- 13.10 带符号的网络
- 13.11 动态网络
- 13.12 大规模网络
总结

摘要

社区揭示了其成员不同于网络中其他社区成员的特征和联系。在网络分析中，社区发现具有重要意义。除了经典的谱聚类和统计推断方法，凭借处理高维网络数据方面的优势，用于社区发现的深度学习技术近年来有了显著的发展。因此，对于学术界和从业者而言，对深度学习应用于社区发现的最新进展进行及时地总结和梳理是具有重要意义的。针对基于深度学习的社区发现技术的最新进展，本文提出了一种新的分类框架，包括基于深度神经网络的深度学习模型、深度非负矩阵分解和深度稀疏滤波，并进一步将深度神经网络模型细分为卷积网络，图注意网络，生成对抗网络和自编码器。在实验设置方面，本文总结了流行的对比基准数据集、模型评估指标和开源实现项目。不仅讨论了社区发现在各个领域的实际应用，还提出了实现方案。文章在最后提出了快速发展的用于社区发现的深度学习领域中具有挑战性的课题，并概述了该领域未来的发展方向。

1 引言

早在上世纪 20 年代，社会学领域的科学家们就对「社区」展开了研究[1]。然而，直到 21 世纪，研究者们才真正开始借助强大的数学工具和大数据处理技术来解决社区发现任务中的难题[2]。自2002年Girvan和Newman的研究使这一图分割问题受到广泛关注以来[3]，计算机科学家们在过去的 10 年间通过利用网络拓扑结构[5-8]和实体语义信息[9-11]，对不同规模大小的静态、动态网络[12-17]中的社区发现问题[4]展开了广泛研究。越来越多的基于图的方法被提出，用于在具有复杂数据结构的环境中进行社区发现[18][19]。通过社区发现，我们可以详细分析社区在网络中的演化和影响（例如，谣言传播、病毒爆发、肿瘤演化）。
社区的存在使得社区发现技术的意义逐渐得以凸显。正所谓“物以类聚，人以群分”[20]。根据六度分隔理论，最多通过六个人就能够认识任何一个陌生人[21]。因此，我们所处的世界是一个由一系列社区形成的巨大网络。如图 1 所示，通过发现社交网络中的社区[22-24]，平台运营者可以向目标用户推荐商品。而在引文网络中[25]，社区发现可以检测出研究课题的重要性、关联性和演化情况，并确定研究的发展趋势。在代谢网络[26][27]和蛋白质相互作用（PPI）网络[28]中，社区发现可以揭示具有类似生物学功能的代谢物和蛋白质。同样地，脑网络[19][29]中的社区可以反映出不同功能的脑区域。

对于一些小型的网络和简单的场景，研究人员已经提出了一系列基于谱聚类[30][31]、统计推断[32-35]等传统技术的社区发现方法。然而，由于计算及存储空间成本巨大，这类方法并没有扩展到大型网络或具有高维特征的网络上。在现实世界的网络中，大量的非线性结构信息使传统的模型并不能够很好地应用于实际场景。因此，我们需要发展出具有良好计算性能的更强大的技术。如今，针对这一问题，深度学习从以下3个方面给出了最为灵活的解决方案：（1）学习非线性网络属性，如节点之间的关系；（2）提供能够保留复杂网络结构特征的低维网络表示；（3）利用更多信息进行社区发现以提高性能。总而言之，深度学习用于社区发现是一种新的趋势，我们需要一个及时全面的综述。
据我们所知，本文是第一篇综合概述深度学习对社区发现贡献的综述研究。现有的综述大都聚焦于传统方法，归纳其对发现网络固有模式和功能的重要影响[36][37]。在现有的社区发现综述中，有学者对各类不同的技术进行综述，如SBMs[38]，LPAs[39][40]，多目标或单目标优化算法等[13][14]。也有学者从网络的角度，分别对动态网络[12]、有向网络[41]、多层网络[5]中的社区发现方法进行综述。此外，还有针对非重叠或重叠社区发现的综述[6][7]。就应用场景而言，也有专门针对社交网络的社区发现综述[9][42]。
本文旨在从以下方面帮助研究人员和从业者了解社区发现领域的过去、现在和未来的趋势：

系统的分类和深入的调研。我们对基于深度学习的社区发现方法提出了一个新的分类框架(见图3)，并分析、总结、比较了每一类别的代表性工作。同时，介绍了社区发现在现实世界的实际应用。为未来的方向与发展提供了新视角。
丰富的资源和高影响力的参考文献。本文不仅概述方法，还整合了社区发现的基准数据集、评估指标、开源实现和实际应用的资源。我们广泛概述了高影响力国际会议和高质量期刊上发表的相关研究，涵盖了人工智能、机器学习、数据挖掘几大领域。
未来的发展方向。由于将深度学习应用于社区发现是一个新的研究趋势，我们讨论了当前研究的局限性，以及未来研究的关键挑战和开放性问题。

2 相关符号与定义

本章节的主要内容包括相关定义和符号的含义，以及深度学习社区发现模型的输入和输出。

定义1（网络）： 一个网络可表示为 $\mathcal{G}=(V, E)$ ，其中 $V$ 是节点集合， $E$ 是边集。 $v_{i} \in V$ 表示一个节点， $e_{ij}=(v_{i}, v_{j}) \in E$ 表示节点 $v_{i}$ 和 $v_{j}$ 之间存在一条边。一个节点 $v_{i}$ 的邻域则为 $N(v_i)=\{u\in V|(v_i, u)\in E\}$ 。邻接矩阵 $A=[a_{ij}]$ 是一个 $\times n$ 维的矩阵，如果 $e_{ij}\in E$ ，则 $a_{ij}=1$ ；如果 $e_{ij}\notin E$ ，则 $a_{ij}=0$ 。如果 $a_{ij}\neq a_{ji}$ ， $\mathcal{G}$ 为有向网络，否则为无向网络。如果 $a_{ij}$ 存在权值 $w_{ij}\in W$ ， $\mathcal{G}=(V, E, W)$ 为带权网络，否则为无权网络。如果 $a_{ij}$ 有不同的值 $+ 1, - 1$ ， $\mathcal{G}$ 为带正边和负边的符号网络。如果节点 $V$ 有属性 $X=\{x_i\}_1^n$ ， $\mathcal{G}=(V, E, X)$ 为属性网络，其中 $x_i\subseteq \mathbb{R}^d$ 表示节点 $v_i$ 的属性向量，否则 $\mathcal{G}$ 为无属性网络。当网络随时间 $t$ 演化时，即为动态网络 $\mathcal{G}_{(t)}=(V_{t}, E_{t})$ 或时态网络 $\mathcal{G}_{(t)}=(V, E, X_{t})$ 。
定义2（社区）： 社区的集合为 $\mathcal{C}=\{C_1, C_2, \cdots, C_k\}$ ，每个社区 $C_i$ 是网络 $\mathcal{G}$ 的划分，该划分保留了网络的区域结构和簇属性。社区 $C_i$ 中的节点 $v_i$ 应满足其社区内部度大于外部度。如果 $C_i \cap C_j = \emptyset$ ， ( $\forall i, j$ )，那么 $\mathcal{C}$ 是非重叠社区；否则，它是节点可以同时隶属于多个社区的重叠社区。

符号	含义	符号	含义	符号	含义
$\mathbb{R}$	数据空间	$\mathcal{G}$	图	$V$	节点集合
$E$	边集合	$\mathcal{C}$	社区集合	$v_i$	节点 $v_i \in V$
$e_{ij}$	边 $e_{ij} \in E$	$C_k$	第 $k$ 个社区	$N (i)$	节点 $v_i$ 的邻居
$n$	节点数量 $\mid V \mid$	$m$	边数 $\mid E \mid$	$A$	邻接矩阵
$A (+, -)$	符号网络邻接矩阵	$\mathcal{A_{ij}}$	图 $(\mathcal{G_{i}}, \mathcal{G_{j}})$ 之间的锚链接	$\mathcal{X}$	异构网络节点属性
$X$	节点属性矩阵	$x_i$	节点 $v_i$ 的属性向量	$y_i$	节点 $v_i$ 的标签
$y_i^k$	节点 $v_i$ 属于 $C_k$ 的二元社区标签	$c_k$	社区 $C_k$ 的标签	$d$	属性 $x_i$ 的维度
$D$	度矩阵	$L$	拉普拉斯矩阵	$l$	DNN第 $l$ 层
$W^{(l)}$	第 $l$ 层权重矩阵	$\sigma(\cdot)$	激活函数	$H^{(l)}$	第 $l$ 层激活矩阵
$h_{i}^{(l)}$	节点 $v_i$ 在第 $l$ 层的表示向量	$Z$	特征	$z_i$	节点 $v_i$ 对特征向量
$B$	模块度矩阵	$b_{ij}$	节点 $v_i, v_j)$ 之间的模块度值	$Q$	模块度评价指标
$M$	马尔科夫矩阵	$S$	相似度矩阵	$s_{ij}$	节点 $v_i, v_j)$ 之间的相似度值
$O$	社区隶属度矩阵	$o_{ij}$	节点 $v_i, v_j)$ 之间的社区隶属度值	$U / P$	非负矩阵
$p_{ij}$	社区隶属概率 $v_i, C_j)$	$\mathcal{L}$	损失函数	$\Omega$	稀疏惩罚
$\vert \cdot \vert$	集合大小	$\vert\vert \cdot \vert\vert$	范数运算符	$\Theta$	可训练参数
$Pr(\cdot)$	概率分布	$\phi_g$	生成器	$\phi_d$	判别器
$\phi_e$	编码器	$\phi_r$	解码器

社区发现输入 基于深度学习的社区发现模型将网络结构和其它属性信息作为输入，如节点属性和带符号的边。网络结构是以节点和边代表的拓扑关系。边上的权重代表连接强度。节点属性代表节点的语义信息，例如在线社交网络中用户的账号信息。带符号的边代表连接状态，如正连接（+）和负连接（-）。
社区发现输出 社区发现模型的输出通常是一些将节点和边分组后的社区，这些社区可以是重叠或非重叠的。如图2所示，这些社区可能不相交也可能相交，本文对这两类社区都进行了概述。

3 社区发现的发展

社区发现在网络分析和数据挖掘领域具有重要意义，图4展示了传统方法和基于深度学习方法的发展。传统方法在网络结构上进行社区发现，它们可以分为7类（如图3左）且只能发现浅层关联，因此结果往往是次优的，本章简单回顾了其中的代表性工作。而基于深度学习的社区发现方法（如图3右）可以发现深层的网络信息和复杂的关系、处理高维数据。
图划分：此类方法也被称为图聚类[36]，它将网络划分为 k 个社区。聚类簇中的边要比聚类簇之间的边更为稠密。代表性的算法包括：Kernighan-Lin 启发式方法[43]、谱二分法[44]等。此类方法在深度学习方法中仍然被使用。
统计推断：代表性的算法为随机块模型（SBM）[32]，这是一类被广泛使用的生成式模型，它将节点分配到社区中，并控制它们的似然概率。其变体包括：DCSBM[33]、MMB[34]、OSBM[35] 等。
层次聚类：此类方法通过分裂式、凝聚式和混合式三种方式发现不同层次上的社区结构。Girvan-Newman（GN）算法通过分裂式方法依次删除网络中的边从而发现新的社区，输出一种关于社区结构的层次化树状表征[2][45]。FastQ [3][46]是一种凝聚式算法，它逐渐将节点合并为一个社区。CDASS 算法[47]同时应用了分裂式和凝聚式策略，基于结构相似度对图进行划分，并将其合并为层次化的社区。
动力学方法：随机游走利用随机游走器在一段较短的游走中陷入某个社区的趋势，是最常被用于社区发现任务的动力学方法。代表性的算法包括：WalkTrap[48]、InfoMap[49]、LPA[50]、LPAm[51]。
谱聚类：网络的谱属性可以被用于社区发现任务。谱聚类[30]基于邻接矩阵派生的网络归一化拉普拉斯矩阵划分节点，并且使用伪似然算法将划分结果拟合到 SBM 算法上。
基于密度的方法：此类方法的代表性算法包括：DBSCAN[52]、SCAN[53]、LCCD[54]。它们通过测量实体密度来确定社区、社区边界和异常。
优化方法：社区发现方法利用优化算法来达到某个极值，通常期望表明社区的似然。最经典的优化函数为 Modularity(Q) [45]及其变体FastQ[3][46]，它被用来估计网络划分得到的社区结构，公式如下[37]：
$\frac{1}{2m}\sum_{ij}(a_{ij} - p_{ij})\delta(C_i, C_j),$
其中， $C_i$ 和 $C_j$ 是节点 $v_i$ 和 $v_j$ 所属的社区， $\delta$ 是克罗内克增量函数，当 $C_i=C_j$ 时为1，否则为0。 $P=[p_{ij}]$ 是原始网络随机集合的平均邻接矩阵。 $P$ 保留了网络特征，例如二分性、相关性、带符号边和空间嵌入性。标准的 $P$ 为 $p_{ij}=k_ik_j/2m$ [45]，其中 $k_i$ 和 $k_j$ 为节点度。Louvain [56]是另一种著名的优化算法，它采用节点移动策略提取具有更大网络模块度的社区结构。此外，贪婪优化方法还包括模拟退火[57]、极值优化[58]、以及谱优化[59]。演化社区发现方法在局部学习和全局搜索中十分有效[60]，它分为单目标优化和多目标优化。多智能体遗传算法（MAGA-Net）[61]等单目标优化算法利用了模块度函数，而 Combo[62]等算法则融合了归一化互信息(NMI)[63]、Conductance[64]在内的多个优化目标。CE-MOEA [10]算法基于非支配排序遗传算法（NSGA-II）[65]来优化模块度和相似性目标。
为什么需要深度学习进行社区发现？ 特别是在大型复杂网络中，深度学习模型 [66] 具有利用节点、邻域、边、子图等的高维非线性特征（即网络拓扑信息）和高维关系特征（即网络属性信息）的优势。这样的模型对稀疏网络更具弹性，并且更适合现实世界场景中的无监督学习任务。

4 深度学习社区发现的分类框架

本文提出了一个针对基于深度学习的社区发现方法的分类框架。该框架将相关方法总结为六类：卷积网络、图注意力网络 (GAT)、生成对抗网络 (GAN)、自编码器 (AE)、深度非负矩阵分解 (DNMF) 和深度稀疏过滤 (DSF)。卷积网络包括卷积神经网络（CNN）和图卷积网络（GCN）。AE 进一步分为堆叠 AE、稀疏 AE、去噪 AE、图卷积 AE、图注意力 AE 和变分 AE (VAE) 等子类别。分类结构如图 3 所示。代表性工作的时间线如图 4 所示。

5 基于卷积网络的社区发现

卷积神经网络（CNN）[67]是一种针对网格式拓扑数据，如图像数据，而提出的前馈深度神经网络（DNN），其中卷积层降低了计算成本，而池化操作保证了 CNN 在特征表达上的鲁棒性。图卷积网络（GCN）[68]是基于CNN 和图的局部谱滤波器的一阶近似而提出的用于图结构数据的卷积网络模型。GCN中使用的传播规则设计为：
$H^{(l+1)} = \sigma (\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} H^{(l)}W^{(l)} ),$ 其中， $H^{(l)}$ 通过激活函数 $\sigma(\cdot)$ 和层特定的可训练权重矩阵 $W^{l}$ 保留第 $l$ 层中的潜在表示矩阵 $H^{(0)}=X)$ ； $\tilde{A}=A+I_n$ 为无向图 $\mathcal{G}$ 加入自连接后的邻接矩阵， $I_n$ 是单位矩阵； $\tilde{D}_{ii}=\sum_j\tilde{a}_{ij}$ ，其中 $\tilde{a}_{ij}\in\tilde{A}$ 。

5.1 基于CNN的社区发现

现有的基于CNN的社区发现方法具有严格的数据输入限制：图像格式数据和带标签数据。因此，这些方法需要对其输入进行预处理：（1）将网络样本映射为图像数据格式，以及（2）提前手动标记节点或社区，因为大多数现实世界的网络没有标签。图 5 展示了基于 CNN 的社区发现方法的通用框架。为了解决社区发现中的特定问题，现有的研究开发了以下一系列技术。

传统的社区发现技术以完整的网络拓扑结构为前提，发现过程依赖于测量邻域内节点相似性的图分析。然而，现实世界中的网络获得的结构信息有限，不完整的网络会影响邻域分析并进一步降低社区发现的准确性。CNN 架构可以从基本输入中逐渐恢复完整的潜在特征，于是一个针对拓扑不完备网络（TINs）的有监督CNN 模型 [8] 被提出以进行社区发现。该模型有两个 CNN 层，分别是用于网络表示的最大池化算子和用于社区发现的全连接 DNN 层。卷积层从不同的角度表示每个节点的局部特征，最后的全连接层 $f$ 更新每个节点 $v_i$ 的社区：
$o_i^k = \sigma(b_k^f + W_k^f\bm{h}^{(2)}_i),$ 其中， $\sigma$ 是sigmoid函数， $W_f^k$ 和 $b^f_k$ 是第 $k$ 个神经元 $o^k_i$ 的权重和偏置， $h^{(2)}_i$ 是前两个卷积层输出的节点表示向量。该模型执行反向传播以通过最小化损失函数 $\mathcal{L}$ 来进行优化：
$\mathcal{L} = \frac{1}{2}\sum_i\|\bm{o}_i - \bm{y}_i\|_2^2 = \frac{1}{2}\sum_i\sum_k(o_i^k - y^k_i)^2,$ 其中 $\bm{y}_i$ 表示真实标签向量， $y_i^k\in\{0, 1\}$ 表示节点 $v_i$ 是否属于第 $k$ 个社区。该模型在 TINs 中的社区发现实验的准确率约为80%，其中 10%的节点被标记，其余为未标记节点。这表明多跳范围内的高阶邻域表示可以提高社区发现的准确率。为了处理大规模社交网络中的高稀疏性，[69]为TINs进一步设计了稀疏卷积矩阵。
ComNet-R (Community Network Local Modularity R) [70] 是一种用于社区发现的 edge-2-image 模型，用于对社区内和社区之间的边进行分类。ComNet-R先移除社区间的边，以形成的初始社区。然后通过局部模块度优化方法来合并获得最终社区。

5.2 基于GCN的社区发现

GCN在图卷积层中聚合节点的邻域信息，因此可以从全局上捕获用于社区发现的复杂特征。基于GCN的社区发现方法有两类：(1)监督/半监督社区分类；(2)基于无监督网络表示的社区聚类。社区分类方法受到现实世界中缺乏标签的限制，相比之下，通过矩阵重构和目标优化等技术，对网络表示进行聚类可以更灵活地发现社区结构。图 6 展示了GCN通常如何应用于社区发现，表 V（见原文附录）对比了这些技术。

GCN 采用一些传统的社区发现方法作为深度图算子，例如用于统计推断的随机块模型 (SBM)、用于谱分析的拉普拉斯矩阵和用于信念传播的概率图模型。例如，LGNN （Line Graph Neural Network）[71] 是一种有监督的社区发现模型，它以更好的社区检测性能改进了 SBM，并降低了计算成本。LGNN将非回溯算子与信念传播的消息传递规则相结合 [72]，学习有向网络中节点表示的特征。使用softmax函数识别节点 $v_i$ 属于社区 $C_k$ ( $o_{i,k} = p(y_i=c_k|\Theta,\mathcal{G}$ ) 的条件概率，并最小化社区标签所有可能排列 ( $S_{\mathcal{C}}$ ) 的交叉熵损失：
$\mathcal{L}(\Theta)=\min_{\pi \in S_{\mathcal{C}}}{-\sum_i\log{o_{i, \pi(y_{i})}}}.$ 由于 GCN 最初不是为社区发现任务设计的，因此社区结构不是学习节点嵌入的重点，并且社区和节点之间的结构一致性没有平滑约束。为此，一种半监督 GCN 社区发现模型 (MRFasGCN) [11] 被提出来表征隐藏的社区。它将针对网络的马尔可夫随机场扩展为一个新的卷积层 (eMRF)，使 MRFasGCN 面向社区并对 GCN 的粗略结果起到了平滑细化作用。
CommDGI (Community Deep Graph Infomax) [73] 通过节点和社区上的互信息 (MI) 联合优化图表示和聚类，并最大化图模块度。它将 $k$ -means 应用于节点聚类并以聚类中心为目标。
在概率推理框架下，检测重叠社区的问题可以通过推断节点的社区从属关系的生成模型来解决。例如，NOCD (Neural Overlapping Community Detection) [74] 结合了伯努利-泊松 (BP) 概率模型和两层 GCN，通过最小化 BP 的负对数似然来学习社区从属向量。通过设置阈值来不断识别和移除弱从属关系，从而获得最终社区结构。
谱GCN代表节点邻域的所有潜在特征。通过在深层 GCN 层中重复进行拉普拉斯平滑，相邻节点的特征将收敛到相同的值。然而，这些模型会导致社区发现的过度平滑问题。为了减少这种负面影响，GCLN (Graph Convolutional Laddershape Networks) [75] 设计了一种基于CNN领域U-Net的新型GCN架构用于无监督社区检测（ $k$ -means）。GCLN对称地构建了收缩路径和扩展路径，将从收缩路径中捕获的上下文特征与在扩展路径中学到的本地化信息融合。
由于不同类型的连接通常被视为普通边，因此GCN单独表示每种类型的连接并将它们聚合会导致冗余表示。IPGDN (Independence Promoted Graph Disentangled Network) [76] 将邻域区分为不同部分，并自动发现图的独立潜在特征的细微差别，从而降低发现社区的难度。 IPGDN 由邻域路由中的希尔伯特-施密特独立准则 (HSIC) 正则化 [77] 支持。
对于属性图，基于GCN的社区发现依赖于结构信息和表征特征，其中相邻节点和具有相似特征的节点很可能聚集到同一个社区。因此，图卷积将上述两个图信号相乘，并且需要平滑滤除高频噪声。为此，AGC (Adaptive Graph Convolution) [78] 设计了一个具有频率响应函数的低通图滤波器：
$p(\lambda_q) = (1 - \frac{1}{2} \lambda_q)^k,$ 其中 $\mathcal{G}$ 的频率响应函数 $p(\Lambda)=\text{diag}(p(\lambda_1),\cdots,p(\lambda_n))$ 在落入区间 $[0, 2]$ 的对称归一化图拉普拉斯算子 $L_s$ 的所有特征值 $\lambda_q$ 上递减且非负。随着 $k$ 的增加， $p(\lambda_q)$ 变得更加低通，表明过滤后的节点特征 $\bar{X}$ 将更加平滑。AGC选择合适的邻域跳跃大小 $k$ ，并通过 $k$ 阶图卷积将图特征表示为：
$\bar{X} = (I - \frac{1}{2}L_s)^kX,$ 再进行谱聚类。
AGE (Adaptive Graph Encoder) [79] 是另一种可扩展到社区发现的平滑滤波器相关的GCN模型。为了生成平滑特征，AGE 自适应地执行成对节点相似性 ( $S = [s_{ij}]$ ) 和 $t$ 堆叠拉普拉斯平滑滤波器 ( $\bar{X} = (I - \gamma L)^t X$ )：
$\mathcal{L} = \sum_{(v_i,v_j)\in V'} -y_{ij}\log(s_{ij}) - (1-y_{ij})\log(1 - s_{ij}),$ 其中 $V^{'}$ 表示正（相似）和负（不相似）样本上的平衡训练集， $y_{ij}$ 是节点对 $v_i,v_j)$ 上排序后的二元相似性标签。
一些工作对GCN过滤器具有重要贡献。例如，在谱图卷积架构中，基于Cayley多项式的GNN ——CayleyNets (Graph Convolutional Neural Networks with Cayley Polynomials) [80] 提出了一种有效的Cayley滤波器，用于社区发现的高阶近似。它专门研究窄带滤波，因为低频包含了大量可用于社区发现的社区信息。CayleyNets 与 Cayley 过滤器结合，在谱卷积层中利用平均池化，并在节点上使用半监督 softmax 分类器，来对社区成员归属进行预测。

6 基于图注意力网络GAT的社区发现

基于图注意力网络（GAT）的社区发现方法可以发现复杂网络场景中的社区。如图 7 所示， GAT [81] 通过可训练的权重聚合邻域中节点的特征，该权重通过考虑多种因素（特别是具有多种关系类型的网络）的注意力来计算：
$\bm{h}_i^{(l+1)}=\sigma\left(\sum_{j \in N(v_i)} \alpha_{i j}^{(l+1)} W^{(l+1)} \bm{h}_{j}^{(l)}\right),$ 其中 $\bm{h}_{i}^l$ 表示第 $l$ 层 ( $\bm{h}_{i}^{(0)} = \bm{x}_i$ ) 节点 $v_i$ 的输出表示， $\alpha_{i j}^{(l)}$ 是 $v_i$ 和 $v_j \in N(v_i)$ 之间的注意力系数。

深度社区发现模型需要特别注意网络中节点间的关系。例如，在将论文归类为研究主题时，合著关系和引用关系都很重要。多层网络提供具有多个网络层的 DNN 结构，以实现对多个图的交互的综合分析。DMGI (Deep Graph Infomax for Attributed Multiplex network embedding ) [82] 独立嵌入每种关系类型并通过最大化全局共享特征来计算网络嵌入用于发现社区，一种共识正则化被应用于注意力系数，以在嵌入中削弱不太重要的关系。
MAGNN (Metapath Aggregated Graph Neural Network) [83] 通过多信息语义元路径提供了一种卓越的社区发现解决方案，这些元路径区分了图注意力层中的异构结构。MAGNN 从语义信息生成节点属性。由于元路径内和元路径间存在异构节点和边，MAGNN 通过聚合节点和元路径上的语义差异，在它们的嵌入中利用了注意机制。因此，MAGNN 能够为社区发现提取更丰富的拓扑和语义信息。

7 基于生成对抗网络GAN的社区发现

对抗性训练在生成模型中是有效的，可以提高判别能力，但在应用于社区发现时需要解决过拟合问题（如图 8）。生成对抗网络 (GAN) [84] 在对抗训练中，在生成器 $\phi_g$ 和判别器 $\phi_d$ 之间进行竞争。 $\phi_d(\bm{x})$ 表示输入数据的概率，而 $\phi_g(\bm{z})$ 学习生成器在输入噪声变量 $p_{\bm{z}}(\bm{z})$ 上的数据 $\bm{x}$ 上的分布 $p_g$ 。生成器通过生成假样本来欺骗鉴别器。其目标函数定义为：
$\min_{\phi_g} \max_{\phi_d} \mathbb{E}_{\bm{x} \sim p_{data}(\bm{x})} [\log \phi_d(\bm{x})] + \mathbb{E}_{\bm{z} \sim p_{\bm{z} }(\bm{z} )} [\log (1-\phi_d(\phi_g(\bm{z} )))].$

SEAL (Seed Expansion with Generative Adversarial Learning) [85] 通过具有增量更新的图指针网络 (iGPN)，从选定的种子节点中生成社区。它由社区层面的四个部分组成，即生成器、鉴别器、种子选择器和定位器。鉴别器采用图同构网络 (GIN) 来修改具有真实社区标签的生成社区。定位器旨在为生成器提供正则化信号，从而消除社区发现中的不相关节点。
对于不平衡社区，DR-GCN (Dual-Regularized Graph Convolutional Networks) [86]将条件 GAN 用于双正则化 GCN 模型，即潜在分布对齐正则化和类条件对抗正则化。第一个正则化通过在标准 GCN 训练 ( $\mathcal{L}_{gcn}$ ) 的指导下最小化多数和少数社区类 ( $\mathcal{L}_{dist}$ ) 之间的 Kullback-Leibler (KL) 差异来平衡社区： $\mathcal{L}=(1-\alpha)\mathcal{L}_{gcn}+\alpha \mathcal{L}_{dist}$ 。第二个正则化旨在区分标记节点表示上的社区：
$\min_{\phi_{g}, \mathcal{L}} \max_{\phi_d} \mathcal{L}(\phi_d, \phi_g) = \mathbb{E}_{\bm{x} \sim p_{data}(\bm{x})} \log \phi_d(\bm{x} \mid y) + \mathbb{E}_{\bm{z} \sim p_{\bm{z}}(\bm{z})} [\log(1-\phi_d(\phi_g(\bm{z} \mid y))) + \mathcal{L}_{reg}],$ 其中 $\mathcal{L}_{reg}=\sum_{v_j \in N(\bm{x})}\|\bm{h}_{g_{\bm{x}}}-\bm{h}_j\|_2$ 强制生成的假节点 ( $g_\bm{x}$ ) 重建各自的邻域关系（如 $v_j\sim \bm{x}$ ）。
JANE (Jointly Adversarial Network Embedding) [87] 不是通过鉴别器仅生成一种假样本，而是采用拓扑和节点属性的两种网络信息来捕获来自真假样本对抗组的语义变化。具体来说，JANE 通过多头自注意力编码器 ( $\phi_e$ ) 表示社区特征，其中为假特征（来自 $Z$ ）添加高斯噪声，以与生成器 ( $\phi_g$ ) 和鉴别器 ( $\phi_d$ ) 竞争：
$\min_{\phi_g,\phi_e}\max_{\phi_d}{\mathcal{L}(\phi_d, \phi_e, \phi_g)} := \mathbb{E}_{(a, \bm{x}) \sim p_{AX}}[\underbrace{\mathbb{E}_{\bm{z} \sim p_{\phi_e}(\cdot \mid a, \bm{x})}[\log \phi_d(\bm{z}, a, \bm{x})]}_{\log \phi_d(\phi_e(a, \bm{x}), a, \bm{x})}] + \mathbb{E}_{\bm{z} \sim p_{Z}}[\underbrace{\mathbb{E}_{(a, \bm{x}) \sim p_{\phi_g}(\cdot \mid \bm{z})}[\log (1-\phi_d(\bm{z}, a, \bm{x}))]}_{\log (1-\phi_d(\bm{z}, \phi_g(\bm{z})))}],$ 其中 $p_{AX}$ 表示拓扑 $A$ 和采样节点属性 $X$ ( $a\in A$ , $\bm{x} \in X$ ) 的联合分布。
接近度可以捕获社区内的潜在关系。然而，现实世界中稀疏连接的网络不能提供足够的边。网络中的属性不能通过接近度来衡量。为了解决该限制，ProGAN (Proximity Generative Adversarial Network ) [88] 从一组实例化的三元组中对每个节点的邻近进行编码，以便在低维空间中发现和保存社区关系。
CommunityGAN (Community Detection with Generative Adversarial Nets) [89] 是一个针对重叠社区提出的方法，它通过为每个「节点-社区对」分配一个非负因子来获得节点表示。其目标函数通过一个 motif 级生成器（ $\phi_g(\cdot|v_i;\Theta_g)$ ）和判别器（ $\phi_d(\cdot,\Theta_d)$ ）进行优化：
$\min_{\Theta_g}\max_{\Theta_d}{\mathcal{L}(\phi_g, \phi_d)} = \sum_i \left( \mathbb{E}_{C' \sim p_{true}(\cdot \mid v_{i})} \left[\log \phi_d(C'; \Theta_d) \right] + \mathbb{E}_{V' \sim \phi_g(V' \mid v_i ; \Theta_g)}\left[\log (1-\phi_d(V'; \Theta_d) \right]\right),$ 其中 $\Theta_g$ 和 $\Theta_d$ 统一了生成器和判别器中节点 $v_i$ 的所有非负表示向量， $V'\subseteq V$ 表示节点子集， $C^{'}$ 表示motifs（即派系），条件概率 $p_{true}(C'| v_i)$ 描述了覆盖 $v_i$ 的 $C^{'}$ 在所有其他motifs $C'\in \mathcal{C'}$ 上的偏好分布。

8 基于自编码器AE的社区发现

自编码器(AE)是最常被用于无监督社区发现的模型，社区发现中常见的AE变体包括堆叠AE、稀疏AE、去噪AE、卷积AE、变分AE。AE 能够描绘非线性、有噪声的现实世界网络并产生平滑的表示。AE [90] 的通用框架由编码器 $\phi_e(A,X)$ 和解码器 $\phi_r(Z)$ 构成。编码器 ( $\phi_e$ ) 将高维网络结构 ( $A$ ) 和可获取的属性 ( $X$ ) 映射到低维潜在特征空间 ( $Z$ )。解码器 ( $\phi_r$ ) 则根据编码器得到的表示 ( $H$ ) 进行网络重构( $Z$ )，其中 $X^{'}$ 继承了 $A$ 和 $X$ 中的首选信息。损失函数 $\mathcal{L}(\bm{x}, \phi_r(\phi_e(\bm{x})))$ 最大化源数据 $\bm{x}$ 和解码数据 $\phi_r(\phi_e(\bm{x}))$ 之间的似然。

8.1 基于堆叠自编码器的社区发现

由于单个 AE 不能满足社区发现的要求，堆叠 AE 由一组 AE 堆叠在多个隐藏层中而形成。如图 9 所示，堆栈中的每个编码器分别代表一种类型的输入数据。这些基于堆叠AE的社区发现方法可以灵活地广泛应用于不同场景，例如用于快速演化的动态社区发现 [91]。

semi-DRN (Semi-supervised Nonlinear Reconstruction Algorithm with DNN) [92] 是基于堆叠 AE 的社区发现模型，其中模块度矩阵学习 AE 中的非线性节点表示， $k$ -means 获得最终的社区结构。给定邻接矩阵 $A=[a_{ij}]$ 中节点 $v_i$ 和 $v_j$ 之间的边，模块度矩阵 $B$ 中的模块度值 $b_{ij} = a_{ij} - \frac{k_i k_j}{2m}$ 被优化为最大值[93]。基于节点表示对节点成对相似性（社区归属）进行编码，成对嵌入矩阵 $[o_{i,j}\in \{0,1\}]$ 同时被定义为提供节点 $v_i$ 和 $v_j$ 属于 ( $o_{i,j} = 1$ ) 或不属于 ( $o_{i,j} = 0$ ) 同一社区的先验知识。因此，通过最小化以下损失函数来优化 semi-DRN 的学习过程：
$\mathcal{L} = \mathcal{L}(B, X') + \lambda \mathcal{L}(O,Z),$ 其中 $X^{'}$ 表示通过一系列 AE 在堆叠表示 ( ${H^{(l)}\}$ ) 上解码的网络特征， $\lambda$ 表示 AE 重构损失 $\mathcal{L}(B, X')$ 和成对约束 $\mathcal{L}(O,Z)$ 之间的调整权重， $\mathcal{L}(O,Z)$ 测量堆叠 AE 内的每对社区归属 $o_{ij}$ 和潜在表示 $(\bm{z}_i,\bm{z}_j)$ 。
类似地，DNE-SBP (Deep Network Embedding with Structural Balance Preservation) [94] 根据符号网络的成对约束进行权重调整，通过区分正负连接使堆叠 AE 将最近的节点聚集在一起。UWMNE (Unified Weight-free Multicomponent Network Embedding ) 及其具有局部增强功能的变体 WMCNE-LE [95] 从网络拓扑和语义信息中保留社区属性，并从局部网络结构的角度整合深度 AE 中的各种信息。
为了发现随时间变化的动态社区结构，sE-Autoencoder (Semi-supervised Evolutionary Autoencoder) [96] 在进化聚类框架内开发，假设前一时刻的社区结构连续指导当前时刻的检测。为此，sE-Autoencoder 在 [92] 的目标函数中添加了时间平滑正则化 $\mathcal{L}(Z_{(t)}, Z_{(t-1)})$ 以进行最小化：
$\mathcal{L} = \mathcal{L}(S_{(t)}, X'_{(t)})+ \lambda \mathcal{L}(O, Z_{(t)}) +(1-\lambda) \mathcal{L}(Z_{(t)}, Z_{(t-1)}),$ 其中重构误差 $\mathcal{L}(S_{(t)}, X'_{(t)})$ 最小化 $t$ 时刻的相似性矩阵 $S_{(t)}$ 和解码特征 $X'_{(t)}$ 的损失，参数 $\lambda$ 随 $t$ 时刻的图表示 $Z_{(t)}$ 控制节点成对约束 $\mathcal{L}(O, Z_{(t)})$ 和时间平滑度正则化。
对于属性网络，DANE (Deep Attributed Network Embedding) [97] 设计了一个两分支 AE 框架：一个分支将高度非线性的网络结构映射到低维特征空间，另一个分支协同学习节点属性。由于相似的节点更有可能聚集在同一社区中，DANE 通过表示学习中的一系列关于网络拓扑和属性信息的邻近度来衡量这些相似性，其中优化应用于一阶邻近度 ( $\mathcal{L}_f$ ) 、高阶邻近度 ( $\mathcal{L}_h$ ) 和语义邻近度 ( $\mathcal{L}_s$ )的重构损失，以及一致和互补表示的负对数似然控制 ( $\mathcal{L}_c$ )。
Transfer-CDDTA (Transfer Learning-inspired Community Detection with Deep Transitive Autoencoder ) [98] 将无监督迁移学习应用于 CDDTA 算法，该算法计算 AE 嵌入实例的 KL 散度，以确保在学习低维表示时，不同域之间的差异（例如，偏移分布、不平衡特征和缺乏样本）可以近似相等。为了将社区信息映射到一个平滑的特征空间，CDDTA 通过相似性矩阵（ $S_s$ 和 $S_t$ ）将输入邻接矩阵 ( $A$ ) 分为源域 ( $s$ ) 和目标域 ( $t$ )，以保持每个堆叠 AE中节点的成对相似度值。然后，Transfer-CDDTA 将域独立特征结合到以下最小化学习过程中：
$\mathcal{L} = \mathcal{L}_s(S_s, X'_s) +\mathcal{L}_t(S_t, X'_t) + \alpha \mathcal{L}_{KL}(Z_s,Z_t)+\beta\mathcal{L}(\Theta; \gamma),$ 其中 $\alpha$ , $\beta$ , $\gamma$ 是输入到算法中的权衡参数， $\mathcal{L}_s$ 和 $\mathcal{L}_t$ 表示源域和目标域的重建损失， $\mathcal{L}_{KL}$ 平滑两个域上编码特征（ $Z_s$ , $Z_t$ ）的 KL 散度， $\mathcal{L}(\Theta)$ 是减少优化中过度拟合的可训练变量的正则化项。
DIME (Deep alIgned autoencoder-based eMbEdding) [99] 是为异构社交网络的多个对齐结构设计的堆叠AE模型。它使用元路径来表示不同的关系（异构链接 $\mathcal{A}_{ij}$ ，即多个对齐网络 $\mathcal{G}_i$ 和 $\mathcal{G}_j$ 之间的锚链接）和各种属性信息（ $\mathcal{X}=\{X_i\}$ ）。相应地，为每个元路径开发一组元邻近度测量，并将相近的节点嵌入到低维潜在特征空间中的一个相近区域，相对较近的区域即为检测的社区。

8.2 基于稀疏自编码器的社区发现

稀疏性普遍存在于现实世界的网络中，并导致社区发现算法的计算困难。为了解决这一问题，稀疏 AE [100] 在隐藏层 $\bm{h}$ 中引入了稀疏惩罚 $\Omega(\bm{h})$ 。重构损失函数如下：
$\mathcal{L}(\bm{x}, \phi_r(\phi_e(\bm{x})))+\Omega(\bm{h})。$ GraphEncoder (Autoencoder-based Graph Clustering Model) [101] 是第一个使用 AE 进行图聚类的研究。它通过作为以下损失函数（最小化）的一部分的稀疏项来处理稀疏性：
$\mathcal{L}(\Theta)=\sum^n_i\|\bm{h}_{i}-\bm{x}_{i}\|_{2}+\beta \Omega(\rho \| \frac{1}{n}\sum^n_i \bm{h}_i),$ 其中权重参数 $\beta$ 控制配置值 $\rho$ 的稀疏惩罚 $\Omega(\cdot\|\cdot)$ 和隐藏层激活值的平均值。 GraphEncoder 提高了大规模网络的聚类效率，并证明了稀疏网络可以为表示提供足够的结构信息。
Dfuzzy (Deep Learning-based Fuzzy Clustering Model) [102] 用于并行处理框架下稀疏大规模网络中的重叠社区发现。Dfuzzy 引入了针对头节点的堆叠稀疏 AE，以基于模块度发现重叠和非重叠的社区。Dfuzzy 的性能比非深度学习基线高 63%（modularity）、34%（conductance）和 21%（partition coefficient）。
CDMEC (Community Detection Method via Ensemble Clustering) [103] 的社区发现方法将稀疏 AE 与迁移学习模型相结合，以从局部网络结构中发现更多有价值的信息。为此，CDMEC 构建了四个相似性矩阵，并采用迁移学习通过 AE 的参数共享局部信息。共识矩阵（consensus matrix）被用于聚合社区发现结果，这些结果由四个相似性矩阵单独产生并由 $k$ -means 支持。最终社区是基于共识矩阵的分解而全局确定的。

8.3 基于降噪自编码器的社区发现

降噪过程减去了 DNN 层内的噪声。降噪 AE [104] 能够处理损坏的输入数据 ( $\tilde{\bm{x}}$ ) 并最小化去噪数据 ( $\bm{x}$ ) 和解码数据之间的重构损失：
$\mathcal{L}(\bm{x}, \phi_r(\phi_e(\tilde{\bm{x}})))。$ DNGR (Deep Neural Networks for Graph Representation) [105] 是在具有 3 个隐藏层的堆叠降噪自编码器框架中设计的。DNGR 应用堆叠降噪编码器来增加发现社区时捕获局部结构信息的鲁棒性。具体来说，它通过随机遍历社区来生成概率共现矩阵，并将其转换为移位的正逐点 MI 矩阵作为输入。
对于损坏的节点属性，GRACE (GRAph Clustering with dynamic Embedding) [106] 是一个非线性多层 DNN 的降噪 AE，由邻域内的影响传播引导，以发现动态变化的社区间活动，通过自训练聚类达到了有效的社区发现性能。
MGAE (Marginalized Graph AutoEncoder ) [104] 对图的属性和结构进行降噪，以通过边缘化过程改进社区发现。它在 m 次内获得损坏的特征 $\widetilde{X}$ 。MGAE训练中的目标函数定义为：
$\mathcal{L} = \frac{1}{m}\sum_{i=1}^m\|X-\widetilde{D}^{-\frac{1}{2}} \widetilde{A} \widetilde{D}^{-\frac{1}{2}} \widetilde{X} W\|_2+\lambda \mathcal{L}(W),$ 其中 $\mathcal{L}(W)$ 表示系数为 $\lambda$ 的参数 $W$ 的正则化项。

8.4 基于卷积自编码器的社区发现

将 GCN 引入 AE 是一个巨大的成功，因为 GCN 提供了高阶图正则化，而 AE 缓解了 GCN 中的过度平滑问题。例如，基于 GCN 的无监督社区检测 (GUCD) 方法 [107] 采用半监督 MRF 作为 GCN 中的卷积层（即MRFasGCN，详细信息见5.2小节）[11] 作为其编码器，并提出了一种以社区为中心的双重解码器来检测属性网络中的社区。具体来说，GUCD使用一个解码器重构网络拓扑，另一个解码节点属性，以直接识别社区结构。
SDCN (Structural Deep Clustering Network) [108] 设计了一个传递算子来在 DNN 层上连接 AE 和 GCN，从而使图卷积可以完全支持 AE 的结构表示。当 SDCN 将结构信息集成到深度聚类中时，它通过分别对 AE 和 GCN 应用双重自监督优化来更新社区。
O2MAC (One2Multi Graph Autoencoder for Multi-view Graph Clustering ) [109] 是一种针对多视图属性图的，由单视图到多视图 (One2Multi) 的图聚类 AE。它由一个编码器和多个解码器组成。在编码器中，应用 GCN 来嵌入一组视图分隔图。同时将解码器分别分配给这些单视图，并与编码器共同选择包含信息最多的单视图。O2MAC 能够捕获多视图之间的共享特征，并通过自训练优化改进聚类结果。

8.5 基于图注意力自编码器的社区发现

该类别的社区发现方法不是集成 GCN，而是将 GAT 应用于 AE。DAEGC (Deep Attentional Embedded Graph Clustering) [110] 采用 GAT 作为编码器对邻域内属性节点的重要性进行排序，利用高阶邻域来聚类社区。
多视图网络有两种基于 GAT 和 AE 的社区发现方法。MAGCN (Multi-View Attribute Graph Convolution Networks ) [111] 设计了一个双路径编码器：第一个路径使用能够去噪的多视图属性 GAT 进行编码，第二个路径设计了一个编码器以在多视图属性上获得一致的嵌入。因此，MAGCN 为社区发现任务去除了噪声和分布方差。DMGC (Deep Multi-Graph Clustering) [112] 引入了 AE 来表示每个图的注意力系数，多个图的节点嵌入将通过跨图质心聚类以获得 Cauthy 分布上的社区。

8.6 基于变分自编码器的社区发现

变分自动编码器（VAE）是基于变分推理（如特征的均值和协方差）的 AE 的扩展[113]。它由变分图自编码器（VGAE）[114] 首次引入图学习领域，它假设高斯分布并应用 GCN 作为编码器。基于 VAE 的社区发现由 SBM 等模型激活，以快速推断节点表示中的社区归属 [115]。推理过程考虑了网络的不确定性[116]、[117]，例如连接多个社区的边界节点的邻居之间的社区矛盾。VAE 还可以处理社区发现的稀疏性问题。同时，VAE 很容易与更深层次的非线性关系信息相结合。例如，TGA/TVGA (Triad Variational Graph Autoencoder ) [118] 用新的 triad 解码器替换了 VAE/VGAE 的解码器，它描述了现实世界的社区中现有的三元闭包属性。
VGECLE (Variational Graph Embedding and Clustering with Laplacian Eigenmaps) [116] 将图表示分为均值和协方差，同时检测社区，表明每个节点与其真实地理位置的隐式关系的不确定性。借助高斯混合先验和Teacher-Student (T-S) 正则化，VGECLE 旨在让节点 $v_i$ （student）学习接近其邻居（teacher）的分布。
DGLFRM (Deep Generative Latent Feature Relational Model ) [115] 和LGVG ( Ladder Gamma Variational Autoencoder for Graphs) [119] 进一步捕捉每个节点的社区归属强度。DGLFRM 包括一个基于 GCN 的用于生成节点嵌入的非线性编码器，和一个用于在重叠社区上估计链接概率的非线性解码器。DGLFRM 通过 Beta-Bernoulli 过程对稀疏节点嵌入进行建模，该过程还可以推断社区的数量。LGVG 旨在学习多层和伽马分布的嵌入，以便发现多粒度的社区，即底层的细粒度社区和顶层的粗粒度社区。
为了从社区结构中捕获高阶特征，VGAECD (Variational Graph Autoencoder for Community Detection) [117] 采用高斯混合模型和社区分配参数来概括网络生成过程。VGAECD 通过使用两层 GCN 将观察到的数据编码为潜在嵌入进行优化，以实现证据下界 (ELBO) 最大化。由于 VGAECD 导致了次优的社区发现结果，VGAECD-OPT (OPTimizing Variational Graph AutoEncoder for Community Detection) [116] 提出了一种双重优化，它最小化了二元交叉熵的重构损失和期望最大化算法的社区损失。
ARGA (Adversarial Regularized Graph Autoencoder) 和 ARVGA (Adversarially Regularized Variational Graph Autoencoder ) [120] ，继承了GAN 和 VGAE 的特性，通过将 GAN 的机制引入GAE/VGAE 训练，并在附加的正则化项中优化。

9 基于深度非负矩阵分解的社区发现

非负矩阵分解[121]旨在将一个矩阵分解成两个小的非负矩阵，该方法具有高度的可解释性，能够发现如何将节点分配给社区。应用于社区发现的基本 NMF 模型将邻接矩阵 ( $A$ ) 分解为两个非负矩阵 ( $U\in \mathbb{R}^{n\times k}$ 和 $P\in \mathbb{R}^{k\times n}$ )，其非负约束为 $P\geq 0$ 和 $U\geq 0$ 。矩阵 $U$ 对应于原始网络和社区归属空间之间的映射。矩阵 $P = [p_{ij}]$ 的每一列表示节点 $v_i$ 属于社区 $C_j$ 的归属强度为概率 $p_{ij}$ 。NMF 适用于非重叠和重叠的社区发现。由于现实世界的网络包含复杂的拓扑信息，传统的 NMF 无法完全揭示它们来检测社区。受深度学习成功的启发，人们对深度 NMF [122] 进行了广泛的研究，它堆叠多层 NMF ( $\{U_1,\cdots,U_p\}$ ) 以捕获各个级别/方面的节点成对相似性。
在深度社区发现中，DANMF (Deep Autoencoder-like Nonnegative Matrix Fatorization) [123]是无监督学习环境下影响最大的模型。与传统的基于NMF的社区发现方法映射简单的社区成员不同，DANMF使用AE框架在分层映射上进行网络重构。社区归属 $P_p$ 的学习目标和分层映射 $\{U_i\}^p_1$ 通过结合重构损失和 $\lambda$ 加权图正则化进行训练：
$\min_{P_p,U_i} \mathcal{L}(P_p,U_i) = \|A - U_1\cdots U_p P_p\|_F^2 +\|P_p - U_p^T\cdots U_1^T A\|_F^2 + \lambda tr(P_p L P_p^T), \quad \text{s.t.} ~~ P_p \geq 0, U_i \geq 0, \forall i=1,\cdots,p$ 其中， $\|\cdot\|_F$ 表示 Frobenius 范数， $L$ 表示图拉普拉斯矩阵，图正则化 [124] 侧重于网络拓扑相似性以聚类相邻节点。进一步的工作 [125] 在上述基于深度 NMF 的社区发现模型中添加了稀疏约束。
尽管深度NMF提供了一种在形成社区的过程中映射多个变量的方案，但是其矩阵分解的计算成本相对较高。为此，研究者们提出了MDNMF (Modularized Deep Nonnegative Matrix Factorization)[126]，直接将模块度应用于基本的多层深度学习结构中。模块度矩阵 B 在以下使用社区归属矩阵 $O$ 的最大化训练中为目标：
$tr(O^{T}BO), \quad \text{s.t.} ~~ tr(O^{T}O) = n.$
通过最小化以下目标函数，最终得到社区 $P_p$ 中的节点归属：
$\mathcal{L} = \|A-U_1\cdots U_p P_p\|_F^2 + \alpha \|O-P_{p}^{T} K^{T}\|_F^2 - \beta Q + \lambda tr(P_p L P_p^T), \quad \textrm{s.t.} ~~ \quad P_p \geq 0, U_i \geq 0, \forall i=1,...,p$ 其中 $K$ 是一个额外的非负矩阵，结合了模块度信息，因此深度 NMF 可以探索网络拓扑的隐藏特征。

10 基于稀疏滤波的社区发现

稀疏滤波[127]是一种简单的双层学习模型，它可以处理高维的图数据，将高度稀疏的输入表征为低维特征向量。高度稀疏的输入（具有很多 0 元素的 $A$ ）将被表示为低维特征向量（具有非零值的 $\bm{h}_i$ ）。为了探索节点的社团归属等更深入的信息，深度SF将多个隐层堆叠起来，从而对更多超参数 ( $\Theta$ ) 和大量的平滑数据分布( $Pr(\bm{h}_i)$ )进行调优。
DSFCD (Community Discovery based on Deep Sparse Filtering) [128]作为一种代表性的方法，可以分为三个步骤：网络表示、社区特征映射和社区发现。网络表示阶段分别在邻接矩阵 ( $A$ )、模块度矩阵 ( $B$ ) 和两个相似性矩阵 ( $S$ 和 $S^{'}$ ) 上执行。选择最佳表示输入到深度 SF 中，以获得在每个节点上表示的社区特征映射( $\bm{h}_i$ ) 。同时， $\bm{h}_i$ 保留了原始网络（ $A$ ）中的节点相似性和潜在社区归属特征。节点成对约束在损失函数中建模：
$\mathcal{L} = \sum_i \| \bm{h}_{i}\|_1 + \lambda \sum_i \text{distance}(\bm{h}_i, \bm{h}^*_j),$ 其中 $\|\cdot\|_1$ 是优化稀疏度的 $L_1$ 范数惩罚， $\bm{h}^*_j$ 为节点 $v_j$ 的最相似表示（ $\bm{h}^*$ ），通过在 Euclidean 或 KL 上计算 $\text{distance}(\bm{h}_i, \bm{h}_j)$ 距离得到。在最小化损失上优化学习过程中，相似的节点会聚集到同一社区中。深度 SF 架构在现实世界数据集的实验中具有重要意义，DSFCD 能比 SF 更准确地发现社区结构。

11 公开资源

我们总结了基于深度学习的社区发现研究实验和实践的基本资源，包括基准数据集、评估指标和开源实现代码（见下表）。

方法	URL
CommunityGAN [89]	https://github.com/SamJia/CommunityGAN
ARGA [120]	https://github.com/Ruiqi-Hu/ARGA
MGAE [104]	https://github.com/FakeTibbers/MGAE
DIME [99]	http://www.ifmlab.org/files/code/Aligned-Autoencoder.zip
AGE [79]	https://github.com/thunlp/AGE
O2MAC [109]	https://github.com/songzuolong/WWW2020-O2MAC
DMGC [112]	https://github.com/flyingdoog/DMGC
semi-DRN	http://yangliang.github.io/code/DC.zip
AGC [78]	https://github.com/karenlatong/AGC-master
NOCD [74]	https://github.com/shchur/overlapping-community-detection
LGNN [71]	https://github.com/zhengdao-chen/GNN4CD
DMGI [82]	https://github.com/pcy1302/DMGI
MAGNN [83]	https://github.com/cynricfu/MAGNN
DNE-SBP [94]	https://github.com/shenxiaocam/Deep-network-embedding-for-graph-representation-learning-in-signed-networks
GraphEncoder [101]	https://github.com/zepx/graphencoder
DGLFRM [115]	https://github.com/nikhil-dce/SBM-meet-GNN
DANE [97]	https://github.com/gaoghc/DANE
SDCN [108]	https://github.com/bdy9527/SDCN
CayleyNet [80]	https://github.com/amoliu/CayleyNet
DNGR [105]	https://github.com/ShelsonCao/DNGR
SEAL [85]	https://github.com/yzhang1918/kdd2020seal

11.1 数据集

现实世界的数据集和合成数据集都被广泛应用。社区发现实验中的真实世界数据集是从真实世界的应用中收集的，能够从实际应用的角度测试所提出方法的性能。合成数据集由特定模型根据手动设计的规则生成，这些数据集可以测试特定功能。

现实世界数据集

最流行的现实世界数据集可以分为引用/合著网络、社交网络（在线和离线）、生物网络、网页网络、产品共同购买网络等。原文表 III 总结了各种形态网络（即无属性、有属性、多视图、带符号）的典型数据集。数据集相关说明及下载地址详见原文附录 B。

人工合成数据集

GN网络 [2]：经典的 GN 基准网络由 128 个节点组成，分为 4 个社区，其中每个社区有 32 个节点，每个节点共享一个固定的平均度（ $k_{in}$ ），并连接另一个社区中预定义数量的节点 ( $k_{out}$ )。例如， $k_{in} + k_{out} = 16$ 。参数 ( $\mu$ ) 用于控制每个节点在其他社区中的邻居比例。
LFR网络 [142]：LFR 基准数据集模拟现实世界网络中节点的度和网络的无标度性质。社区验证更具挑战性，结果更有说服力。LFR 生成程序提供了一组丰富的参数，通过这些参数可以控制网络拓扑，包括网络大小 ( $n$ )、平均度 ( $k$ ) 和最大度 ( $M a x k$ ) 、社区规模对最小值 ( $M i n c$ ) 和最大值 ( $M a x c$ ) ，以及混合参数 ( $\mu$ )。节点度由指数为 $\tau_1$ 和 $\tau_2$ 的幂律控制。LFR 在网络结构中比GN 基准网络更复杂，它可以生成更灵活的网络，是传统社区发现研究中最常见的模拟基准。

11.2 评价指标

本节总结了主流的评估指标，并在表 IV 中进行了归纳。详细的评估指标介绍参见原文附录 C 。

12 实际应用

如图 10 所示，社区发现技术已被应用于各种各样的任务和领域，例如：

推荐系统：社区结构对于基于图的推荐系统起着至关重要的作用[143][144]，因为社区成员可能具有相似的兴趣和偏好。通过检测节点之间的关系（即用户-用户、项目-项目、用户-项目），CayleyNets [80] 和 UWMNE/WMCNE-LE [95] 等模型可以产生高质量的推荐。
生物化学：在该领域中，节点代表化合物和分子图中的蛋白质或原子，边代表它们之间的交互。社区发现可以识别在器官中起作用的新蛋白的免疫复合物[8][101]、化合物，或疾病的病理因素（如基于社区的肺癌检测 [146] ）。对于基因组数据集上的各种肿瘤类型，之前的研究 [147] 揭示了社区存活率与社区中肿瘤类型分布之间的相关性。
在线社交网络：分析在线社交活动可以识别在线社区，并将它们与现实世界联系起来。Facebook、Twitter 和 LinkedIn 等在线社交网络[2]揭示了在线用户之间相似的兴趣，从而自动识别出个人的偏好。同时，社区发现技术可以用于在线隐私保护[148] ，基于在线社会行为识别罪犯 [149]等场景，这些犯罪分子支持和传播犯罪思想，甚至可能从事恐怖主义活动 [150]。
社区欺骗：为了绕开社区发现，我们可以通过社区欺骗技术[151]覆盖 Facebook 等社交网络中的一组用户。有的社区欺骗活动对虚拟社区有害，也有的社区欺骗活动是出于正当利益的考虑。从基于社区的结构熵中，残差熵最小化（REM）有效地躲避了社区发现算法[152]。 [153]在大型网络中对社区发现对欺骗的鲁棒性进行了系统评估。
社区搜索：社区搜索旨在搜索依赖于社区结构的节点 [16]。例如，搜索用户所在兴趣社区的其他成员。这些社区是根据用户的兴趣临时形成的，有几种实践应用于此场景。本地社区搜索 [15] 一次假设一个查询节点并扩展它周围的搜索空间。该策略将反复尝试，直到社区找到所有归属。Attributed Truss Communities (ATC) [154] 将查询节点上的社区与相似的查询节点属性互连起来。

13 未来方向

尽管深度学习极大促进了社区发现领域研究的繁荣，但是目前仍然存在许多有待解决的问题：

13.1 未知的社区数量

挑战：现实世界中存在大量无标签数据，因此社区的数量是未知的。现有的无监督社区发现方法要求我们事先指定需要检测出的社区数量，而这往往是不可行的。我们需要使用一种有效的方法来处理由于缺乏这种知识而造成的情况。
机遇：网络拓扑结构的分析提供了应对这一挑战的潜在解决方案，并且已经有学者进行了一些研究工作 [102]。通常，这些方法执行随机游走以获得初步社区并通过模块度改进检测结果。但是实践中遇到不联通的网络时，随机游走不能涉及每个节点，并且会降低检测性能。因此，这一问题需要更完整的解决方案和进一步的研究。

13.2 社区嵌入

挑战：传统的节点嵌入方法会保留直接相连或在低维空间中拥有许多共同邻居的节点，但是在学习过程中却很少利用社区结构[155]。为此，社区发现需要引入能够感知社区结构的学习过程来表征社区信息[156]。
机遇：迄今为止，很少有工作将社区嵌入集成到深度学习模型中，因此需要在该领域做更多努力。一般而言，由于为社区生成表示的社区嵌入可能会带来额外的计算成本，因此未来的工作需要开发以计算为目标的快速算法。此外，由于嵌入结果依赖于超参数优化，如何将特殊的优化机制设计到深度社区发现模型中是另一个关键方面。

13.3 层次化网络

挑战：Web 等网络通常具有组织不同层次社区的树状结构。因此，社区发现需要具有从低到高的层次化过程。
机遇：传统方法通常遵循以下三种工作路线之一：(1) 直接一次性估计层次结构，(2) 以自下而上的方式合并社区， (3) 以自上而下的方式拆分社区。它们的性能受到大量参数或对网络密度的严格要求的限制[157]。最近的工作表明网络嵌入对该问题的效率有影响 [158], [159]。社区发现方法在保留社区层次结构的同时，还需要充分利用高层和低层社区之间的包含关系[159]。由于在学习嵌入时处理隐含关系的能力很强，我们相信对深度学习的深入研究可以促进层次社区发现的发展。

13.4 多层网络

挑战：在我们的自然环境中很容易观察到，作为家人的两个人同时也是朋友，不同的交通方式将地方连接起来。实体总是以多种方式相互交互[160]。多层网络提供了一个通用的多层框架，以将一组实体之间的多种交互类型表征为不同的网络层 [161]。
机遇：与单层网络中社区发现工作的繁荣发展不同，多层网络的研究发展仍处于起步阶段[162]。多层网络通常将其多层的信息合并到单层中，然后进行单层社区发现。在深度学习的背景下，可以通过深度架构学习网络信息的低维表示，来构建一个类似的解决方案。通常，用于多层社区发现的深度学习方法应适当考虑几个问题：（1）交互类型之间的差异，（2）层间不同程度的稀疏性，（3）跨层可能的连接，（4）方法在层数方面的可扩展性。

13.5 异构网络

挑战：为了准确描述现实，网络需要包含表征不同类型实体之间关系的异构信息 [163]，例如演员和电影之间的角色扮演关系。由于缺乏建模复杂结构和语义信息的能力，针对同构网络设计的社区发现方法往往不适用于异构网络，因此需要为异构网络提供新方法。
机遇：元路径是处理不同语义信息的一项研究工作，它描述了所涉及的节点类型之间的复合关系。这允许深度模型通过不同的元路径聚合来自相同类型的其他节点的信息来表示节点，然后基于节点相似性评估进行社区发现 [83][99][137]。然而，最有意义的元路径的选择仍然是一个待解决的问题。未来可以关注于元路径选择的灵活模式和其他可以利用各种类型关系的新模型上。

13.6 网络异质性

挑战：网络异质性 [164] 指相连的节点也可能从属于不同的社区，或具有不相似的特征。例如，欺诈者故意与用户建立联系以隐藏自己不被发现。对社区发现任务而言，跨社区相连的边界节点往往具有这种属性。捕获网络异质性可以为社区发现任务提供有价值的信息。
机遇：由于大多数方法严重依赖同质性，假设连接的节点具有更多相似性并且更有可能来自同一社区，因此利用网络异质性的深度学习方法有望获得更好的社区发现性能。

13.7 拓扑不完备的网络

挑战：在现实场景下，并不一定总是能够获取节点之间的关系，因此网络的拓扑结构往往是不完整的[8]。例如，由于监测所有蛋白质之间的相互作用代价昂贵，蛋白质相互相互作用 (PPI) 网络通常是不完整的 [165]。从有限的拓扑信息中获取有意义的社区知识对于这种情况至关重要。
机遇：完整网络拓扑的要求极大地损害了社区发现方法（尤其是基于邻域聚合的方法）在拓扑不完备网络（TIN）上的适用性。为此，应进一步开发具有信息恢复机制的深度学习方法，以便实现准确的社区发现。

13.8 跨域网络

挑战：各个节点之间不同类型的交互可以用不同的网络（域）来描述，正如现实世界中，用户通过 Facebook 和 Twitter 等多个在线社交平台相互交互。由于利用来自相关源域的丰富信息有助于提升网络学习的性能[166]，我们可以开发深度学习模型，提升目标域社区发现任务的性能 [98]。
机遇：通过学习源域和目标域的共同潜在表示的域自适应，可以解决以下场景中的许多挑战：（1）缺乏明确的社区结构，（2）没有节点标签，（3）没有社区的groundtruth , (4) 较差的网络结构导致的表示性能不佳， (5) 不适合深度学习模型的小规模网络。在提出具有跨域信息的基于深度学习的社区发现方法时，必须解决应用迁移学习架构的问题，例如跨域系数的测量、分布偏移和计算复杂性。

13.9 多属性视图网络

挑战：现实世界中的网络比实验环境下的网络往往更加复杂[167]。多属性图网络提供了一种根据多个视图描述关系信息的视角，每个视图都包含一种节点属性[168]。利用各个视图之间的互补性，可以提升社区发现的性能[169]。
机遇：一个简单的工作流是组合从每个视图单独学习的表示，但会引入多视图数据的噪声/冗余。为解决此问题，深度学习尝试通过学习社区发现的通用聚类嵌入来提取多个视图之间的一致性信息 [111]。由于多视图节点属性在学习过程中仍然需要更好的集成方案，因此鼓励更多的工作来研究多视图社区检测的全局表示问题以避免次优。

13.10 带符号的网络

挑战：人们越来越注意到并不是所有连接关系都会使节点更接近。比如友谊表示积极的情绪（即喜欢和支持），而敌人则表示消极的态度（即不喜欢）。边的语义关系的区别可以用符号来刻画 [170]。由于正连接和负连接对节点的影响差异较大，以往在无符号网络上设计的社区发现方法并不适用。
机遇：在带符号网络中进行社区发现对主要挑战在于适应负连接。应该利用深度学习技术来正确表示带符号网络中社区发现的正负关系。与正关系不同，基于负关系的不同节点成对约束为学习带符号网络的社区发现的网络嵌入，提供了一种潜在解决方案 [94]。未来的工作可以处理带符号的边，考虑如何使用较少的先验知识。

13.11 动态网络

挑战：网络不是静态的，而是随着急剧变化的网络结构和时序的语义特征而演变的。深度学习模型应该快速捕获网络上发生的变化，以探索社区的演化情况。
机遇：深度学习和社区发现都需要处理不断变化的数据分布和不断发展的数据规模。通过静态网络快照重新训练不是进行动态社区发现的理想解决方案。在我们的文献综述中，只有一项研究通过设计演化的 AE 来发现动态网络中的社区，其旨在通过快照发现平滑变化的社区结构 [96]。动态网络的技术挑战集中在控制模型训练过程中的动态（即空间和时间属性）。动态社区发现的未来方向包括：（1）研究影响社区结构的空间变化；（2）学习具有时间语义特征的深度模式，如节点属性和边上的符号信息；（3）开发深度社区发现方法以处理网络动态并实现快照的鲁棒性。

13.12 大规模网络

挑战：大规模网络可能包含数百万个节点、边和社区等结构模式。它们固有的尺度特征，如无标度[21][171]，会影响深学习模型在社区发现任务中的性能。可扩展性是深度学习在大规模网络环境中实现社区检测的关键问题[17]。我们希望开发一种鲁棒而灵活的深度学习方法，从而实现高性能协同计算。
机遇：对于高维网络拓扑矩阵，深度学习中常用的关键降维策略，即矩阵低秩逼近，无法应对大规模网络。即使是当前的分布式计算解决方案仍然过于昂贵。因此，迫切需要在精度和速度方面都远远超过当前基准的新型深度框架、模型和算法。

总结

本研究提供了社区发现方法的全面概述。近十年来，社区发现的发展在很大程度上依赖于深度学习模型，深度学习是社区发现的一个趋势。同时，深度学习影响社区发现的过程，大量研究成果可从具有高影响力的国际会议和被多个领域讨论的同行评审期刊中获得。根据我们的研究，深度学习模型显著提高了社区发现的有效性、效率、稳健性和适用性。与传统的社区发现方法相比，新技术在使用上更加灵活，并且可以在粗略的预处理中利用更大量的数据。我们针对收集的最新文献设计了一个分类法，将其分为六类。在每个类别中，深度学习模型都以社区发现为目标，即编码表示和优化聚类结果。我们讨论了每个深度学习模型对社区发现任务的贡献。此外，我们根据回顾的文献总结并提供了丰富的资源，即数据集、评估指标和开源代码。我们还深入了解了一系列社区发现的实际应用。最后，我们确定了开放的研究方向，以促进该领域的进一步研究。

你可能感兴趣的:(图聚类,深度学习,聚类算法,机器学习,gcn,图嵌入)

【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
STM32中的UART详解
前言在嵌入式开发中，串口通信是最常用的调试与数据传输方式之一。UART（UniversalAsynchronousReceiver/Transmitter，通用异步收发传输器）作为一种简单、可靠的异步通信协议，被广泛应用于STM32与传感器、上位机、蓝牙模块等外设的交互场景。本文将从协议基础到STM32实战，全面解析UART协议在STM32中的应用，包含硬件设计、软件配置、实战案例及调试技巧，适合
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
【Rust】数据类型 Panda-gallery Rust rust 算法开发语言
目录思维导图1.数据类型概述1.1标量类型1.1.1整数类型1.1.2浮点数类型1.1.3布尔类型1.1.4字符类型1.2复合类型1.2.1元组类型1.2.2数组类型2.类型注解与类型推断3.整数溢出处理4.数字运算5.示例思维导图1.数据类型概述Rust是一种静态类型语言，所有变量的类型在编译时必须明确。Rust支持两种主要的数据类型：标量类型和复合类型。1.1标量类型标量类型表示单一值，Rus
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
SQLite - C/C++编程环境搭建与使用指南 lsx202406 开发语言
SQLite-C/C++编程环境搭建与使用指南引言SQLite是一款轻量级的数据库管理系统，广泛应用于嵌入式系统、移动设备、Web应用等场景。其独特的架构和易用性使其成为许多开发者的首选。本文将详细介绍如何搭建SQLite的C/C++编程环境，并探讨如何在C/C++程序中集成SQLite数据库。环境搭建1.获取SQLite首先，我们需要从SQLite的官方网站（https://www.sqlite
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
【前端进阶】【实战】【性能优化】前端开发中的事件监听与DOM操作优化实践患得患失949 数字孪生前端性能优化前端
前端开发中的事件监听与DOM操作优化实践在前端开发中，事件监听器的管理和DOM操作的优化是提升应用性能和稳定性的关键。本文将结合具体案例，探讨如何通过技术手段解决这些问题，并分享一些实用的优化技巧。问题背景在一个基于高德地图的应用中，我们实现了一个信息窗口组件（InfoWindow），其中包含视频播放功能和轮播图展示。随着用户交互的增加，我们遇到了以下问题：信息窗口频繁打开关闭后，页面性能明显下降
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
嵌入式Linux内核镜像生成过程飘逸轻舞 linux arm开发运维嵌入式
嵌入式Linux内核镜像生成过程嵌入式Linux系统的核心组件是内核，它是操作系统的核心部分，负责管理硬件资源、提供系统调用接口以及驱动设备等功能。在嵌入式系统中，将内核编译成镜像文件是部署系统的关键步骤之一。本文将介绍嵌入式Linux的内核镜像生成过程，并提供相应的源代码示例。获取Linux内核源代码首先，我们需要获取Linux内核的源代码。可以从Linux官方网站（www.kernel.org
OneCode 图表组件核心优势解析
一、全方位的可视化能力OneCode图表组件提供了15+种专业图表类型，覆盖从基础到高级的数据可视化需求：基础图表：柱状图、折线图、饼图、面积图等高级图表：金字塔图、雷达图、仪表盘、LED图表等实时图表：实时折线图、实时柱状图、实时堆叠图等特殊图表：圆柱图、温度计图、角度仪表、水平线性仪表等这种丰富的图表类型支持，使得OneCode能够满足不同行业、不同场景下的数据可视化需求，从简单的数据展示到复
Linux 启动过程流程图--ARM版进击的程序汪 linux arm开发运维
以下是ARM版本Linux启动过程的超详细树状图，涵盖硬件上电到应用程序交互的全流程，并包含关键函数调用链及源码位置，适用于系统开发与调试场景：ARMLinux启动全流程（含函数调用链）ARMLinux启动流程（函数级调用链）│├───**1.硬件上电与BootROM阶段**│││├───硬件复位与初始化││├───CPU进入Reset异常向量（ARM异常向量表基址0x0或0xffff0000）│
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
SVN介绍（三）--SVN启动方式小蘑菇二号 SVN 快速入门 SVN
目录1.StandaloneServerMode（独立服务器模式）2.ApacheHTTPServerMode（与Apache结合模式）3.EmbeddinginApplicationMode（嵌入应用程序模式）4.FileSystemMode（文件系统模式）选择合适的模式Subversion（SVN）可以以不同的方式启动其服务器组件，以适应不同的部署需求。以下是几种常见的SVN服务器启动模式及其
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
单片机物联网应用中的 Pogopin、串口与外围模组通信技术解析麦德泽特单片机物联网嵌入式硬件人工智能系统安全
引言在物联网蓬勃发展的当下，单片机作为关键的嵌入式设备核心，承担着数据采集、处理与控制的重任。而在单片机构建的物联网系统中，高效可靠的通信至关重要。Pogopin接口、串口通信以及各类外围模组的协同工作，为单片机与外部设备、网络之间搭建起了信息交互的桥梁。深入了解和掌握这些技术，对于优化物联网应用、提升系统性能具有重要意义。Pogopin接口：实现便捷连接1.1Pogopin原理与结构Pogopi
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
从小白到进阶：解锁linux与c语言高级编程知识点嵌入式开发的任督二脉（1） small_wh1te_coder 嵌入式 linux c 嵌入式硬件算法 c 汇编面试 linux
【硬核揭秘】Linux与C高级编程：从入门到精通，你的全栈之路！第一部分：初识Linux与环境搭建，玩转软件包管理——嵌入式开发的第一道“坎”嘿，各位C语言的“卷王”们！你可能已经习惯了在Windows或macOS上敲代码，用IDE点点鼠标就能编译运行。但当你踏入嵌入式开发的大门，尤其是涉及到那些跑着Linux系统的“大家伙”（比如树莓派、工控机、智能路由器），你就会发现，一个全新的世界在你面前展
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
解锁数据结构“黑科技”：查表法的奇幻冒险大雨淅淅 #数据结构数据结构算法开发语言
目录一、数据结构的“神秘地图”：认识查表法二、揭开查表法的神秘面纱（一）构建查找表（二）在表中进行查找三、实际案例大揭秘（一）案例一：简单数值查找（二）案例二：复杂关系查找四、查表法的优势与局限（一）优势尽显（二）局限剖析五、与其他查找方法的巅峰对决（一）与顺序查找的较量（二）与折半查找的比拼六、查表法的应用领域大赏（一）嵌入式系统中的“得力助手”（二）数据处理中的“高效利器”七、总结与展望一、数
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23