网络嵌入(network embedding)

Definition:图嵌入,又称网络嵌入,是网络表征学习的一种方法,旨在用低维、稠密的向量空间表示高维、稀疏的向量空间,所学习到的特征可以用于分类、回归、聚类等机器学习任务。

Remark: 稀疏指的是一个向量(空间)里面大部分元素都是0,只有少部分元素是非0的。

这里介绍一种特殊的网络嵌入算法,称为 Accelerated Attributed Network Embedding (AANE),加速属性网络嵌入,详细细节见:Xiao Huang, Jundong Li,  Xia Hu, 《 Accelerated Attributed Network Embedding》, DOI: 10.1137/1.9781611974973.71, In book: Proceedings of the 2017 SIAM International Conference on Data Mining, pp.633-641.

网络嵌入(network embedding)_第1张图片

AANE的优点在于它可以把嵌入工作同时交给多个workers独立、同时间完成,大大地节省了时间。

对比一般的网络嵌入方法,如PCA(主成分分析)、LINE(Large-scale Information Network Embedding)、DeepWalk等,AANE算法在很多数据集上表示出了提取特征的优越性,因此,它可以作为提取网络特征的有效工具。

代码可以在github上面找到(基于python):https://github.com/xhuang31/AANE_Python

(基于Matlab):https://github.com/xhuang31/AANE_MATLAB

在应用这个算法时,只需给定要输入的属性矩阵A,通过cosine相似性、pearson相关系数等相似性度量计算相似矩阵S(在源代码中可以按需要修改),针对无权重网络,W可以忽略,给定嵌入维度d,运行代码后即可得到最终的嵌入矩阵H。

 

你可能感兴趣的:(网络嵌入,图嵌入,算法)