2018.1.14-网络表示学习综述

网络表示学习算法的主要区别在于算法类型，同一算法类型下的算法框架都是相似的。可以将网络表示学习算法分为以下几个类型：

基于谱方法的网络表示学习

从广义上看，谱方法是指利用输入数据矩阵的谱（比如特征值和特征向量，奇异值和奇异向量）的一类算法的统称。不同的算法中使用的矩阵不同。
代表算法有LLE(locally linear embedding)算法、LaplacianEigenmaps算法、DGE (directed graph embedding)算法。

基于最优化的网络表示学习

基于最优化的网络表示学习算法是指根据一个明确的优化目标函数，并且以节点在低维空间的向量表示作为参数，通过求解目标函数的最大化或最小化，求出节点的低维表示的一类算法。
代表算法有针对多标签分类任务定义优化目标函数的LSHM(latent space heterogeneous model)算法

基于概率生成式模型的网络表示学习

基于概率生成式算法的网络表示学习，是指用一个采样过程去建模网络数据的生成过程。通常以文本网络作为输入数据，文本网络是指网络中的每个节点都有对应的文本属性。
代表性的工作有Link-PLSA-LDA模型、RTM模型和PLANE模型。

基于力导向绘图的网络表示学习

力导向绘图（force-directed graph drawing）是指一类在美学上让人感到舒适的节点绘图方法，通常是基于网络中节点的相对位置，在节点之间和边之间分配作用力，从而将网络中的节点以某种方式放置在二维或者三维空间中，使得边的长度尽量相等，同时尽可能减少交叉边的数量。
代表性的算法有FR-layout和 KKlayout。

基于深度学习的网络表示学习

深度学习本质上是一种特征学习方法，其思想在于将原始数据通过非线性模型转变为更高层次的特征表示，从而获得更抽象的表达。与特征工程中需要人工设计特征不同，深度学习会自动从数据中学习出特征表示。
Deepwalk、LINE都是具有代表性的基于深度学习的模型。

基于谱方法的网络表示学习只考虑了结构信息，难以直接对信息网络进行应用。基于最优化的网络表示学习中，目标函数的定义和各个算法特定的网络分析任务有关。因此，得到的网络表示，可能在某些任务中表现突出，但在另外一些任务中表现比较差。如果只有网络的结构信息，而没有节点各自的文本内容，基于概率生成式模型的网络表示学习算法无法直接使用。基于力导向绘图的网络表示学习算法在可视化任务中表现较好，但节点的向量表示不能用于机器学习、数据挖掘等任务。基于深度学习的网络表示学习算法（如Deepwalk、LINE）还处于探索阶段，但在网络节点标签预测任务上的表现，已经超越了传统的方法，发展的空间比较大。