2018.1.14-网络表示学习综述

  网络表示学习算法的主要区别在于算法类型,同一算法类型下的算法框架都是相似的。可以将网络表示学习算法分为以下几个类型:

基于谱方法的网络表示学习

  从广义上看,谱方法是指利用输入数据矩阵的谱(比如特征值和特征向量,奇异值和奇异向量)的一类算法的统称。不同的算法中使用的矩阵不同。
  代表算法有LLE(locally linear embedding)算法、LaplacianEigenmaps算法、DGE (directed graph embedding)算法。

基于最优化的网络表示学习

  基于最优化的网络表示学习算法是指根据一个明确的优化目标函数,并且以节 点在低维空间的向量表示作为参数,通过求解目标函数的最大化或最小化,求出节 点的低维表示的一类算法。
  代表算法有针对多标签分类任务定义优化目标函数的LSHM(latent space heterogeneous model)算法

基于概率生成式模型的网络表示学习

  基于概率生成式算法的网络表示学习,是指用一个采样过程去建模网络数据的生成过程。通常以文本网络作为输入数据,文本网络是指网络中的每个节点都有对应的文本属性。
  代表性的工作有Link-PLSA-LDA模型、RTM模型和PLANE模型。

基于力导向绘图的网络表示学习

  力导向绘图(force-directed graph drawing)是指一类在美学上让人感到舒适的节点绘图方法,通常是基于网络中节点的相对位置,在节点之间和边之间分配作用力,从而将网络中的节点以某种方式放置在二维或者三维空间中,使得边的长度尽量相等,同时尽可能减少交叉边的数量。
  代表性的算法有FR-layout和 KKlayout。

基于深度学习的网络表示学习

  深度学习本质上是一种特征学习方法,其思想在于将原始数据通过非线性模型转变为更高层次的特征表示,从而获得更抽象的表达。与特征工程中需要人工设计特征不同,深度学习会自动从数据中学习出特征表示。
  Deepwalk、LINE都是具有代表性的基于深度学习的模型。

  基于谱方法的网络表示学习只考虑了结构信息,难以直接对信息网络进行应用。基于最优化的网络表示学习中,目标函数的定义和各个算法特定的网络分析任务有关。因此,得到的网络表示,可能在某些任务中表现突出,但在另外一些任务中表现比较差。如果只有网络的结构信息,而没有节点各自的文本内容,基于概率生成式模型的网络表示学习算法无法直接使用。基于力导向绘图的网络表示学习算法在可视化任务中表现较好,但节点的向量表示不能用于机器学习、数据挖掘等任务。基于深度学习的网络表示学习算法(如Deepwalk、LINE)还处于探索阶段,但在网络节点标签预测任务上的表现,已经超越了传统的方法,发展的空间比较大。

你可能感兴趣的:(2018.1.14-网络表示学习综述)