2017.11.26-Node Embedding 应用

  本周主要是学习了Node Embedding的四个应用:link prediction、visualization、node classification、recommendation,了解了node classification除了Node Embedding外的其他实现,并学习node2vec的内部实现。

下面是Node Embedding的四个应用的定义:

  Link Prediction:Given a snapshot of a social network at time t, we seek to accurately predict the edges that will be added to the network during the interval from time t to a given future time t`.
  Visualization:Dimensionality reduction methods convert the high-dimensional data set X ={x1,x2,...,xn} into two or three-dimensional data Y = {y1,y2,...,yn} that can be displayed in a scatterplot. In the paper, we refer to the low-dimensional data representation Y as a map, and to the low-dimensional representations yi of individual datapoints as map points.
  Node Classification:Given a social network(or more generally ,any network structure )with labels on some nodes ,how to provide a high quality labeling for every node ?
  Recommendation:Given a heterogeneous information network G with user implicit feedback R, for a user ui, we aim to build personalized recommendation model for ui, and recommend a ranked list of items that are of interest to ui accordingly.

为什么Node Embedding能够用于这些应用?

  先看Node Embedding的定义:

2017.11.26-Node Embedding 应用_第1张图片
image.png

  定义中提到,通过Node Embedding得到的node的向量表示中,要保存有图的结构信息。而通过对link prediction、visualization、node classification、recommendation四个应用实现的描述可以知道:在实现时,主要借助的就是图的结构信息。所以由Node Embedding得到的Node的向量表示可以用在这些应用上。

实现Node Classification的其他算法:

  实现Node Classification有两个思路,一是先根据节点特征生成特征向量,然后利用特征向量和已知Labels构建分类器,二是通过随机游走传播标签。
  利用Node Embedding实现属于第一种思路,Node Embedding得到的node的向量表示即特征向量。通过Node Embedding得到的特征向量,只考虑了网络的结构,没有考虑节点本身的属性。除了Node Embedding之外,还有一些其他得到特征向量的方法。在一些方法中,利用node及其邻域(紧邻或邻近节点)已知的信息构建节点的特征向量,既考虑到了node本身的属性,也考虑到了图的结构。
  通过随机游走传播标签的算法中,基本思想是:用标签c∈Y标记节点vi∈V的概率是从vi开始的随机游走将结束于标记为c的节点的总概率。可以看出也并没有考虑node本身的属性,只是考虑了图的结构。
  下面打算进行的工作是继续学习 node2vec算法的内部实现,实现LINE算法,和比较两个算法。

你可能感兴趣的:(2017.11.26-Node Embedding 应用)