2017.11.26-Node Embedding 应用

本周主要是学习了Node Embedding的四个应用：link prediction、visualization、node classification、recommendation，了解了node classification除了Node Embedding外的其他实现，并学习node2vec的内部实现。

下面是Node Embedding的四个应用的定义：

Link Prediction：Given a snapshot of a social network at time t, we seek to accurately predict the edges that will be added to the network during the interval from time t to a given future time t`.
Visualization：Dimensionality reduction methods convert the high-dimensional data set X ={x1,x2,...,xn} into two or three-dimensional data Y = {y1,y2,...,yn} that can be displayed in a scatterplot. In the paper, we refer to the low-dimensional data representation Y as a map, and to the low-dimensional representations yi of individual datapoints as map points.
Node Classification：Given a social network(or more generally ,any network structure )with labels on some nodes ,how to provide a high quality labeling for every node ?
Recommendation：Given a heterogeneous information network G with user implicit feedback R, for a user ui, we aim to build personalized recommendation model for ui, and recommend a ranked list of items that are of interest to ui accordingly.

为什么Node Embedding能够用于这些应用？

先看Node Embedding的定义：

image.png

定义中提到，通过Node Embedding得到的node的向量表示中，要保存有图的结构信息。而通过对link prediction、visualization、node classification、recommendation四个应用实现的描述可以知道：在实现时，主要借助的就是图的结构信息。所以由Node Embedding得到的Node的向量表示可以用在这些应用上。

实现Node Classification的其他算法：

实现Node Classification有两个思路，一是先根据节点特征生成特征向量，然后利用特征向量和已知Labels构建分类器，二是通过随机游走传播标签。
利用Node Embedding实现属于第一种思路，Node Embedding得到的node的向量表示即特征向量。通过Node Embedding得到的特征向量，只考虑了网络的结构，没有考虑节点本身的属性。除了Node Embedding之外，还有一些其他得到特征向量的方法。在一些方法中，利用node及其邻域（紧邻或邻近节点）已知的信息构建节点的特征向量，既考虑到了node本身的属性，也考虑到了图的结构。
通过随机游走传播标签的算法中，基本思想是：用标签c∈Y标记节点vi∈V的概率是从vi开始的随机游走将结束于标记为c的节点的总概率。可以看出也并没有考虑node本身的属性，只是考虑了图的结构。
下面打算进行的工作是继续学习 node2vec算法的内部实现，实现LINE算法，和比较两个算法。

2017.11.26-Node Embedding 应用

下面是Node Embedding的四个应用的定义：

为什么Node Embedding能够用于这些应用？

实现Node Classification的其他算法：

你可能感兴趣的:(2017.11.26-Node Embedding 应用)