Node2Vec原理

node2vec 跟deepwalk类似，同样是通过随机游走产生序列，再将序列通过skip gram得到节点的embedding。
但与deepwalk不同的是，node2vec是有偏的随机游走。node2vec通过调整随机游走权重的方法使graph embedding的结果在网络的同质性（homophily）和结构性（structural equivalence）中进行权衡。

如上图所示，既可以认为u跟s1,s2,s3,s4它们是相似的，它们是网络中直接的邻居，这时称 homophily；也可以认为u应该跟s6更相似，这种称为结构相似，structural equivalence。

跳转概率

在node2vec算法中，是怎样控制BFS和DFS的倾向性的呢？主要是通过节点间的跳转概率。下图显示了node2vec算法从节点t跳转到节点v后，下一步从节点v跳转到周围各点的跳转概率。

跳转概率为：

其中wvx是边vx的权重，αpq的定义如下：

其中，dtx指的是节点t到节点x的距离，超参数p和q共同控制着随机游走的倾向性。参数p被称为返回参数（return parameter），p越小，随机游走回节点t的可能性越大，node2vec就更注重表达网络的同质性，参数q被称为进出参数（in-out parameter），q越小，则随机游走到远方节点的可能性越大，node2vec更注重表达网络的结构性，反之，当前节点更可能在附近节点游走。