2017.12.24-LINE实验、Skip-Gram理解

  本周的主要工作有两个,一个是继续LINE的实验,二是深入学习了Skip-Gram模型。
  在用小图测试过LINE的代码没有问题后,在跟代码一起给出的YouTube的数据集上运行了LINE算法。不过因为给出的YouTube数据集只是一个单纯的图,没有标签等其他信息,得到图中节点的向量表示后,并不能进行多标签分类等网络挖掘任务,没有什么意义。
  因此,又下载了论文中用到的维基百科的网页和网页的分类信息(点击下载数据集),通过这个数据集,就可以进行论文中用到的文档分类任务。目前还在对下载的数据进行处理,没有运行LINE算法。
  在DeepWalk的论文中,用到了Word2vec中提出的Skip-Gram模型,但是对模型没有详细的介绍。因为对Skip-Gram模型的理解有一些不足,本周又深入学习了Skip-Gram模型,对模型的理解写在:Skip-Gram模型理解。
  下周的计划是一方面继续做LINE的实验,起码在一个数据集上,使用LINE算法得到的节点表示,完成一个网络挖掘任务;另一方面,再多了解其他一些Graph Embedding的算法。

你可能感兴趣的:(2017.12.24-LINE实验、Skip-Gram理解)