LargeVis的使用

前言

LargeVis在高维数据可视化、网络可视化上具有良好的表现,其核心思想是将高维数据通过网络重构的方法转化为二维数据,以期在二维空间中对高维数据进行展示。该项工作是Jian Tang等人在2016年提出的https://arxiv.org/pdf/1602.00370.pdf,可以看作是网络重构(embeddedness)在数据可视化领域的应用。

源码

https://github.com/lferry007/LargeVis

VisualStudio2015

推荐安装VisualStudio2015或者更高版本,高版本的VisualStudio无论是在编译Boost,还是在安装LargeVis中都有很大的帮助,可以减少很多的麻烦。

在安装VisualStudio2015时,一定要安装python tools

参考http://www.aobosir.com/blog/2016/11/26/Python-pip-error-Unable-to-find-vcvarsall-bat/

Boost安装(win10)

在使用LargeVis之前,如果是windows平台,要保证电脑上有Boost。

  1. 下载Boost,生成编译工具
    Boost的下载地址为http://www.boost.org/。下载完成后,解压压缩包boost_1_66_0.zip到本地磁盘,进入解压后的文件boost_1_66_0,双击bootstrap.bat,生成bjam.exe和b2.exe;
  2. 编译
    进入E:\boost_1_66_0,在VisualStudio2015的控制台程序输入bjam.exe stage --toolset=msvc-14.0 link=static runtime-link=shared threading=multi debug release进行编译。在编译的过程中尽量关闭所有无关的软件。由于是使用VisualStudio2015进行编译,所以toolset参数设置为msvc-14.0。

Boost安装参考http://blog.csdn.net/f_r_e_e_x/article/details/38849505

编译LargeVis

推荐使用python2.7(作者使用python2编写的源码),我在使用python3.6安装的时候,一直报错,但是网上也有人说使用python3安装成功了

将LargeVis源码下载解压之后,首先打开setup.py文件,更新其中的boost根目录和库目录路径:
LargeVis的使用_第1张图片
路径设置完毕之后,打开cmd命令行终端,输入:

python setup.py install

LargeVis便可以安装到python的库中,如果报出:

Unable to find vcvarsall.bat

在命令行终端输入

SET VS90COMNTOOLS=%VS140COMNTOOLS%

来配置系统环境变量 VS90COMNTOOLS指向 %VS你的版本COMNTOOLS%。之后,再次输入安装命令,如果一切顺利,应该会有如下的结果:
LargeVis的使用_第2张图片

LargeVis使用

出于学习角度的考虑,这里直接使用LargeVis作者在Github上提供的测试数据,命令行输入:

python LargeVis_run.py -input mnist_vec784D.txt -output mnist_vec2D.txt -threads 4

线程数根据运行机器的性能选择。程序运行结束后,命令行输入:

python plot.py -input mnist_vec2D.txt -label mnist_label.txt -output mnist_vec2D_plot

其中的mnist_label.txt是样例数据mnist_vec784D.txt中70000个特征向量的标签
LargeVis的使用_第3张图片

你可能感兴趣的:(LargeVis的使用)