保研结束了,去到了心仪的学校,开始了愉快的实验室搬砖生涯,首先要迈过的坎就是服务器的环境配置。我也是个小白,也算是边配置边学习,如果有讲的不对的地方欢迎指出。
在服务器上装py环境,我建议首先装anaconda,我目前个人理解像是一个环境管理工具,在上面怎么玩也不怕崩,方便重来。
安装特别简单,官网下载或者随便怎么搞到安装包,然后
bash 安装包路径/安装包名.sh
安装过程一路yes就好了,最后我看网上说anaconda会自动将环境变量添加到PATH里面,但我输入conda后提示没有该命令,所以还要自己手动加入环境变量。编辑 ~/.basrc
,在最后面加上
export PATH=/home/你的用户名/anaconda3/bin:$PATH
#默认路径是这个,具体可以根据你的安装目录改
修改完
source ~/.bashrc
更新下环境变量就没问题了。然后是现在我用到的一些简单的语句
查看环境
conda env list
创建环境(以py3.7为例)
conda create -n python37 python=3.7
进入环境
source activate python37
离开环境
source deactivate
然后一些管理包的操作和pip很像就不列举了,这里碰到个坑,在用fish shell的时候,怎么都不能进入环境,当然还以为是自己anaconda又装崩了,然后网上搜了搜知道了,由于设计、实现的种种原因,fish 并不支持某些其它 shell (例如 bash) 支持的特性,大概就是一些命令在fish下使用会失败,大部分都是基于bash的,所以还是安装一些东西的时候还是别用fish吧!!
其实实验室的服务器上是有cuda10.0的,但是pyg只支持cuda9.2,10.1和10.2,试了各种方法10.0都不行,因此没办法只能装10.2.服务器你懂的,不能直接升级cuda,因此相当于得装两个版本的cuda,然后自行切换,不影响其他人。
啊对了,有个坑的地方nvidia-smi
显示的cuda version是驱动支持的最高版本,nvcc --version
才是目前的cuda版本
安装包直接在官网下载就行,很方便可以帮忙做配置选择,不用自己再去查
我选择的是用run方法安装,参考图如下
具体的安装步骤参考了大佬的一篇博客,非常详细了,ubuntu 安装多个CUDA版本并可以随时切换
我说几个不一样的地方,我的安装包是这样的安装形式
accept后是这种,X代表选中
在已经有cuda10.0的情况下什么都不改直接安装的话,会报错
大概就是已经有一个驱动了,继续安装不是更新驱动,而且再装一个(迷惑操作),所以会报错。
然后根据大佬博客,有这几个地方需要改(已经有cuda版本的基础上)
取消驱动安装
取消连接(在CUDA Toolkit
按A进入高级选项)
安装路径貌似无所谓,我没改,介意的话可以改到自己目录下 ,默认是 /usr/loacl/
下
然后就是install就好了
安装后cuda后,我没用大佬博客中的方法,因为我感觉会影响到其他人正常使用,我直接改了自己的环境变量,还是编辑 ~/.basrc
,在最后面加上
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-10.2
##默认安装路径
然后source ~/.bashrc
更新下环境变量就可以了,问了问师兄,他那边一切正常,我这边是cuda10.2,大概就是成功了
pytorch的安装就很简单了,通过pyg已经知道只支持1.4.0和1.5.0/1.5.1版本,1.4.0官网又显示不支持cuda10.2,那么选项基本就唯一了,在之前anaconda的创建的py环境下
conda install pytorch==1.5.0 torchvision==0.6.0 cudatoolkit=10.2 -c pytorch
就好了
如果前面的都安装好了,接下来也是水到渠成,照着官网的安装方法就行,对于cuda10.2和pytorch1.5.0/1.5.1
pip install torch-scatter==latest+cu102 -f https://pytorch-geometric.com/whl/torch-1.5.0.html
pip install torch-sparse==latest+cu102 -f https://pytorch-geometric.com/whl/torch-1.5.0.html
pip install torch-cluster==latest+cu102 -f https://pytorch-geometric.com/whl/torch-1.5.0.html
pip install torch-spline-conv==latest+cu102 -f https://pytorch-geometric.com/whl/torch-1.5.0.html
pip install torch-geometric
安装完后,测试下github里的examples就没问题了
cd examples
python gcn.py
最后,忙了两三天的环境就搭好了,之间也经历了各种坑,各种回退重来,也请教了一些学长,服务器不能连外网是最坑的…还得手动下载到本地再上传到服务器,一来二去花的时间+++++。总的来说至少对ubuntu的一些指令更熟悉了,也算没有白费时间。希望对大家有所帮助。