Linux服务器 安装Pytorch GPU版本

实验室服务器重做系统之后,之间搭建的Python环境已甚嚣尘上,只好从头再来。但是过程中遇到很多莫名其妙的bug,特此立章记录,望对他人有所帮助。作为一个深度学习的初学者,个人对所谓的版本没有什么特别要求,只希望所有版本号对应,再无bug。

个人使用的是Xshell 7作为链接服务器的工具,这个软件似乎是收费的,但是白嫖能用,就不放链接了。之后新建链接,确定个人的服务器IP地址,端口号等信息就可以了。
Linux服务器 安装Pytorch GPU版本_第1张图片

进入服务器之后,就可以开始安装Pytorch了。首先我们需要安装Anaconda,至于这个东西具体是什么,可以理解成一个python环境小管家,帮助你管理各个版本的python环境。可以官网瞅一眼,按个门https://www.anaconda.com/。

首先,我们需要下载Anaconda的安装包。由于某些原因,当我的安装包下好之后,出现了【段错误,核心已转储】,可能是给我分配的内存不够吧。所以选择安装Miniconda。下载地址如下:

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-4.3.14-Linux-x86_64.sh

在下载完成后,执行下面的指令:

bash Miniconda3-4.3.14-Linux-x86_64.sh

中间回车和yes同意之后,就可以了。安装之后需要重启。
安装完成之后,利用dir命令,就可以看到目录下的文件。
在这里插入图片描述
可以cd进去看一下:
Linux服务器 安装Pytorch GPU版本_第2张图片
其中envs就是存放你创建的虚拟环境的地方。下面我们就可以执行conda命令了,但是这里出现了第一个问题,就是无法识别conda命令。这个可能是没有激活,使用,就可以了。这样命令行前端会出现base,需要退出可以使用conda deactivate命令。

source ~/.bashrc

然后创建虚拟环境,具体指令如下:

conda create -n 环境名 python=3.6

激活环境:

conda activate 环境名

这时候命令行前面就以改环境名开头。

下面我们就要进入pytroch的安装了。这里的版本号一定要注意,我们可以使用

cat /usr/local/cuda/version.txt

查看版本号。
在这里插入图片描述
这里又遇到了bug,根据我的版本号,进入pytorch官网,但是没有10.1的选项。而且根据其他的帖子,需要输入对应的版本号,例如下图
在这里插入图片描述
这是一个大坑,如果这样做,会显示缺少ELF头文件。所以不需要使用这种方式。直接

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

注意,我这里安装的版本是10.2,之所以不是跟我的服务器相适应的,是因为我之前在安装10.1的之后,发现pytorch版本还是CPU的,并不能使用GPU。而且Pytorch官网没有10.1的选项。所以在安装10.2版本之后,一切正常使用。

你可能感兴趣的:(一些Bug,pytorch,linux,服务器)