之前训练模型一直用的是师兄装好的工作站。这不用喜人的价格收购了一台工作站,debian系统,配备了1张1060卡,16GB内存,4核i5。虽然有点不上档次,但是也比CPU跑的快点,用来做尝试没有问题了。开始环境安装吧!
环境安装介绍
安装之前去官网上查一下需要什么版本的cuda和cudnn
显卡驱动安装
去官网下载对应的驱动程序 https://www.nvidia.cn/Download/index.aspx?lang=cn
下载好是一个run 文件,在命令行中输入
sudo bash NVIDIA*.run
然后等待安装就好,安装好之后可以使用
nvidia-smi
命令查看
cuda安装
去 https://developer.nvidia.com/cuda-downloads 下载cuda
下载好后直接运行
sudo bash cuda**.run
安装过程中还会提示你重新安装驱动,这一步要选择no,其他的选择accept,yes或者回车就行
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-9.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y
安装结束之后会看到
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-9.0
Samples: Installed in /home/textmine
验证cuda是否安装完成有如下的方法:
- 1.在终端中输入
nvcc -V
,如果成功则会看到相应的版本信息 - 2.使用刚才下载的例子进行验证
进入下载的sample中使用make
命令进行编译,执行编译好的文件./samples/1_Utilities/deviceQuery
cudnn安装
cudnn的下载需要自己在官网上注册一个账户,https://developer.nvidia.com/rdp/cudnn-download
这里下载的是deb文件,把这三个文件都安装到服务器上就行:
sudp dpkg -i *
进行安装
安装好后使用下载的例子进行验证在/usr/src
中。同样也需要进行编译才能运行
docker-ce安装
安装nvidia-docker 需要依赖docker-ce,所以需要先安装docker-ce,如果安装了docker,先移除。
sudo apt-get remove docker docker-engine docker.io
跟新源
sudo apt-get update
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
安装GPG证书
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add –
添加源
sudo add-apt-repository “deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable”
sudo apt-get -y update
安装docker就可以了
sudo apt-get install docker-ce
nvidia-docker 安装
安装好docker-ce之后只需要执行如下命令就可以安装好nvidia-docker
sudo apt-get install -y nvidia-docker2
环境安装好了,开始你的表演吧
需要什么工具可以中网上搜一搜有没有容器,如果有的话就可以肆意的操作,而不需要考虑整体的环境了
docker hub地址 https://hub.docker.com