ubuntu 教你如何10分钟搭建深度学习环境

曾经有没有被搭建环境搞得晕头转向?装了无数次什么乱七八糟的死机?各种界面显示不对?一堆的命令要敲?什么进入F1模式啊,什么下载什么乱七八糟的文件啊,nvidia,cudnn,cuda..... 其实基本不需要, 你要下载的就一样,Anaconda。往下看就知道了,   首先搞明白驱动driver和cudnn,cuda的区别和关系。

1.驱动和显卡有关系,要根据自己的显卡找到适合自己版本的驱动最重要,不要以为驱动越高越好,你显卡虽然能装上,但是后期还是会出现各种各样头疼的问题,所以合适你的才是最好的

2.cuda 和cudnn是根据显卡版本来确定版本的,不要自己装最高的版本。要根据版本去调整

3.tensorflow 版本不向下兼容,所以需要考虑cuda版本安装。pytorch不需要考虑,一般来说装默认版本就可以,有特殊需求自己调整。

1.安装NVIDIA驱动

 

一.官方版本(适用于阿里云,各种云。。还有你的显卡是市面上1-2年内出来的)

1). 登录google的tensorflow网站,网址在这里tensorflowGPU安装地址

往下滑,找到自己对应ubuntu系统版本,楼主用的18.04。

# Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

# Install NVIDIA driver
sudo apt-get install --no-install-recommends nvidia-driver-418
# Reboot. Check that GPUs are visible using the command: nvidia-smi

# Install development and runtime libraries (~4GB)
sudo apt-get install --no-install-recommends \
    cuda-10-0 \
    libcudnn7=7.6.2.24-1+cuda10.0  \
    libcudnn7-dev=7.6.2.24-1+cuda10.0


# Install TensorRT. Requires that libcudnn7 is installed above.
sudo apt-get install -y --no-install-recommends libnvinfer5=5.1.5-1+cuda10.0 \
    libnvinfer-dev=5.1.5-1+cuda10.0

copy下这段代码,然后打开终端。

输入命令

vim start.sh

将上面的代码copy进去,保存退出。然后运行start.sh文件开始安装。  地址什么的无所谓,中间会让你输入几个y,输入进入回车就完事了。

全部装完之后,重新打开终端

输入nvidia-smi。出现下面这个界面就OK了

ubuntu 教你如何10分钟搭建深度学习环境_第1张图片

二.带桌面版本

适合带图形界面,官方版本可以纯终端安装还是需要学习一下

看好,打开软件与更新app,

打开附加驱动这个标签,找到适合自己最新的版本,点击安装或者更改应用,等待安装完成就OK了,是不是很简单,哈哈。一定要这么干,千万别去下载,新学者你不懂配置,安装1-2可能还装不好,就这个,最简单。装好后,重新输入nvidia-smi,就ok

ubuntu 教你如何10分钟搭建深度学习环境_第2张图片

ps,没有出现驱动的,进入终端,sudo apt-get update 更新一下

还有记得进入第一个标签软件与驱动,将源改成国内源,我一般使用阿里源

 

好了,驱动安装好了。我们进入下一个环节。

2.安装Anaconda。(没错,是安装Anaconda,而不是cuda,cudnn)

我要下班了,剩下的下次再写,先快速写一个最简单的办法

1.网上下载Anaconda,去官网,下载速度很快。默认安装直接安装好。可以参考其他教程安装Anaconda。

2,安装完之后,打开你的终端前面会出现(bash)这个标志。去其他地方找一个别人导出来的虚拟环境。后缀是.yaml 结尾的文件。然后输入

conda env create -f environment.yaml#最后这个换成自己的yaml文件的文件名

安装好后。你会发现cudnn,cuda也安装好了。在你的虚拟环境下面。要使用这个虚拟环境

首先conda env list。查看所有的环境

然后输入source activate xxx,xxx是你上面找到conda下面的环境名称,安装完成。

conda好处就是你可以无限的换环境,安装多个环境,安装多个不同版本的tensorflow,cuda,cudnn,都不会影响。

附上我自己目前在用的yaml文件。cuda9.0,cudnn7.3.tensorflow1.11  足够应付99%的gitghub代码。适合自己的才是最好的,还是那句话。

剩下的详细安装下次有时间再来继续补充,不使用yaml的,其实也很简单。就是自己进入虚拟环境。conda install xxx 或者 pip install xxx 一个一个安装就完事了

我的yaml上传申请通过了,下面是地址,有需要的可以自己去下载下下载地址

 

你可能感兴趣的:(机器学习,深度学习)