Ubuntu20.04 安装深度学习环境 (drivers + cuda)
这几天想捣鼓TensorFlow的,所以就搞一下环境,Ubuntu20.04安装英伟达GPU环境。来用来学习tensorflow或者pytorch
去NVDIA 驱动官网搜索你的显卡需要的驱动型号并下载(如图)。
下面是我的电脑对应的驱动版本:
[图片上传失败...(image-101065-1606542172275)]
从搜索的结果可以看到,我的驱动对应的版本应该是455.45.01
那就下载.run文件,有点大,慢慢等待哟!
1.安装显卡驱动
1.禁用nouveau
打开终端,输入:
sudo gedit /etc/modprobe.d/blacklist.conf
在blacklist.conf文件末尾加上这两行,并保存:
blacklist nouveau
options nouveau modeset=0
然后执行命令:
sudo update-initramfs -u //应用更改
重启电脑,验证是否禁用nouveau:
lsmod | grep nouveau
没有信息返回说明已禁用了如图:
2.安装NVIDIA驱动
打开terminal卸载旧版本NVIDIA驱动:
sudo apt-get remove --purge nvidia*
进入到下载好的.run文件夹下给驱动run文件赋予执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-455.45.01.run
注:替换自己下载的驱动名称
cd 下载目录 sudo chmod a+x 你下载的文件名
安装NVIDIA驱动
sudo ./NVIDIA-Linux-x86_64-455.45.01.run -no-x-check -no-nouveau-check -no-opengl-files
////只有禁用opengl这样安装才不会出现循环登陆的问题
-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件
安装过程中的选项:
The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。
问题没记住,选项是:install without signing
问题大概是:Nvidia's 32-bit compatibility libraries? 选择 No 继续。
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes
这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。
重启之后
sudo reboot
查看NVIDIA版本检验是否安装完成 nvidia-smi
安装 nvidia-cuda-toolkit
去Nvidia官网,按照步骤安装,网址会提示你一步一步怎么安装的。这里就不再赘述。
注意:使用network安装步骤
配置cuda的路径 Nvidia官网 ubuntu
$ export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64\
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
就可以验证 版本
nvcc --version
安装 cudnn
去Nvidia官网 登录然后下载,按照步骤安装,网址会提示你一步一步怎么安装的。这里就不再赘述。
cudnn 包含两个版本 Runtime 和 Developer 版本,区别是:
developer library 包含了在Ubuntu系统上开发深度学习时所需的cuDNN头文件,如果你不需要开发编译任何深度学习程序,而只是将其用于运行某些深度学习应用,那么只下载“runtime library”就足够了。
下载驱动的对应版本
注册,下载完deb文件
sudo dpkg -i xxx.deb
注:一定要去官网,一定要去官网,一定要去官网,来操作。
警告!警告!警告!一定要装10.2的cuda 11.1的还有问题 10.2 对应Nvidia驱动440-100 步骤同上
参考的文章TensorFlow 2.3 on Ubuntu 20.04 LTS with CUDA 11.0 and CUDNN 8.0