首先更新依赖:
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install build-essential
第一步:禁用nouveau
终端中执行:
sudo gedit /etc/modprobe.d/blacklist.conf
打开文本后,在最后一行添加:
blacklist nouveau
options nouveau modeset=0
保存关闭,执行:
sudo update-initramfs -u
重启:
sudo reboot
重启后执行下面代码检查nouveau是否禁用成功:
lsmod | grep nouveau
没有输出说明禁用成功
第二步:Nvidia驱动安装
1.查找自己显卡的型号,去官网下载对应驱动
https://www.nvidia.cn/geforce/drivers/
2.在驱动的目录下,执行如下命令:
sudo chmod a+x NVIDIA-Linux-x86_64-455.45.01.run #(最后是你下载的显卡名字,和我的可能不一样)
sudo ./NVIDIA-Linux-x86_64-455.45.01.run --no-opengl-files --no-x-check --no-
nouveau-check
说明:
-no-opengl-files 只安装驱动文件,不安装 OpenGL 文件
–no-x-check 安装驱动时不检查 X 服务
–no-nouveau-check 安装驱动时不检查 nouveau
3.安装过程中出现的选项
(1)选择continue installation
(2)选择No
检查是否安装成功,执行代码:
nvidia-smi
出现上图表示安装成功
安装过程中可能出现的问题
解决办法:
sudo apt-get install gcc
2.Unable to find the tool"make"(注意是make)
解决办法:
sudo apt-get install make
3.显卡安装完成后可能会显示不出来,出现如下问题:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
解决办法,输入如下代码:
cd /usr/src
ls
查找对应的驱动版本
例如我的455.45.01
执行如下代码:
sudo apt-get install dkms
sudo dkms install -m nvidia -v 455.45.01(对应你的驱动版本号)
再次执行nvidia-smi 检查
第三步:CUDA 安装
查看tensorflow对应版本的CUDA,Cudnn,gcc,链接:
https://tensorflow.google.cn/install/source
下载对应版本的CUDA,链接:
https://developer.nvidia.com/zh-cn/cuda-downloads
输入gcc-v可以看到目前默认gcc版本
gcc –v
安装gcc7
sudo apt install gcc-7 g++-7
查看系统中存在的gcc版本
ls /usr/bin/gcc*
使用update-alternatives进行版本切换,执行如下命令:
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 50
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 100
sudo update-alternatives --config gcc
再次输入gcc -v可以看到目前默认gcc版本
gcc -v
在安装包的目录下,执行如下命令:
sudo sh cuda_10.1.168_418.67_linux.run
1.选择accept
2.不选择Driver,点击空格即可,然后选择install安装
配置环境变量:
gedit ~/.bashrc
文件最后添加
export PATH=/usr/local/cuda-10.1/bin/${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
更新环境变量
source ~/.bashrc
检测是否安装成功:
nvcc –V
第四步: cudnn安装
下载对应版本的cudnn(需要注册,很简单):
https://developer.nvidia.com/cudnn-download-survey
在安装包的目录下解压:
tar -xvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
复制并添加读取权限
sudo cp ./cuda/lib64/* /usr/local/cuda/lib64
sudo cp ./cuda/include/cudnn.h /usr/local/cuda/include
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
检查是否安装成功
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
出现下图说明安装成功
由于ubuntu系统自带Python3.8,所以我们不需要重新去安装Python
根据自己的需求安装TensorFlow,pytorch等
1.安装TensorFlow
sudo pip3 install tensorflow-gpu==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
2.安装pytorch
sudo pip3 install torch -i https://pypi.tuna.tsinghua.edu.cn/simple
终端输入:
python
import tensorflow
import torch
没有报错说明安装成功!
这篇文章是根据自己的理解写的,哪里写的不对敬请指正。
结束~