因为实验室服务器资源有限,我被分配的服务器经常变化,但是常常就分到连显卡驱动以及cuda都没有装的服务器,真的很头疼,我已经配了四五台了,特此记录一下,以便以后直接照版本安装。
Install nvidia driver
我的服务器配置是ubuntu18.04,显卡是1080Ti。
给ubuntu添加驱动的源:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt upgrade
查看设备型号得到推荐安装的驱动型号:
ubuntu-drivers devices
自动安装显卡驱动
sudo ubuntu-drivers autoinstall
重启
sudo reboot
如果重启一切顺利就命令检查
lsmod | grep nvidia
or
nvidia-smi
Install CUDA9.0 and cudnn7
查看 CUDA 版本:
cat /usr/local/cuda/version.txt
查看 CUDNN 版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
下载好cuda_9.0.176_384.81_linux.run
链接:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
ubuntu16.04版本的:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
安装cuda:
sudo chmod 777 cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176_384.81_linux.run -toolkit -samples -override --no-opengl-libs -silent
更改gcc版本
sudo apt install gcc-5 g++-5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
设置cuda环境变量
vim ~/.bashrc1
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda/extras/CPUTI/lib64
export CUDA_HOME=/usr/local/cuda-9.0/bin
export PATH=$PATH:$LD_LIBRARY_PATH:$CUDA_HOME
下载cudnn要在这个https://developer.nvidia.com/rdp/cudnn-archive链接中选择下载
复制cudnn库至cuda中
tar -zxvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/lib64/* /usr/local/cuda-9.0/lib64/
sudo cp cuda/include/* /usr/local/cuda-9.0/include/
安装tensoflow-gpu-1.14:
pip install -U tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple --user
tensorflow测试程序:
import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))