前言:买完RTX3090后发现CUDA、cudnn、tensorflow版本匹配问题,查阅了很多资料,最终选定标题中的版本进行安装。亲测能够跑起来!!!
1、安装Nvidia显卡驱动:
系统设置——软件更新——附加驱动——使用NVIDIA binary driver -version.......——应用更改——重启(附图如下)
打开终端输入nvidia-smi查看安装的驱动如下图
至此驱动安装成功!
2、安装Anaconda3
此处注意Anaconda版本要与python版本对应,我使用的是python3.7,所以选择安装Anaconda3-2019.07-Linux-x86_64.sh
在Anaconda文件所在的文件夹下右键打开终端,执行如下命令:
bash Anaconda3-2019.07-Linux-x86_64.sh
在安装过程中,如遇到[yes | no]的选择是,都选择yes
3、安装CUDA11.0
3.1 去官网https://developer.nvidia.com/cuda-toolkit下载CUDA,我下载的是CUDA11.0,注意选择符合你系统的文件下载,我这儿选择的安装类型是runfile
3.2 对系统进行更新,打开终端输入如下命令:
sudo apt-get update
sudo apt-get upgrade
3.3 改权限并安装,在CUDA文件所在文件夹打开终端执行以下命令:
sudo chmod 777 cuda_11.0.2_450.51.05_linux.run
sudo ./cuda_11.0.2_450.51.05_linux.run
3.4 添加环境变量
sudo gedit ~/.bashrc
在文件最后添加如下内容:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
保存退出后,执行:
source ~/.bashrc
3.5 检测是否安装成功:
打开终端输入:nvcc --version
至此CUDA安装完成!
4、安装cudnn
需要注意的是这边cuDnn版本需要与CUDA的版本对应,我用的是8.0.5版本.
4.1 在文件所在文件夹打开终端,执行以下命令,解压文件:
tar -xvf cudnn-11.0-linux-x64-v8.0.5.39.tgz
4.2 把解压出的文件copy到cuda中对应文件夹
sudo cp cuda/lib64/* /usr/local/cuda/lib64/
sudo cp cuda/include/* /usr/local/cuda/include/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
4.3 建立软链接
在/usr/local/cuda/lib64目录下打开终端,执行如下指令:
sudo chmod +r libcudnn.so.8.0.5
sudo ln -sf libcudnn.so.8.0.5 libcudnn.so.8
sudo ln -sf libcudnn.so.8 libcudnn.so
sudo ldconfig
4.4 检查cuDNN是否安装成功,执行以下命令:
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
至此安装成功!
5 安装tensorflow-gpu
5.1 创建用于安装tensorflow-gpu的conda计算环境 ,执行以下命令:
conda create -n lg python=3.7(此处lg是我自己起的名称,大家可以自己起)
5.2激活环境:
source activate lg
5.3 安装tensorflow-gpu
pip install tensorflow-gpu==2.4
在安装tensorflow过程中由于网速原因一直失败
后面换成pip install --upgrade --default-time=1000 tensorflow-gpu==2.4后安装成功!
5.4 测试
打开终端,激活环境,输入如下代码:
import tensorflow as tf
print(tf.test.is_gpu_available())
输出结果为True,则成功!!!
6、vscod上测试
在vscode上运行一个程序,会出现一个waring,这个问题我在网上也查阅了相关资料。原因是我安装的CUDA11.0的版本是低于RTX3090显卡的要求(最好是安装11.1及以上)。但是目前,tensorflow官方发布的版本匹配不了CUDA11.1及以上,所以我就安装CUDA11.0匹配tensorflow-gpu2.4。当出现这个warning时不用管它,这个warning重复出现一会儿程序就会正常训练了!!!
以上是我安装的全过程,我实现了成功运行,特此发布出来希望对大家有所帮助!!!