最近实验室也给配了rtx3080显卡,但是30系列支持cuda11,tensorflow又没有对应cuda11的版本,通过了解现在还没有适配正式版本,通过阅读别人的博客,自己也尝试了很多,最后能成功调用gpu加速计算的是这个nvidia-tensoeflow-1.15.4。
一、ubuntu系统安装就不详细说了有很多大佬的博客写的很详细了,但我装了不下十几次。
建议挂载/tmp分区大一点内存,我有几次后面安装cuda的时候说/tmp内存不足。
双系统安装推荐几篇博客:
https://blog.csdn.net/qq_24624539/article/details/81775635
https://blog.csdn.net/qq_31192383/article/details/78876905
https://blog.csdn.net/guikunchen/article/details/88077330(这个链接是安装错了如何正确卸载)。
二、安装好ubuntu系统后,紧接着就是显卡驱动安装,显卡驱动安装有三种方法,一个是软件与更新里面会有推荐
在一个是ppa安装法,使用的是PPA仓库自动安装NVIDIA显卡,这种方法比较简单。推荐使用这种方法,可以看这篇博客https://blog.csdn.net/AlphaWun/article/details/90180338
第三种方法手动安装就不是很推荐了,个人感觉有点复杂!
一但完成安装一定要重启系统。开机后在终端输入命令查看。
$ nvidia-smi
三、cuda安装
下载网站https://developer.nvidia.com/cuda-toolkit-archive选择11.1.0的。base installer 下有两行命令一次执行就好了。此处下载如果速度慢的话可以换镜像源。之前说的就在此处安装时可能会报错说/tmp内存不足。
如果有报错尝试选择option,进去选 Driver options,然后选上第一项不安装OpenGl,应该就可以正常安装了。
选择第二个 cudnn library for linux(x86_64),下载保存,然后解压,解压直接在终端用命令行解压。
tar zxvf FileName.tgz
解压完成后把对应文件夹下的文件移动到cuda11.1对应文件夹下。可以手动移动也可以命令行移动。注意,解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda11.1内,这里我遇到了对cuda11.1没有操作权限,这个权限可以打开。
sudo chmod 600 ××× (只有所有者有读和写的权限)
sudo chmod 644 ××× (所有者有读和写的权限,组用户只有读的权限)
sudo chmod 700 ××× (只有所有者有读和写以及执行的权限)
sudo chmod 666 ××× (每个人都有读和写的权限)
sudo chmod 777 ××× (每个人都有读和写以及执行的权限)
权限打开后把对应文件夹下所有文件复制过去后,要回复这个文件夹为原来的权限,不然显示cuda没有安装。检查安装成功没有。
nvcc -V
五、安装tensorflow,建议先安装anaconda,创建环境在独立环境下安装。
安装tensorlfow索引
pip install nvidia-pyindex
在安装nvidia-tensorflow-1.15.4之前请先安装这些安装包,不然多半会报错。
安装包提取链接: https://pan.baidu.com/s/1p_US57Ttjl96drvv24a6eA 密码: 8mkp
下载好安装包,安装包中的文件都是whl文件,在下载好的文件夹打开终端执行命令行依次安装。
pip install filename.whl
pip install nvidia-tensorflow
安装完成后测试。速度是真的快,CPU两小时,这里3分钟。
看了一下显存9248/10015.
参考博客链接:
https://blog.csdn.net/baidu_36602427/article/details/86548203
https://blog.csdn.net/tjuyanming/article/details/80862290
https://blog.csdn.net/guikunchen/article/details/88077330
https://blog.csdn.net/wu496963386/article/details/109583045
https://blog.csdn.net/qq_36999834/article/details/107589779