一、踩坑无数
第一次安装没成功,去了windows环境下安装,结果有问题,又重装了ubuntu系统。
第一次,装了CUDA9.0+CUDNN7.3.1,结果有的程序运行出错,并行计算出现错误,可能有些不兼容。
E tensorflow/stream_executor/cuda/http://cuda_blas.cc:674] failed to run cuBLAS routine cublasSgemm_v2: CUBLAS_STATUS_EXECUTION_FAILED
不知道怎么解决,应该是因为显卡RTX2080ti太新,CUDA版本驱动有问题。所以尝试,卸载CUDA9.0和CUDNN,
1.卸载CUDA9.0和CUDNN,在终端输入
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
然后提示我
Not removing directory, it is not empty: /usr/local/cuda-9.0/./lib64
Removing directory /usr/local/cuda-9.0/./bin
Not removing directory, it is not empty: /usr/local/cuda-9.0
也不知道怎么回事,就内有删除几个文件夹。
把环境变量里的cuda的路径给删除了
# 打开文件
gedit ~/.bashrc
#然后将末尾之前的路径删除
3.下载CUDA10.0和CUDNN7.4.2
主要参考博客:
CUDA9.0+CUDNN7.1.3:https://blog.csdn.net/ctwy291314/article/details/80951148
CUDA10.0+CUDNN7.4.2 :https://blog.csdn.net/sun___shy/article/details/87614110
结果出现错误,一直pipTensorFlow时请求超时。网络速度慢。
更换下载别人编译好的TensorFlow 1.12.0 GPU (CUDA 10.0, cuDNN 7.3, TensorRT 5; MKL) Python 3.6.*, Buntu 18.04 #90
https://github.com/yaroslavvb/tensorflow-community-wheels/issues
但是cudnn是7.3的,所以后续极有可能要更改cudnn版本。哎。。。
不过,这个只要解压copy到相应的路径就行了,就是下载速度比较慢。
解压cudnn
tar zxvf cudnn-10.0-linux-x64-v7.3.0.29.tgz
复制到相应的路径:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
4.然后下载TensorFlow-gpu==1.12.0
pip3 install --no-cache-dir https://github.com/evdcush/TensorFlow-wheels/releases/download/tf-1.12.0-gpu-10.0/tensorflow-1.12.0-cp36-cp36m-linux_x86_64.whl
下载的时候老是出现中断,出现 read time out。 由于网络不好,于是下载好.whl文件,然后在进行本地安装
# 先进行安装wheel
pip3 install wheel
# 然后cd 进入你的.whl文件夹下,进行安装
pip3 install xxx.whl
终于啊,安装好了。接下来进行验证tensorflow
import tensorflow as tf
print(tf.__version__) # 注意着version前面是两个下划线
# 安装keras
pip3 install keras
#安装pillow ,看自己程序需要进行安装
pip3 install pillow
终于运行成功了!