装UBUNTU 和 pycharm 装tensorflow-gpu就不多介绍了。
首先先装英伟达的驱动,这里用的是PPA 安装
sudo add-apt-repository ppa:graphics-drivers/ppa
安装完以后检查一下更新
sudo apt update
然后在系统设置->软件和更新->附加驱动中就可以找到显卡驱动了。我用的是418.56版本。
下载cuda10.0的安装文件 cuda_10.0.130_410.48_linux.run
官方下载(点击进入下载界面)
sudo sh cuda_10.0.130_410.48_linux.run
一直按回车跳过协议内容
accept
n(不要安装显卡驱动,上面装过了)
y
y
y
安装完成后,设置环境变量。
在/home/user/ 有一个.bashrc文件,将相关路径按下面的格式进行修改。如果没有找到,则按Ctrl+H键显示隐藏文件。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
在终端运行:source ~/.bashrc
然后检查一下CUDA 有没有装好
在终端输入nvcc --version,如果显示下面的文子就说明安装成功了。
下载所需要的cudnn-10.0-linux-x64-v7.6.3.30.tgz(与CUDA版本要对应)
官方(点击进入下载界面)需要注册帐号
解压文件,并在解压出的cuda文件夹中打开终端,执行如下命令:
sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib64/lib* /usr/local/cuda/lib64/
查看当前cudnn的版本
在终端输入
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
如果出现下图所示版本信息(三个数字的意思是当前版本为7.6.3),说明安装成功。
检查一下能不能用GPU跑程序
import tensorflow as tf
sess = tf.Session()
a = tf.constant(2)
b = tf.constant(3)
print(sess.run(a + b))
运行上面程序,如果出现上面的信息说明成功了。但是也可能出现打不开动态库的错误。
报错如下:
Could not dlopen library 'libcublas.so.10.0'; dlerror: libcublas.so.10.0: can not open shared object file: No such file or directory
2019-07-31 15:42:51.951206: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Could not dlopen library 'libcufft.so.10.0'; dlerror: libcufft.so.10.0: canno t open shared object file: No such file or directory
2019-07-31 15:42:51.951320: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Could not dlopen library 'libcurand.so.10.0'; dlerror: libcurand.so.10.0: can not open shared object file: No such file or directory
2019-07-31 15:42:51.951429: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Could not dlopen library 'libcusolver.so.10.0'; dlerror: libcusolver.so.10.0: cannot open shared object file: No such file or directory
2019-07-31 15:42:51.951535: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Could not dlopen library 'libcusparse.so.10.0'; dlerror: libcusparse.so.10.0: cannot open shared object file: No such file or directory
在控制台中输入:
sudo cp /usr/local/cuda-10.0/lib64/libcublas.so.10.0 /usr/local/lib/libcublas.so.10.0 && sudo ldconfig
sudo cp /usr/local/cuda-10.0/lib64/libcufft.so.10.0 /usr/local/lib/libcufft.so.10.0 && sudo ldconfig
...
按照上述命令把这些不能找到的文件copy到/usr/local/lib/
参考博客:
https://blog.csdn.net/qq_36368388/article/details/97927154
https://blog.csdn.net/w1101627533/article/details/56973492
https://blog.csdn.net/wanzhen4330/article/details/81704474