原文链接:https://blog.csdn.net/xd_wjc/article/details/82999563
https://blog.csdn.net/qq_25241325/article/details/90753830
更新:安装keras时要与tensorflow版本对应https://www.cnblogs.com/carle-09/p/11661261.html
一、安装驱动
已经安装的跳过
二、安装cuda-9.0
注意,如果是ubuntu18.04,必须把gcc版本降到6以下,包括6,因为编译cuda9只支持gcc6以下,而Ubuntu 18.04预装GCC版本为7.3,如何降gcc:
sudo apt-get install gcc-6 g++-6
cd /usr/bin
sudo rm gcc
sudo ln -s gcc-6 gcc
sudo rm g++
sudo ln -s g++-6 g++
如果是ubuntu16.04,就不用降gcc,因为ubuntu16.04预装的是gcc4.8
安装cuda9:
1,执行这条命令,先安装依赖库,最好安,有的教程没安,我第一次失败不知道跟这个有没有关系,也不大,就几十MB
sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev
2,自己去官网下载cuda9的run-file文件,几个补丁就不用下了,我看网上教程大部分都没装这几个补丁,
我下好的文件名叫作:cuda_9.0.176_384.81_linux.run
384.81表示需要的驱动版本,所以你前面装得nivdia驱动版本必须比这个384.81要大,不能小于或等于这个384.81
在cuda_9.0.176_384.81_linux.run这个文件所在目录下打开终端,执行:
sudo sh cuda_9.0.176_384.81_linux.run
我看其他教程还加什么权限,我感觉不要,反正我没加
3,之后会进入一系列让你阅读的一些安装信息的界面,你不停的回车就行,直到出现如下信息:
这个是我网上复制的,实际上自己装的时候基本是一样的,答案都写出来了,大部分是yes,但这一项Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?选no,因为上面驱动已经装了,这里就不用重复装。
1 The NVIDIA CUDA Toolkit provides command-line and graphical
2 tools for building, debugging and optimizing the performance
3 of applications accelerated by NVIDIA GPUs, runtime and math
4 libraries, and documentation including programming guides,
5 user manuals, and API references.
6
7
8 Default Install Location of CUDA Toolkit
9 Do you accept the previously read EULA?
10 accept/decline/quit: accept
11
12 You are attempting to install on an unsupported configuration. Do you wish to continue?
13 (y)es/(n)o [ default is no ]: y
14
15 Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
16 (y)es/(n)o/(q)uit: n
17
18 Install the CUDA 9.0 Toolkit?
19 (y)es/(n)o/(q)uit: y
20
21 Enter Toolkit Location
22 [ default is /usr/local/cuda-9.0 ]:
23
24 Do you want to install a symbolic link at /usr/local/cuda?
25 (y)es/(n)o/(q)uit: y
26
27 Install the CUDA 9.0 Samples?
28 (y)es/(n)o/(q)uit: y
29
30 Enter CUDA Samples Location
31 [ default is /home/zhuang ]:
32
33 Installing the CUDA Toolkit in /usr/local/cuda-9.0 ...
34 Installing the CUDA Samples in /home/zhuang ...
35 Copying samples to /home/zhuang/NVIDIA_CUDA-9.0_Samples now...
36 Finished copying samples.
37
38 ===========
39 = Summary =
40 ===========
41
42 Driver: Not Selected
43 Toolkit: Installed in /usr/local/cuda-9.0
44 Samples: Installed in /home/zhuang
45
46 Please make sure that
47 - PATH includes /usr/local/cuda-9.0/bin
48 - LD_LIBRARY_PATH includes /usr/local/cuda-9.0/lib64, or, add /usr/local/cuda-9.0/lib64 to /etc/ld.so.conf and run ldconfig as root
49
50 To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.0/bin
51
52 Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.0/doc/pdf for detailed information on setting up CUDA.
53
54 ***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.0 functionality to work.
55 To install the driver using this installer, run the following command, replacing
56 sudo
57
58 Logfile is /tmp/cuda_install_7476.log
59 Signal caught, cleaning up
到这cuda安装第一步完成,接着添加环境变量,
在home主目录下,用ctrl+h,显示隐藏文件,找到.bashrc这个文件,用vim或gedit打开,命令如下:
gedit ~/.bashrc
在文件的末尾添加这三行,有的教程第三行好像没装:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-9.0
添加后保存,在执行:
source ~/.bashrc
使这个文件生效,可以在终端输入 echo $PATH 和echo $CUDA_HOME查看一下
有的教程是这样添加环境变量的,都可以,只是格式不一样
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
注意由于安装的时候建立了软链接/usr/local/cuda
和/usr/local/cuda-9.0其实是等效的,你添加那样的环境变量也是可以的,但是要和下面的cudnn拷贝的一样,你这里选择是用cuda9.0做环境变量,后面最好把cudnn的几个文件拷到这里
验证cuda9.0:
a、 验证驱动版本
$ cat /proc/driver/nvidia/version
结果显示类似
NVRM version: NVIDIA UNIX x86_64 Kernel Module 384.81 Sat Sep 2 02:43:11 PDT 2017
GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5)
b、 验证CUDA Toolkit
$ nvcc -V 会输出CUDA的版本信息
如果是这样的:
The program 'nvcc' is currently not installed. You can install it by typing:
sudo apt-get install nvidia-cuda-toolkit
可能是环境配置没有成功,重新配置环境。
五、测试CUDA的Samples例子
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
如果显示的是关于GPU的信息,则说明安装成功了。
第三:安装cudnn:
去cudnn官网下载于cuda9.0对应的cudnn,一般下7.0,7.0.5或7.0.4或7.0.3都是可以的,下那个cudnn libaray for linux,
不要下下面的什么cudnn for ubuntu 16.04 的deb文件,下好之后,是一个cudnn-9.0-linux-x64-v7.tgz压缩文件,首先到文件目录打开终端执行这条命令解压:tar -zxvf cudnn-9.0-linux-x64-v7.tgz 解压后出现一个cuda的文件夹,
cuda文件夹里有:
还是回到解压出来的cuda文件夹所在目录,在把cudnn.h 和那三个所有带libcudnn的文件复制到开始装的CUDA文件夹对应的目录里去
sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include/
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64/
这个-P是参数,意思是不光复制内容,还把属性也复制过去
给文件读写权限,因为从上面的图片可以看出cudnn上了锁,要赋予权限:
sudo chmod a+r /usr/local/cuda-9.0/include/cudnn.h
sudo chmod a+r /usr/local/cuda-9.0/lib64/libcudnn*
------简单一点
tar -zxvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64
sudo chmod a+r /usr/local/cuda-9.0/include/cudnn.h /usr/local/cuda-9.0/lib64/libcudnn*
到次结束cudnn安装
第四安装Anaconda:
1. 首先安装Anaconda3-4.2.0-Linux-x86_64,64位系统,它对应的python是3.5,而4.3对应的是python3.6,下好后是一个.sh文件
参考下面这个链接
https://blog.csdn.net/u012318074/article/details/77074665
第五步安装tensorflow:
我这里装的是1.8,想装1.12,就换成1.12
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.8
用清华的镜像,飞快。
第六步,安装opencv,keras,easydict:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python==3.4
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple keras
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple easydict
要是还是提示缺少某些包,就用这种方式安装
测试TensorFlow(GPU)是否安装成功
在安装完TensorFlow(GPU)后,进入python环境
在命令窗口输入以下的代码段:
import tensorflow as tf
hello=tf.constant(‘hello,world’)
sess=tf.Session()
print(sess.run(hello))
如果返回结果如下图,则代表TensorFlow(GPU)安装成功: