深度学习平台搭建: Ubuntu16.04 + 显卡驱动384 + cuda8.0 + cudnnv6.0 + anaconda3 + tensorflow-gpu-1.2 + keras

Ubuntu16.04 + 显卡驱动384 + cuda8.0 + cudnnv6.0 + anaconda3 + tensorflowgpu-1.2 + keras
#########################################
先附上可能会报错的问题:


问题1:导入TensorFlow报错:libcublas.so.8.0 error with tensorflow
此情况由于Tensorflow暂时不支持cuda9和cudnn7的版本,解决方式,卸载已安装的新版,安装cuda8.0,和cudnnV5.1旧版,但是!!!!!cudnn5.1版本tensorflow又嫌弃太旧,最后需要安装的是cuda8.0和cudnn6版本。
解决:重新安装
1.cuda卸载新版本9.1:
sudo /usr/local/cuda-9.1/bin/uninstall_cuda_9.1.pl
//血的教训告诉我们不要乱改路径
2.如上所述安装CUDA和cudnn即可。


问题2:导入TensorFlow报错:libcudnn.so.6.0 cannot open......这是由于cudnn版本过旧或者过新导致,因此需要安装cudnn6版本解决,tensorflow1.2支持cudnn6.tensorflow1.4不可以。
解决:
1.cudnn6安装步骤如上。
2.卸载老版本:
pip uninstall tensorflow-gpu
3.安装新版本:
pip install tensorflow-gpu==1.2
//应该是先卸载之前装的CUDNN7和cudnn5的版本再去安装cudnn6比较好,但是没有找到卸载方式,网上说可以同时兼寸,所以就没管了,如果会卸载还是卸了再安装比较好。


问题3:no module keras
解决:
1.进入TensorFlow环境
source activate tensorflow
2.安装keras
pip  install keras


问题4:no Module gensim
解决:pip  install gensim
##############################################


一、Ubuntu系统:
1.制作优盘:使用universal USB installer软件,下载Ubuntu16.04系统镜像文件,制作驱动盘
2.安装系统:插上优盘,按del进入BIOS,在BIOS优先顺序中选择优盘启动UEFI
3.按照提示进行一步步安装即可


二、NVIDIA graphics driver驱动安装:
注意!!!!版本!!!
驱动版本:
NVIDIA graphics driver 375.88 or newer for CUDA 8
NVIDIA graphics driver 384.81 or newer for CUDA 9

tensorflow不支持cuda9,我们要安装cuda8.0和cudnn6—library-Linux。


参考安装网址:http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%BB%E6%9C%BA%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu-16-04-nvidia-gtx-1080-cuda-8


1.桌面上打开终端,输入:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-384
sudo apt-get install mesa-common-dev
sudo apt-get install freeglut3-dev


2.重启系统
sudo shutdown -r now


三、安装cuda8.0过程
1.cuda官网下载cuda8.0安装包,下载runfile版本文件。


2.在软件包文件夹打开终端输入:
sudo sh cuda_8.0.27_linux.run
弹出:
Do you accept the previously read EULA?
accept/decline/quit: accept


Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 361.62?
(y)es/(n)o/(q)uit: n  //此处一定选no,因为之前我们已经自行装过更新版本的显卡驱动


Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y


Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:


Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y


Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y


Enter CUDA Samples Location
[ default is /home/textminer ]:     //尽量使用默认路径,改了不知道会出现什么奇怪问题


3.添加环境变量:
终端输入:
sudo gedit /etc/profile
弹出:profile文件,在文件尾部添加如下:


export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH


4.最后再来测试一下CUDA,桌面终端输入:
cd ~NVIDIA_CUDA-8.0_Samples  //进入此目录
nvidia-smi //测试
cd 1_Utilities/deviceQuery //输入此行后进入此路径
make  //成功后会有各种版本信息




四、cudnn-v6安装: ///我们先装了cudnn7支持cuda9版本,结果tensorflow不支持cuda9,因此,重新安装cuda8和cudnn5.1,结果报错cudnn应该是6版本,最终装的cudnn6版本。


安装cudnn——v6版本 tar.gz版本
1.cudnn官网下载v6-linux,tar.gz版本. //官网根据不同版本的cuda对应不同版本的cudnn,后续新版有deb安装包,但是会各种问题,选择v6版本就好。
2.软件包文件路径下打开终端输入:
$tar -xzvf cudnn-6.0-linux-x64-v6.tgz //此句对应自己下载的实际版本 解压


$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include //拷贝cudnn路径内容到cuda中
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*


3.创建软连接://具体什么作用不知道 写了反正有用
cd /usr/local/cuda/lib64/     //这是当时装cudnn-v5.1版本,cudnn其它版本修改对应数字版本信息
sudo rm -rf libcudnn.so libcudnn.so.5   
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5   
sudo ln -s libcudnn.so.5 libcudnn.so


#######################cudnn-v7安装,实际上可以不看这步。因为V7新版tensorflow还不支持。
##1.进官网分别下载CUDNN,CUDNN-DEV,DUDNN-DOC的deb文件。//deb的是7版本
##2.在安装包文件夹中打开终端输入:
##sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
##sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb
##sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb


##验证:
##$cp -r /usr/src/cudnn_samples_v7/ $HOME
##$ cd $HOME/cudnn_samples_v7/mnistCUDNN
##$make clean && make
##$ ./mnistCUDNN
##报错error:CUDA驱动器版本不CUDnn运行版本不兼容!!!
#####################################################


五、安装anaconda
1、官网下载anaconda,对应sh文件包
2、文件目录中打开中终端输入:
bash Anaconda3-4.1.1-Linux-x86_64.sh
接受协议yes
添加路径yes
3.验证:
关闭终端,重新打开新终端输入
conda info 来查询安装信息
输入conda list 可以查询你现在安装了哪些库




六、安装tensorflow-1.2-gpu版本
//由于安装tensorflow1.4新版导致问题:导入TensorFlow报错:libcudnn.so.6 cannot open shared object file
//因此安装tensorflow1.2版本解决:
1.卸载老版本:
pip uninstall tensorflow-gpu
2.安装新版本:
pip install tensorflow-gpu==1.2


###############################################此下为tensorflow1.4安装方式,可跳过不看
安装TensorFlow1.4版本
1.sudo apt insatall python3-pip //安装pip3
2.首先创建一个conda环境,命名为tensorflow 
conda create -n tensorflow Python=3.6
然后激活该环境并在环境下安装tensorflow 
source activate tensorflow 
直接进入终端的tensorflow环境下:
3.pip3 install –ignore-installed –upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.4.0-cp36-cp36m-linux_x86_64.whl   //此时安装的是tensorflow1.4版本
//gpu版本的link,自动下载对应包进行安装
//附tensorflow网站安装链接参考:https://www.tensorflow.org/install/install_linux#the_url_of_the_tensorflow_python_package,这个网页上有各版本对应信息。
#################################################################


七、安装keras
1.激活tensorflow环境下安装keras,否则直接安装的话,路径可能会出现奇怪问题导致运行程序时报错说找不到keras模块
桌面上打开终端输入:
source activate tensorflow
2.tensorflow环境下安装keras
sudo  pip install keras


八.测试所有安装
1.打开tensorflow环境
source activate tensorflow
2.环境中在终端直接输入spyder打开软件
spyder
3.spyder中导入包运行看是否报错
import tensorflow
import keras
4.如果没有问题大功告成





你可能感兴趣的:(ubuntu,cuda)