Ubuntu14.04 + Nvidia Cuda8.0 + Caffe

** note: 由于输入法的原因,代码中的“-”可能运行错误,粘贴代码时,请自动修改, 例如 修改“update-initramfs -u”中的“-u”. 避免出现运行错误。

1.系统信息
Linux mint 17.3 64bit
(Mint每次重启都会出现Xserver不能启动的问题)
Ubuntu 14.04
( 最好是Ubuntu, 问题很少)
GeForce GTX 750 Ti
gcc 4.8.4 (matlab2014a不支持4.8,之后需要降级到4.7)

2.Nvidia driver

Ubuntu可以选择自动安装:
system setting-> software updates->other additional drivers
强烈建议这个方法

手动安装的方法如下:

1)禁用nouveau

$ sudo vi /etc/modprobe.d/blacklist.conf
+ blacklist nouveau
$ sudo vi /etc/default/grub      (kernel 行)
+ nouveau.modeset=0  blacklist=nouveau

或者

$ sudo nano /etc/modprobe.d/disable-nouveau.conf
+blacklist nouveau
+options nouveau modeset=0

个人感觉两种方法是一样的

2) 重新构建initramfs

$ sudo update-initramfs -u
$ sudo reboot

3) CTR+ALT+F1 模式下

$ sudo service mdm stop
$ sudo chmod 755 NVIDIA/Linux-x86_64.run
$ sudo sh ./NVIDIA-Linux-x86_64.run  
$ sudo service mdm start

4) 重启电脑

$ sudo reboot

5) 验证是否正确

$ lspci –vnn | grep VGAA 12
$ nvidia-smi
$ glxinfo | grep OpenGL
$ glxgears
$ glmark2

3.Cuda8.0 ( Linux x86_64 Unumtu 14.04 )
1) 安装缺少的库

$ sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev 
$ sudo apt-get install libgl1-mesa-glx

// libgl1-mesa-glx有时候装不上,不过好像也没关系

$ sudo apt-get install vim

2) 进入CUDA run文件的文件夹

$ sudo sh cuda_8.0.44_linux.run

不用安装nvidia driver, 其他项接受

3) 设置环境变量
尝试这个,据说这个文件是默认的

$ sudo vi ~/.bashrc
+ export PATH=/usr/local/cuda-8.0/bin:$PATH
+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
$ source ~/.bashrc

或者:

$ sudo vi /etc/profile
+ export PATH=/usr/local/cuda-8.0/bin:$PATH
+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
+ export PATH=/usr/local/cuda/bin:$PATH
+ export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
$ sudo ldconfig

下面的操作类似,保险起见,两个都试试

$ sudo vi /etc/bash.bashrc
+ export PATH=/usr/local/cuda-8.0/bin:$PATH
+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
$ source /etc/bash.bashrc

三种方法应该是一样的效果,建议先尝试第一种,亲测有效

$ sudo ldconfig  //环境变量立即生效
$ env//查看是否环境变量是否正确 或者 
$ echo $PATH | echo $LD_LIBRARY_PATH

4) 验证安装是否完成

$ nvidia-smi
$ nvcc –V

5) Cuda samples
编译所有的cuda samples

$ cd /home/username/NVIDIA_CUDA-8.0_Samples
$ sudo make

也可以进入/usr/local/cuda-8.0/samples/1_Utilities/deviceQuery/目录下

$ sudo make
$ ./deviceQuery

显示系统信息和最后一行pass, 证明安装成功

**To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/bin

6) 安装cudnn 5.0

$ tar –zxvf cudnn-8.0-linux-x64-v5.0-ga.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
//保险起见,再cp到cuda-8.0
$ sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/
$ sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*

$ sudo ldconfig

可以运行一下 ./deviceQuery 看一下是否通过

*安装caffe时,运行make runtest 可能会出现以下错误:
Libcudart.so.8.0: can not open shared object files: no such file…
运行下面指令可以解决:

$ sudo cp /usr/local/cuda-8.0/lib64/libcudart.so.8.0 /usr/local/lib/libcudart.so.8.0
$ sudo cp /usr/local/cuda-8.0/lib64/libcublas.so.8.0 /usr/local/lib/libcublas.so.8.0
$ sudo cp /usr/local/cuda-8.0/lib64/libcurand.so.8.0 /usr/local/lib/libcurand.so.8.0
$ sudo cp /usr/local/cuda-8.0/lib64/libcudnn.so.5 /usr/local/lib/libcudnn.so.5

$ sudo ldconfig

4.安装Matlab214a

5.降级gcc

** note: 降级gcc,最好在安装Matlab之后进行,或者在最开始的时候进行,因为期间会出现gcc文件夹无法找到的错误。

$ sudo apt-get install –y gcc-4.7
$ sudo apt-get install –y g++-4.7
$ cd /usr/bin
$ sudo rm gcc
$ sudo ln –s gcc-4.7 gcc
$ sudo rm g++ 
$ sudo ln –s g++-4.7 g++

验证一下当前gcc版本是不是默认为4.7

6.安装caffe
1) 安装依赖项

$ sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
$ sudo apt-get install –-no-install-recommends libboost-all-dev
$ sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
$ sudo apt-get install python-pip
$ sudo pip install protobuf
$ sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev

2) BLAS 安装

$ sudo apt-get install libatlas-base-dev

3) 安装pycaffe接口所需要的依赖项

$ sudo apt-get install python-numpy python-scipy python-matplotlib python-sklearn python-skimage python-h5py python-protobuf python-leveldb python-networkx python-nose python-pandas python-gflags cython ipython

4) 安装openCV3.1

$ cd opencv-3.1.0/modules/cudalegacy/src

修改graphcuts.cpp(因为opencv3.1还不支持cuda8.0)

#if !defined(HAVE_CUDA) || defined(CUDA_DISABLER) || (CUDART_VERSION >= 8000)

进入opencv目录 (如果没有cmake,请装)

$ mkdir build
$ cd build
$ sudo cmake –D CMAKE_BUILD_TYPE=ReleaseD CMAKE_INSTALL_PREFIX=/usr/local ..
$ sudo make –j16
$ sudo make install

5) Caffe

进入Caffe文件夹,并复制Makefile.config及修改

$ cp Makefile.config.example Makefile.config
$ sudo gedit Makefile.config

修改Makefile.config,按照自己的需求修改

USE_CUDNN :=1
OPENCV_VERSION := 3
MATLAB_DIR := /usr/local/MATLAB/R2014a

保存

$ cd ..
//这段可有可无,前面依赖项都装好,这步可以不要
$ cd caffe/python
$ for req in $(cat requirements.txt); do pip install $req; done
$ cd ..

最后一步,

$ sudo make all -j16
$ sudo make test -j16
$ sudo make runtest -j16

$ sudo make pycaffe
$ sudo make matcaffe

搞定,收工回家

6) Test MNIST 根据官网测试MNIST

7.安装jupyter,在线编辑工具

$ sudo pip install jupyter
  1. 可能出现的问题

如果出现Segmentation fault错误,原因可能是依赖项没有装全。
如果出现.so libraries缺失,原因可能是环境变量没有配置好。
如果出现hd5f错误, 可以尝试在caffe配置文件下面修改

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/lib/x86_64-linux-gnu/hdf5/serial/include

LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu/hdf5/serial

如果重启之后显示Xserver不能启动,原因可能是mdm没有设置好

$ sudo service mdm restart

或者重新安装mdm

$ sudo apt-get remove mdm
$ sudo apt-get install mdm

还是建议安装Ubuntu,而不是linux mint
(mint下面尝试了好几次,都是这个问题)

都是血和泪,从头到尾装了好几天,每次都是折在了最后一步,要不然就是重启之后Xserver不能启动

参考了前辈的经验: http://www.2cto.com/os/201607/528798.html

你可能感兴趣的:(深度学习)