Ubuntu下多GPU安装DIGITS

Ubuntu下多GPU安装DIGITS

首先需要配置多GPU环境,具体参考http://blog.csdn.net/cugxyy6/article/details/54412014

安装DIGITS可以直接下deb文件安装,也可以选择编译代码安装(这样安全,不会导致一些库冲突安装,尤其是参考新Titan X+Ubuntu14.04安装)

1、  安装caffe-nv

下载caffe-nv,解压在/home/DL/DIGITS/下

A、首先安装一些依赖库:CUDA(已安装)、BLAS 、Boost、OpenCV等等,见官网的安装方法:http://caffe.berkeleyvision.org/installation.html,或自述文件(installation.md)。

sudoapt-get install libprotobuf-dev libleveldb-dev \

  libsnappy-dev libopencv-devlibboost-all-dev libhdf5-serial-dev \

  libgflags-dev libgoogle-glog-devliblmdb-dev protobuf-compiler \

  libatlas-base-dev

B安装其它的依赖库:查看“requirements.txt”文件,请注意将下面的路径替换为你的路径。

cd/home/DL/DIGITS/caffe/python

forreq in $(catrequirements.txt); dosudo pip install $req; done

C、修改配置文件并编译:终端进入“caffe”文件夹,复制一份Makefile.config文件,然后修改Makefile.config文件,

如果使用OPenCV 3需要将OPENCV_VERSION := 3前边的注释去掉

取消对行 USE_CUDNN := 1 的注释。这可以启用 cuDNN 加速。
取消对行 USE_NCCL := 1 的注释。这可以启用在多个 GPU 上运行 Caffe 所需的 NCCL

 此处尤为注意,如果没有设定,多个GPU情况下DIGITS只能识别一个可用


安装NCCL

git clone https://github.com/NVIDIA/nccl.get

cd nccl

makeCUDA_HOME=/usr/local/cuda test

sudo makePREF IX=/usr/local install

添加环境变量

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$ LD_LIBRARY_PATH

 

cd /home/DL/DIGITS/caffe

make all -j4 

make py -j4

make test -j4 

make runtest -j4

 

然后将caffe路径设置为环境变量

# Add environment

echo -e"\nexportCAFFE_HOME=/home/DL/DIGITS/caffe" >> ~/.bashrc

# load the new environmental variables

source~/.bashrc

 

2、  安装DIGITS

A、 下载DIGITS(https://github.com/NVIDIA/DIGITS)解压在/home/DL/DIGITS/下,解压文件夹为digits

B、 安装DIGITS

命令如下,注意修改路径。

cd/home/DL/DIGITS/digits

sudo apt-get install graphviz gunicorn

for req in $(cat requirements.txt); dosudo pip install $req; done

C、   启动DIGITS

进入digits文件夹,给文件“./digits-devserver”赋予可执行权限,然后./digits-devserver运行digits:

cd ~/sfw/digits

chmod +x./digits-devserver

./digits-devserver

 

D、配置DIGITS

上述步骤,是按默认配置启动digits,如果你想自定义配置,可以在启动前输入:

Most values are setsilently by default. If you need more control over your configuration, try oneof these commands:

# Set more options before starting the server

./digits-devserver --config

# Advanced usage

python -m digits.config.edit –verbose

 

E、使用DIGITS

下载MNIST数据集在/digits/download_data/目录下

执行 python ./__main__.py mnist 你的路径/digits/data/mnist

然后通过浏览器localhost:5000DIGITS训练模型

你可能感兴趣的:(Ubuntu下多GPU安装DIGITS)