Ubuntu+CUDA机器搭建

1. 记得装desktop版本的ubuntu,否则没有xserver,比较蛋疼

2. 安装英伟达显卡驱动,要关掉x server……

默认进入命令行启动

http://blog.topspeedsnail.com/archives/4922

注意16.04用这句:

$sudo systemctl set-default multi-user.target

这是每次开机默认进入命令行模式的方法。单词关闭用

sudo /etc/init.d/lightdm stop

然后遇到了坑爹的linux预装驱动……需要关掉。(谁说ubuntu少折腾来着……)

驱动安装过程这个链接内容比较详细(卸载系统驱动后机器无法完全启动,但是ssh没问题)

http://blog.csdn.net/u012759136/article/details/53355781  

照着来没问题了吧,错了……build driver的时候直接说unable……我去

差了下说我下的版本不对,赶紧去重新找(为啥查到的帖子都是那个340.32版本)

http://www.nvidia.com/content/DriverDownload-March2009/confirmation.php?url=/XFree86/Linux-x86_64/384.98/NVIDIA-Linux-x86_64-384.98.run&lang=us&type=GeForce

这里下载17.11的版本

3)安装cuda toolkit,这次吸取教训,直接英伟达官网下载最新cuda9.1版本。

直接运行安装,居然自带了驱动……去死吧……

后面说我有几个库没装好,记录如下

Missing recommended library: libGLU.so

Missing recommended library: libX11.so

Missing recommended library: libXi.so

Missing recommended library: libXmu.so

搜索下直接apt-get搞定

$ sudo apt-getinstall freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

官方参考

https://devtalk.nvidia.com/default/topic/827410/cuda-setup-and-installation/new-installation-of-cuda-7-toolkit-in-ubuntu-12-04-question-about-missing-recommended-libraries-/

重装一遍cuda测试,一并安装了连同cuda的显卡驱动。没有问题。

http://blog.csdn.net/shiorioxy/article/details/52652831

http://blog.csdn.net/jhszh418762259/article/details/52958287

之后写几个配置

环境变量设置

sudo vim ~/.bashrc

在末尾添加

export CUDA_HOME=/usr/local/cuda-8.0

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

export PATH=/usr/local/cuda-8.0/bin:$PATH

保存退出。

然后刷新。

source ~/.bashrc

动态链接库设置

创建文件:

sudo vim /etc/ld.so.conf.d/cuda.conf

写入:/usr/local/cuda/lib64

保存之后使其立即生效:

sudo ldconfig -v

之后是测试sample,网上教程都是进utility编译,表示直接在根目录下编译了,很长时间……但是似乎没有报错退出。

许久之后,安全完成。

Ubuntu+CUDA机器搭建_第1张图片


4. 安装cuDNN

直接搜索,英伟达官网注册,下载三个相关deb包,然后

$sudo dpkg -i xxxx.deb

应该就把库给安装好了。

4. 安装cuDNN

安装anaconda,没啥好说的。

5. 安装cuda-based TensorFlow

https://tensorflow.google.cn/install/install_linux

follow来,突然发现我的cuda版本和cuDNN版本都高了……先试试吧

pip install tensorflow-gpu

安全完成

但是使用的时候出现库缺失。然后conda安装我发现了这些……


Ubuntu+CUDA机器搭建_第2张图片

你妹啊!直接集成了cuda8,我去!

但是用conda安装的tensorflow-gpu版本并不能正确执行,怀疑与环境已安装的有关。

https://devtalk.nvidia.com/default/topic/1026198/cuda-9-0-importerror-libcublas-so-8-0/

所以要重装cuda8

重装cuda8之后,采用gist一脚本安装cuDNN v6

https://gist.githubusercontent.com/mjdietzx/0ff77af5ae60622ce6ed8c4d9b419f45/raw/ebcb37e45ba14317330ffc1269159ed076242b9a/waya-dl-setup.sh

# install cuDNN v6.0

CUDNN_TAR_FILE="cudnn-8.0-linux-x64-v6.0.tgz"

wget http://developer.download.nvidia.com/compute/redist/cudnn/v6.0/${CUDNN_TAR_FILE}

tar -xzvf ${CUDNN_TAR_FILE}

sudo cp -P cuda/include/cudnn.h /usr/local/cuda-8.0/include

sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/

sudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*

# set environment variables

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

pip安装的预编译TensorFlow可以运行,但是有python版本不匹配,没有最适应CPU编译的提示。

因此TF还是自行编译得好……回来再折腾吧

6.安装opencv-python

pip install opencv-python

安全完成!

可以了,测试一下GTX760水平的cuda能否吊打E5-2643.

neural style风格迁移测试。

https://github.com/cysmith/neural-style-tf

测试成绩赛高,E5-2643 v4 @ 3.40GHz约1500秒,GTX760水平只用500s,约1/3时间。

你可能感兴趣的:(Ubuntu+CUDA机器搭建)