之前用过直接安装cuda,通过cuda自带的显卡驱动装显卡驱动,但是这样需要靠运气,会常常遇到显卡驱动装不上的情况,这个问题在于cuda带的驱动有时候比较老,需要自动装别的版本的驱动,cuda8.0带的驱动是375,不适合我的显卡,但是cuda没事,因为它本身就是一个动态库,所以还是老老实实地第一步装显卡,第二步装cuda。
提示一下:显卡驱动安装完毕后,最好备份在download文件夹一份,以防止pip uninstall一些库文件的时候不小心删除显卡驱动,导致反复出现登录界面而进不去系统,此时可以重新安装显卡驱动,而不会影响之前安装安装的cuda和cudnn。
第一步:装显卡驱动,下载nvidia的run文件,
输入:lsmod | grep nouveau,如果有输出集成显卡就要把它禁止了,
sudo gedit /etc/modprobe.d/blacklist.conf #禁止集显
blacklist nouveau
options nouveau modeset=0
然后执行:sudo update-initramfs -u
重启后,执行:lsmod | grep nouveau
。如果没有屏幕输出,说明禁用nouveau成功。
按Ctrl-Alt+F1
进入命令行界面,输入用户名和密码登录即可。
sudo service lightdm stop #禁用X-Window服务
然后进入nvidia****.run所在目录,输入: ls,如果
nvidia****.run是绿色,则表示可执行,如果是白色,则要赋予执行权限:sudo chmod a+x NVIDIA-****.run
可执行后,直接输入: sudo ./nvidia****.run ,然后一路yes下去。
在最后,屏幕左下角出现命令行时输入:sudo service lightdm start
检查显卡驱动:nvidia-smi,若显示则正常。
第二步:装CUDA8.0:
同样是执行cuda****.run文件,查看该文件是否可执行的方法同上。
sudo ./cuda_8.0.61_375.26_linux.run--no-opengl-libs
在上述命令行可以选择如下的选项
--no-opengl-libs
:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是-no-opengl-files
。--uninstall (deprecated)
:用于卸载CUDA Driver(已废弃)。--toolkit
:表示只安装CUDA Toolkit,不安装Driver和Samples。--help
:查看更多高级选项。开始安装,期间出现以下画面:
点击 Esc键后点击冒号:wq 出现:
里面一定填accept。
之后,按照提示安装即可。我依次选择了:
accept #同意安装
n #不安装Driver,因为已安装最新驱动
y #安装CUDA Toolkit
#安装到默认目录
y #创建安装目录的软链接
n #不复制Samples,因为在安装目录下有/samples
接着配置路径:
需要设置环境变量, 输入:sudo gedit /etc/profile
在/etc/profile里面加入
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
然后在终端输入
$ source /etc/profile #使/etc/profile里的配置立即生效。
9) 添加lib库路径:
sudo gedit /etc/ld.so.conf.d/cuda.conf
在 /etc/ld.so.conf.d/加入文件 cuda.conf, 内容如下
/usr/local/cuda-8.0/lib64
执行下列命令使之立刻生效
sudo ldconfig
CUDA Sample测试:
#编译并测试设备 deviceQuery:
cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
#编译并测试带宽 bandwidthTest:
cd ../bandwidthTest
sudo make
./bandwidthTest
如果这两个测试的最后结果都是Result = PASS
,说明CUDA安装成功啦。
第三步:安装opencv3.4
首先安装依赖项:
[compiler] sudo apt-get install build-essential
[required] sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
[optional] sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev
使用cmake-gui安装,首先安装cmake和cmake-qt-gui
sudo apt-get install cmake cmake-qt-gui
解压opencv3.0.0(千万别放桌面,后面不能删除),并进入目录,建立build目录并进去build目录打开终端,并输入:
$ cmake-gui
出现下图界面:
在source 目录里添加:文件目录如(../../../opencv-3.0.0.0-beta),在build目录添加build目录(如:../../../opencv-3.0.0.0-beta/build),在CUDA_GENERATION 选择Kepler (若没出现这个选项,就先Configure,等下载相应的包后,在大框里面选择),configure,此时会处错误,原因是由于ippicv_linux_20141027.tgz不正确。把下载好的ippicv_linux_20141027.tgz替换掉出错路径下ippicv_linux_20141027.tgz即可。重新configure,最后generate,完成后关闭界面。
进入build目录:输入:
sudo make #或者 sudo make –j12 12线程加快速度,20线也可以。
在build目录下
$ sudo make install
写入opencv路径:
sudo sh -c'echo "usr/local/lib" >
#以下是添加的内容
/etc/ld.so.conf.d/opencv.conf'
注意 –c后面没空格
然后
sudo ldconfig
验证:
$python
>>>import cv2
若不报错,则安装成功
第四步:安装spyder
sudo apt-get install spyder
第五步:安装cudnn8第.0-V6.0
解压cudnn-8.0-linux-x64-v6.0.tgz得到cuda文件夹
$ sudo cp cudnn-8.0-linux-x64-v6.0.solitairetheme8 cudnn-8.0-linux-x64-v6.0.tgz
$ sudo tar xvf cudnn-8.0-linux-x64-v6.0.tgz
$ cd cuda/include
$ sudo cp *.h /usr/local/include/
$ cd ../lib64
$ sudo cp lib* /usr/local/lib/
$ cd /usr/local/lib
$ sudo chmod +r libcudnn.so.6.0.21 (具体是多少数字看这个文件夹里面的对应文件)
$ sudo ln -sf libcudnn.so.6.0.21 libcudnn.so.6 (具体多少数字看这个文件夹里面的文件面)
$ sudo ln -sf libcudnn.so.6 libcudnn.so
$ sudo ldconfig
检查cudnn安装正确的检查
$sudo python
>>>import tensorflow as tf
>>>
若没报错,则安装正确
第六步:安装tensorflow
由于tensorflow的版本和cudnn的版本密切相关,若安装失败,通常是因为版本不符合,可直接在/usr/local/lib/python2.7/dist-packages/文件夹里面删除tensor*文件夹即可,便可再次安装。
安装之前,先确定python的版本,以防止pip未安装,pip的安装命令是:
python3:sudo apt-get install python3-pip
python2:sudo apt-get install python-pip
支持cuda8.0和cudnn8.0_v6.0的tensorflow是1.4版,故安装命令为:
sudo pip install tensorflow-gpu==1.4 –i https://pypi.douban.com/simple
若要升级,命令如下,但是一般不升级
sudo pip install --upgrade tensorflow-gpu –i https://pypi.douban.com/simple
用以下代码确定tensorflow版本:
$sudo python
>>>import tensorflow as tf
>>>tf.__version__
注意是两个下划线
然后根据tensorflow确定cudnn的版本,避免出现以下错误
上述错误显示tensorflow配套的是cudnn-8.0-linux-x64-v6.0.tgz,注意是V6.0版本
第七步:mxnet
官网上的依赖项在前面我们基本已经安装完毕,注意,我自己的cuda版本是8.0,所以安装只需要一行命令:
sudo pip install mxnet-cu80 -i https://pypi.douban.com/simple
上面命令若报错的话,可以用
sudo pip install mxnet-cu80
验证:
$python
>>>
>>> import mxnet as mx >>> a = mx.nd.ones((2, 3), mx.gpu()) >>> b = a * 2 + 1 >>> b.asnumpy() array([[ 3., 3., 3.], [ 3., 3., 3.]], dtype=float32)
第八步:cupy
sudo pip install cupy-cuda80 -i https://pypi.douban.com/simple
第九步 换桌面
sudo apt-get install xubuntu-desktop
第十步:安装docker CE
# step 1: 安装必要的一些系统工具
$ sudo apt-get update
$ sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
$ curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
接着可以验证密钥指纹 9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88
$ sudo apt-key fingerprint 0EBFCD88
pub 4096R/0EBFCD88 2017-02-22
Key fingerprint = 9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88
uid Docker Release (CE deb)
sub 4096R/F273FCD8 2017-02-22
# Step 3: 写入软件源信息
$ sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
# Step 4: 更新并安装指定版本 Docker-CE,安装17.03版本
$ sudo apt-get install docker-ce=17.03.0~ce-0~ubuntu-trusty #具体的版本号,可以根据上面步骤的版本号修改,一定要选17.03,因为需要和nvidia-docker匹配
1.10.0
以上版本的Docker客户端,参考文档docker-ce您可以通过修改daemon配置文件/etc/docker/daemon.json
来使用加速器:
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": ["https://a7pbwtde.mirror.aliyuncs.com"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
至此docker安装及国内加速器都好了,开始你的docker之旅吧。
hello-word
$ docker -v
Docker version 17.03.0-ce, build 0520e24
sudo dpkg -i nvidia-docker_1.0.1-1_amd64.deb
apt install nvidia-modprobe
nvidia-docker-plugin
,如若正常表示安装成功sudo nvidia-docker run nvidia/cuda nvidia-smi
或者: nvidia-docker run --rm nvidia/cuda nvidia-smi
若显示显卡信息则正常
sudo apt-get install cifs-utils