联想z470安装cuda toolkit 7.5过程

        我安装的系统是ubuntu kylin 14.04,ubuntu 14.04也差不多一样.我的目的是让GPU能跑一些机器学习以及深度学习的框架,如theano

    1,卸载掉与nvidia相关的驱动以及旧版的cuda相关程序

sudo apt-get remove --purge nvidia* cuda*

    2,到cuda官网下载新的cuda toolkit版本,我下的deb版的,也可以下run版的,我装的是时候是7.5版(2015.12.14.),你可以试着进入字符界面(ctrl+alt+F1),安装,也可以直接在终端安装主,我是选择前者,

sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb

安装好仓库之后,就可以更新你的本地仓库。

sudo apt-get update

最后开始安装cuda以及显卡驱动

sudo apt-get install cuda

安装完后加入环境变量,这个有好几种方法,我选择在本用户目录下安装,vim ~/.bashrc,在后面加入

$ export PATH=/usr/local/cuda-7.5/bin:$PATH  
$ export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH

设置完毕之后,你还可以选择是否安装cuda附带的示例代码(<dir>表示你要安装的位置,你可以将<dir>替换成~):

cuda-install-samples-7.5.sh <dir>

三,安装bumblebee

        如果你的电脑是两显卡,不知你会怎样管理呢,我用的是bumblebee,如果你也是一样的电脑,可以一试,ubuntu安装比较简单

sudo add-apt-repository ppa:bumblebee/stable
sudo apt-get update
sudo apt-get install bumblebee bumblebee-nvidia

可看看如下文章:使用 Bumblebee 控制 NVIDIA 双显卡(Ubuntu)

这时你最好重启或注销一下电脑

四,测试验证

        待你重新开机后,就以后一些验证工作

        1,查看nvcc编译器的版本,nvcc是GPU的编译器

nvcc -V i

        2,查看显卡的驱动版本,这个得先让你的独立显卡的gpu跑起来才可以看到

optirun python
#另一个终端
cat /proc/driver/nvidia/version

你如果用  lspci |grep -i VGA看独立显卡的状态,前面可能不一样,没开独立显卡是ff,开了后是a1

        3,测试集显与独显是否正常,先测试集显,再测试独显

glxgears

你会看到如下结果:

联想z470安装cuda toolkit 7.5过程_第1张图片

联想z470安装cuda toolkit 7.5过程_第2张图片

optirun glxgears


很明显,独立显卡的速度要比集显要快的多

        4,编译cuda程序,在sample目录下,make编译程序,网上人说编译并运行通过就没问题了,我一开始没了没有通过,虽然可执行文件是可以执行的,后面我加了个环境变量

export LD_LIBRARY_PATH=/usr/lib/nvidia-352:$LD_LIBRARY_PATH

运行编译出来的./deviceQuery,出下面结果联想z470安装cuda toolkit 7.5过程_第3张图片

        你也可以跑一下,simple下面的其他程序,如果大多没问题的话,就证明还是基本安装成功的.

如果你是做cuda编程的,你可以如这个网址中入门开始学习CUDA在线学习

四,theano测试

        因为我的主要目的是跑python代码,我之前已装了theano,所以只测试theano能在GPU上跑吗.

有两种方法运行GPU,一是在那个~/.theanorc配置文件,加入

[global]
floatX=float32
device=gpu
#二,是运行程序时,前面加入说明
THEANO_FLAGS=floatX=float32,device=gpu python /usr/local/lib/python2.7/dist-packages/theano/misc/check_blas.py

会出测试结果.

也可以把下面的代码存为test.py,用cpu与gpu跑一下,出来的显示结果与时间都不一样.

from theano import function, config, shared, sandbox
import theano.tensor as T
import numpy
import time

vlen = 10 * 30 * 768  # 10 x #cores x # threads per core
iters = 1000

rng = numpy.random.RandomState(22)
x = shared(numpy.asarray(rng.rand(vlen), config.floatX))
f = function([], T.exp(x))
print(f.maker.fgraph.toposort())
t0 = time.time()
for i in xrange(iters):
    r = f()
t1 = time.time()
print("Looping %d times took %f seconds" % (iters, t1 - t0))
print("Result is %s" % (r,))
if numpy.any([isinstance(x.op, T.Elemwise) for x in f.maker.fgraph.toposort()]):
    print('Used the cpu')
else:
    print('Used the gpu')

五,可借鉴文档

折腾记要——Ubuntu 14.04系统安装Nvidia CUDA7.5并搭建Python Theano深度学习开发环境

Ubuntu12.04配置NVIDIA cuda5.5经验帖

Caffe+Ubuntu 15.04+CUDA 7.0新手安装配置指南

ubuntu14.04安装cuda

Ubuntu安装Theano+CUDA

Installing Theano

Using the GPU

六,可能的问题

FATAL: Module nvidia_uvm not found.

Ubuntu 12.04. Error: cudaGetDeviceCount returned 30

nbody errors in verification step of CUDA 7.5 installation

你可能感兴趣的:(联想z470安装cuda toolkit 7.5过程)