前言
作者发现自己2009年购买的联想ThinkPad SL400电脑配置的竟然是NVIDIA Geforce 9300m GS显卡,真是意外之喜!
由于电脑太老,win7已经跑不动了,于是选择重新安装Ubuntu,并且装上CUDA和CuDNN,这样就可以很happy地玩起深度学习了。
本文的特点
由于作者显卡较老,因此在安装过程当中遇到了不少关于显卡、驱动版本,compute capability、CUDA版本之间关系的问题,其中包括遇到问题:
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
搜索网上教程或许一般都是显卡较新,没有类似选择CUDA版本、系统版本等问题,因此这里先系统地介绍一下这方面的问题,省去后面重复安装等重复劳动。工欲善其事,必先利其器。
小插曲
作者在安装过程中总共重新安装了三次系统,都是由于直接根据安装教程安装,而没有根据自己显卡等情况选择正确版本导致。
安装Ubuntu16.04的基础上安装了一次CUDA和Cudnn,使用deb方式安装cuda并重启后字体变大,原驱动nouveau失效并且循环登录,该问题是由于未安装新驱动导致,重新安装默认驱动nouveau后重启发现键盘鼠标失效,电脑宕机,因此重新开始安装一遍ubuntu和cuda,因此需要重新安装一遍系统。
-- 教训:还是选择runfile通过交互式安装。重新安装Ubuntu16.04并且使用系统更新方式安装nvidia驱动,支持到最新版本为340版本,在此基础上安装最新版本的CUDA9.1,发现遇到cudaGetDeviceCount returned 35的问题,这是由于CUDA版本太新,与驱动版本不支持导致。后通过nvidia论坛提问,得知对应该版本的cuda为CUDA6.5。
--教训:适合自己的才是最好的。
Windows电脑上制作U盘安装盘
作者另有一台华硕超薄本用来做办公用,所以就正好用来制作安装盘。
下载ubuntu 14.04 LTS 64bit,当然前提要先确认一下自己的电脑是否支持64位系统。
http://releases.ubuntu.com/releases/下载通用usb安装工具universal-usb-installer
https://www.pendrivelinux.com/universal-usb-installer-easy-as-1-2-3/打开universal-usb-installer工具,选择刚才下载的ubuntu的iso文件,选择U盘后点击create,然后等待即可,很傻瓜的过程。
安装Ubuntu14.04
- 插入U盘后重启电脑,按F12进入启动选项(有些电脑可能是F10)
- 从U盘启动
- 选择install选项
更换显卡驱动
查看自己显卡型号命令:
lspci | grep -i nvidia
查看显卡驱动命令:
lsmod | grep -i nvidia
ubuntu14.04下更换驱动很方便,不必去nvidia官网下载后手动安装,直接在
系统设置->软件更新->附加驱动->切换到最新的NVIDIA驱动即可->应用更改->重启
但是作者的电脑显卡有点老旧了,本显卡的计算能力为Compute Capability 1.1,而CUDA版本的选择和显卡的计算能力相关,最新的CUDA版本(当前是9.1)已经无法支持该算力的版本了,相应的CUDA版本为CUDA6.5。
算力查询:
较新显卡:
https://developer.nvidia.com/cuda-gpus
老显卡:
https://developer.nvidia.com/cuda-legacy-gpus
没有列在这两个表里的显卡就没办法支持CUDA了。
关于算力和CUDA的对应关系官方并没有给出说明,而是在Stack Overflow上找到有人总结,结果如下:
CUDA 9.1: 387.xx
CUDA 9.0: 384.xx
CUDA 8.0 375.xx (GA2)
CUDA 8.0: 367.4x
CUDA 7.5: 352.xx
CUDA 7.0: 346.xx
CUDA 6.5: 340.xx
CUDA 6.0: 331.xx
CUDA 5.5: 319.xx
CUDA 5.0: 304.xx
CUDA 4.2: 295.41
CUDA 4.1: 285.05.33
CUDA 4.0: 270.41.19
CUDA 3.2: 260.19.26
CUDA 3.1: 256.40
CUDA 3.0: 195.36.15
安装CUDA
从官网下载14.04版本cuda,包括cuda及patch,网址:
https://developer.nvidia.com/cuda-downloads安装cuda
./cuda_6.5.14_linux_64.run --tmpdir=/home/moyinan/cuda/tmp
安装配置:
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 340.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 6.5 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-6.5 ]:
/usr/local/cuda-6.5 is not writable.
Do you wish to run the installation with 'sudo'?
(y)es/(n)o: y
Please enter your password:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 6.5 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /home/moyinan ]: /home/moyinan/cuda
- 配置环境变量:
在~/.bashrc中加入:
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
保存退出并允许source ~/.bashrc使之立即生效
- 运行示例检查安装是否正确
首先压缩一份示例以备份:
tar czvf NVIDIA_CUDA-6.5_Samples.tar.gz NVIDIA_CUDA-6.5_Samples/
进入NVIDIA_CUDA-6.5_Samples/1_Utilities/deviceQuery
目录并运行
make
sudo ./deviceQuery
出现类似如下结果说明安装成功:
moyinan@moyinan:~/cuda/NVIDIA_CUDA-6.5_Samples/1_Utilities/deviceQuery$ sudo ./deviceQuery
[sudo] password for moyinan:
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "GeForce 9300M GS"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 1.1
Total amount of global memory: 255 MBytes (267714560 bytes)
( 1) Multiprocessors, ( 8) CUDA Cores/MP: 8 CUDA Cores
GPU Clock rate: 1450 MHz (1.45 GHz)
Memory Clock rate: 702 Mhz
Memory Bus Width: 64-bit
Maximum Texture Dimension Size (x,y,z) 1D=(8192), 2D=(65536, 32768), 3D=(2048, 2048, 2048)
Maximum Layered 1D Texture Size, (num) layers 1D=(8192), 512 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(8192, 8192), 512 layers
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 16384 bytes
Total number of registers available per block: 8192
Warp size: 32
Maximum number of threads per multiprocessor: 768
Maximum number of threads per block: 512
Max dimension size of a thread block (x,y,z): (512, 512, 64)
Max dimension size of a grid size (x,y,z): (65535, 65535, 1)
Maximum memory pitch: 2147483647 bytes
Texture alignment: 256 bytes
Concurrent copy and kernel execution: No with 0 copy engine(s)
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): No
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.5, CUDA Runtime Version = 6.5, NumDevs = 1, Device0 = GeForce 9300M GS
Result = PASS
安装cuDNN
- 下载cuDNN
网址如下,需要登录后方可下载,大家注册一下即可。
根据CUDA版本进行下载,CUDA6.5的版本在Archived cuDNNs Release下:
https://developer.nvidia.com/rdp/cudnn-download - 安装cuDNN
cuDNN实际是CUDA的扩展包,因此只需解压并拷贝到CUDA相应目录即可:
解压:
tar zvxf cudnn-6.5-linux-x64-v2.tgz
sudo cp cudnn-6.5-linux-x64-v2/cudnn.h /usr/local/cuda/include/
sudo cp -d cudnn-6.5-linux-x64-v2/libcudnn /usr/local/cuda/lib64/*