Ubuntu 16.04 配置深度学习环境

Ubuntu分区

创建swap分区:

32768MB 逻辑分区 空间起始位置 交换空间

创建boot分区:

2048MB 逻辑分区 空间起始位置 Ext4日志文件系统 /boot

创建home分区:

512000 逻辑分区 空间起始位置 Ext4日志文件系统 /home

创建/分区:

剩余 主分区 空间起始位置 Ext4日志文件系统 /

移动 Ubuntu16.04 桌面左侧的启动器到屏幕底部

gsettings set com.canonical.Unity.Launcher launcher-position Bottom

ubuntu 移除 libreOffice、Amazon

sudo apt-get remove --purge firefox firefox-locale-en  firefox-locale-en  unity-scope-firefoxbookmarks

sudo apt-get remove --purge libreoffice*

sudo apt-get remove unity-webapps-common

一、准备工作

1.update一下更新资源

$sudo apt-get update

2.upgrade更新升级

$sudo apt-get upgrade

二、安装显卡

1.禁用nouveau驱动

终端中运行:

$ lsmod | grep nouveau

如果有输出,则代表nouveau正在运行, 需要我们手动禁掉nouveau。

在/etc/modprobe.d中创建文件blacklist-nouveau.conf

$ sudo touch /etc/modprobe.d/blacklist-nouveau.conf
$ sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

在文件中输入以下内容:

blacklist nouveau 

options nouveau modeset=0

更新系统:

$ sudo update-initramfs -u

重启后查看nouveau是否已经成功禁用,无输出则为成功:

$ lsmod | grep nouveau

这时,我们已经成功禁用了nouveau,无输出

2.关闭图形化界面

$ sudo service lightdm stop

按ctrl+alt+f1进入命令行界面。 上面操作如果不行,则直接移除:

cd /lib/modules/4.10.0-28-generic/kernel/drivers/gpu/drm/nouveau 
sudo rm -rf nouveau.ko 
sudo rm -rf nouveau.ko.org

安装显卡驱动

$ sudo sh NVIDIA-Linux-x86_64-390.25.run –no-x-check –no-nouveau-check –no-opengl-files

Accept->Continue installation->sign the kernel module(为内核模块签名)?选择是->使用已有的密钥给模块签名还是重新生成?选重新生成密钥->是否删除已生成的密钥文件?选择否->安装完成

问题:The target kernel has CONFIG_MODULE_SIG set,which means that it supports cryptographic signatures on kernel module. On some systems, the kernel may refuse to load modules without a valid signature from a trusted key.This system also UEFI Secure Boot enabled; many distributions enforce module signature verification on UEFI systems when Secure Boot is enabled. Would you like to sign the NVIDIA kernel module?

解决:禁用UEFI安全启动功能

检查 NVIDIA Driver是否安装成功

nvidia-smi

安装完成后,重启

$ sudo reboot

这时,执行下面的命令,查看驱动的安装状态

$ sudo nvidia-smi
$ sudo nvidia-settings

三、安装cuda

sudo bash cuda_9.1.85_387.26_linux.run
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev 

配置 CUDA 环境变量:

sudo gedit ~/.bashrc 

在文件最后添加:

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

export CUDA_HOME=/usr/local/cuda

修改完毕之后执行一下使其生效:

source ~/.bashrc

检查cuda是否配置正确,到这一步,基本的CUDA已经安装完成了,我们可以通过以下命令查看CUDA是否配置正确:

nvcc --version

测试CUDA的sammples

# 切换到cuda-samples所在目录
cd /usr/local/cuda-8.0/samples 或者 cd /home/NVIDIA_CUDA-8.0_Samples 

# 没有make,先安装命令 sudo apt-get install cmake,-j是最大限度的使用cpu编译,加快编译的速度
make –j

# 编译完毕,切换release目录(/usr/local/cuda-8.0/samples/bin/x86_64/linux/release完整目录)
cd ./bin/x86_64/linux/release

# 检验是否成功,运行实例
./deviceQuery 

# 可以认真看看自行结果,它显示了你的NVIDIA显卡的相关信息,最后能看到Result = PASS就算成功。

四、安装cudnn

#解压文件
tar -zxvf cudnn-8.0-linux-x64-v7.tgz

#切换到刚刚解压出来的文件夹路径
cd cuda 
#复制include里的头文件(记得转到include文件里执行下面命令)
sudo cp include/cudnn.h  /usr/local/cuda/include/

#复制lib64下的lib文件到cuda安装路径下的lib64(记得转到lib64文件里执行下面命令)
sudo cp lib64/libcudnn*  /usr/local/cuda/lib64/

#设置权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

#======更新软连接======
cd /usr/local/cuda/lib64/ 
sudo rm -rf libcudnn.so libcudnn.so.7   #删除原有动态文件,版本号注意变化,可在cudnn的lib64文件夹中查看   
sudo ln -s libcudnn.so.7.1.1 libcudnn.so.7  #生成软衔接(注意这里要和自己下载的cudnn版本对应,可以在/usr/local/cuda/lib64下查看自己libcudnn的版本)
sudo ln -s libcudnn.so.7 libcudnn.so #生成软链接
sudo ldconfig -v #立刻生效

Ubuntu 16.04 用户登录界面死循环问题的解决

(1)进入文本模式:CTRL+ALT+F1

(2)Uninstall any previous drivers:

sudo apt-get remove nvidia-*

sudo apt-get autoremove

(3)Uninstall the drivers from the .run file:

sudo nvidia-uninstall

(4)此时,重启可login normally.
(5)驱动重新安装:

(1)Ctrl+Alt+F1
(2)sudo service lightdm stop
(3)sudo ./NVIDIA-Linux-x86_64-381.22.run -no-x-check -no-nouveau-check -no-opengl-files

-no-x-check安装驱动时关闭x服务;
-no-nouveau-check 安装驱动时禁用Nouveau
-no-opengl-files 安装时只装驱动文件,不安装Opengl

(6)sudo service lightdm restart(可正常登录)
(7)重启不会出现循环登录。

你可能感兴趣的:(Ubuntu 16.04 配置深度学习环境)