ubuntu 16.04 下如何安装NVIDA driver / cuda /Anaconda /tensorflow or pytorch

注:shift+prt sc sys rq 组合键 截取屏幕部分

NVIDIA driver install:

1:NVIDIA官网下你机器所支持硬件的驱动 : lspci | grep VGA

2.搜索对应型号的NVIDIA驱动 下载:

ubuntu 16.04 下如何安装NVIDA driver / cuda /Anaconda /tensorflow or pytorch_第1张图片

3.卸载原有驱动

   a:sudo apt-get remove --purge nvidia* (针对deb文件)

   b:bash ./nvidia.run --uninstall (针对官网下载包)

4.禁用nouveau 编辑系统配置文件 在里面添加nouveau为黑名单

  a:sudo gedit /etc/modprobe.d/blacklist.conf  在后面添加 blacklist nouveau

  b:更新配置文件 sudo update-initramfs -u (需要重启系统)

  c:执行 lsmod | grep nouveau 若没有任何输出则禁用成功;

5.安装驱动:

 a:按下alt+ctrl+F1切换到执行命令行模式下

 b:禁用X服务:sudo /etc/init.d/lightdm stop

 c:赋予NVIDIA驱动权限: sudo chmod a+x NVIDIA-Linux-x86_64-390.87.run 

 d:执行安装命令:sudo bash NVIDIA-Linux-x86_64-390.87.run -no-opengl-files  (把opengl一并安装上会导致循环登录,尝试过      的人都被这个坑深深的坑过)

e:重启系统 reboot 输入 nvidia-smi 和nvidia-setting 测试是否安装成功。

注1:因为项目需要,我需要安装OpenCL 作为嵌入式并行开发,由于本人新入门OpenCL,安装了一些和原驱动不兼容的OpenCL-NVIDIA SDK ,致使重启电脑后,根本无法进入界面,连ctrl+alt+F1命令行都无法进入,这下可傻眼了不知道怎么搞了?解决办法是:

 1:制作一个包含和电脑同系统的启动U盘;

 2:开机进入boost 菜单,try Ubuntu;

 3:修改 /etc/modprobe.d/blacklist.conf 在下面  blacklist nvida* ,保存 关机,拔掉U盘 重启;

 4:正常情况下用ctrl+alt+F1可以进入命令行 模式;

 5:然后删除 nvidia 的所有驱动,按着上述方式重装;

注2: 这里我又出现了一个bug,一直出现卡的状态下的循环登录,因为卡 所以应该没有安装nvidia* dirve, 若安装驱动后出现循环登录,可能是那个比较常见的问题 ,在安装的时候没有 选择禁用 -no-opengl-files ,现在出现这个情况,让我摸不着头脑,继续找,可能是之前安装那个不兼容的驱动,于是:

sudo apt-get remove --purge nvidia-*
sudo apt-get autoremove #特别重要
sudo apt-get install -f #特别重要
sudo reboot

可以解决循环登录问题,一定要多尝试,人生不止,折腾不息,送给敬爱的自己,!!

TIPS:NVIDIA driver 一个懒人的安装方式是直接从系统设置中软件更新,不过可能不是本机硬件对应的驱动版本容易出错,不建议安装:

ubuntu 16.04 下如何安装NVIDA driver / cuda /Anaconda /tensorflow or pytorch_第2张图片

 

安装 cuda

1:下载.run文件

目前最近cuda9.1,但tensorflow只支持到9.0 从官网找到9.0版本:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal

ubuntu 16.04 下如何安装NVIDA driver / cuda /Anaconda /tensorflow or pytorch_第3张图片

cuda .run 文件driver 和 tookit sample 等分开(推荐install .run 文件)

cuda.deb 文件 没有分开 

2. 安装 

 进入下载包文件夹中 执行 sudo bash cuda_9.0.176_384.81_linux.run  

  1): Do you accept the previously read EULA? accept

  2): Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26? n(因为我们已经在上面的步骤安装了最新的显卡驱             动)  

  3): Install the CUDA 9.0 Toolkit? y

  4): Enter Toolkit Location enter

  5): Do you want to install a symbolic link at /usr/local/cuda? y

  6): Install the CUDA 9.0 Samples? y

  7): Enter CUDA Samples Location enter 

配置编译环境:

sudo gedit ~/.bashrc 添加最后两行

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

export CUDA_HOME=/usr/local/cuda
source ~/.bashrc   立即生效

 

3. 安装测试:

  1)cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery

        sudo make -j4

        ./deviceQuery 

  2)cd ../bandwidthTest

        sudo make -j4

       ./bandwidthTest 

   两个测试都通过,测试通过。

卸载cuda

     

         sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl 

         sudo rm -rf /usr/local/cuda-9.0/

   

安装CUDNN

ubuntu 16.04 下如何安装NVIDA driver / cuda /Anaconda /tensorflow or pytorch_第4张图片

cudnn 下载传送带:https://developer.nvidia.com/rdp/cudnn-archive 要找到对应版本,cuda9.0 cudnn7.0 tensorflow-gpu==1.6

$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

常见问题:

问题1: CUDNN_STATUS_INTERNAL_ERROR

好多次因为cudnn版本太新 导致这样那样的错误 such as:

问题2: CUBLAS_STATUS_EXECUTION_FAILED

这里主要原因可能是cuda9.0 在 RTX 2080上bug ,你需要安装 cuda9.0 的patch 2  修复下,具体安装方法可以参见官网 

安装Anaconda

1.下载Anaconda 安装包,你可以去官网下载也可以去一些镜像网站下载,亲测,国内清华大学开源软件镜像站是最快的,与其他的相比不是一般的快,https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 去这里下载你电脑对应版本 的安装包:

       有两点说明:

       a:需要找到你所用的python(2 or 3)版本对应的Anaconda;

       b:需要找到你系统对应版本 (64bits or 32 bits)

           如果不知道 请在终端输入命令: sudo uname --m 查看

下载Anaconda3-5.2.0-Linux-x86_64sh 文件 执行安装:bash Anaconda3-5.2.0-Linux-x86_64.sh 

2.配置环境变量(提示 conda 找不到命令):

3  把TUNA 的一些镜像文件添加到系统仓库中: https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/ 

TUNA 还提供了 Anaconda 仓库的镜像,运行以下命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

即可添加 Anaconda Python 免费仓库。

运行 conda install numpy 测试一下吧。 

安装pytorch

  一条命令搞定:conda install pytorch torchvision -c pytorch
 

QUESTION:

Ubuntu16.04 安装后分辨率只有一个选项:

1.打开grub文件:

sudo gedit /etc/default/grub

2.搜索#GRUB_GFXMODE=640*480

3.编辑640×480改成你想要的分辨率,并取消前面的#

4.GRUB_GFXMODE=1920×1080

5.更新 sudo update-grub

6重启 reboot

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(Ubuntu,环境下配置,XX)