注:shift+prt sc sys rq 组合键 截取屏幕部分
NVIDIA driver install:
1:NVIDIA官网下你机器所支持硬件的驱动 : lspci | grep VGA
2.搜索对应型号的NVIDIA驱动 下载:
3.卸载原有驱动
a:sudo apt-get remove --purge nvidia* (针对deb文件)
b:bash ./nvidia.run --uninstall (针对官网下载包)
4.禁用nouveau 编辑系统配置文件 在里面添加nouveau为黑名单
a:sudo gedit /etc/modprobe.d/blacklist.conf 在后面添加 blacklist nouveau
b:更新配置文件 sudo update-initramfs -u (需要重启系统)
c:执行 lsmod | grep nouveau 若没有任何输出则禁用成功;
5.安装驱动:
a:按下alt+ctrl+F1切换到执行命令行模式下
b:禁用X服务:sudo /etc/init.d/lightdm stop
c:赋予NVIDIA驱动权限: sudo chmod a+x NVIDIA-Linux-x86_64-390.87.run
d:执行安装命令:sudo bash NVIDIA-Linux-x86_64-390.87.run -no-opengl-files (把opengl一并安装上会导致循环登录,尝试过 的人都被这个坑深深的坑过)
e:重启系统 reboot 输入 nvidia-smi 和nvidia-setting 测试是否安装成功。
注1:因为项目需要,我需要安装OpenCL 作为嵌入式并行开发,由于本人新入门OpenCL,安装了一些和原驱动不兼容的OpenCL-NVIDIA SDK ,致使重启电脑后,根本无法进入界面,连ctrl+alt+F1命令行都无法进入,这下可傻眼了不知道怎么搞了?解决办法是:
1:制作一个包含和电脑同系统的启动U盘;
2:开机进入boost 菜单,try Ubuntu;
3:修改 /etc/modprobe.d/blacklist.conf 在下面 blacklist nvida* ,保存 关机,拔掉U盘 重启;
4:正常情况下用ctrl+alt+F1可以进入命令行 模式;
5:然后删除 nvidia 的所有驱动,按着上述方式重装;
注2: 这里我又出现了一个bug,一直出现卡的状态下的循环登录,因为卡 所以应该没有安装nvidia* dirve, 若安装驱动后出现循环登录,可能是那个比较常见的问题 ,在安装的时候没有 选择禁用 -no-opengl-files ,现在出现这个情况,让我摸不着头脑,继续找,可能是之前安装那个不兼容的驱动,于是:
sudo apt-get remove --purge nvidia-*
sudo apt-get autoremove #特别重要
sudo apt-get install -f #特别重要
sudo reboot
可以解决循环登录问题,一定要多尝试,人生不止,折腾不息,送给敬爱的自己,!!
TIPS:NVIDIA driver 一个懒人的安装方式是直接从系统设置中软件更新,不过可能不是本机硬件对应的驱动版本容易出错,不建议安装:
安装 cuda
1:下载.run文件
目前最近cuda9.1,但tensorflow只支持到9.0 从官网找到9.0版本:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
cuda .run 文件driver 和 tookit sample 等分开(推荐install .run 文件)
cuda.deb 文件 没有分开
2. 安装
进入下载包文件夹中 执行 sudo bash cuda_9.0.176_384.81_linux.run
1): Do you accept the previously read EULA? accept
2): Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26? n(因为我们已经在上面的步骤安装了最新的显卡驱 动)
3): Install the CUDA 9.0 Toolkit? y
4): Enter Toolkit Location enter
5): Do you want to install a symbolic link at /usr/local/cuda? y
6): Install the CUDA 9.0 Samples? y
7): Enter CUDA Samples Location enter
配置编译环境:
sudo gedit ~/.bashrc 添加最后两行
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
source ~/.bashrc 立即生效
3. 安装测试:
1)cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make -j4
./deviceQuery
2)cd ../bandwidthTest
sudo make -j4
./bandwidthTest
两个测试都通过,测试通过。
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
sudo rm -rf /usr/local/cuda-9.0/
安装CUDNN
cudnn 下载传送带:https://developer.nvidia.com/rdp/cudnn-archive 要找到对应版本,cuda9.0 cudnn7.0 tensorflow-gpu==1.6
$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
常见问题:
问题1: CUDNN_STATUS_INTERNAL_ERROR
好多次因为cudnn版本太新 导致这样那样的错误 such as:
问题2: CUBLAS_STATUS_EXECUTION_FAILED
这里主要原因可能是cuda9.0 在 RTX 2080上bug ,你需要安装 cuda9.0 的patch 2 修复下,具体安装方法可以参见官网
安装Anaconda
1.下载Anaconda 安装包,你可以去官网下载也可以去一些镜像网站下载,亲测,国内清华大学开源软件镜像站是最快的,与其他的相比不是一般的快,https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 去这里下载你电脑对应版本 的安装包:
有两点说明:
a:需要找到你所用的python(2 or 3)版本对应的Anaconda;
b:需要找到你系统对应版本 (64bits or 32 bits)
如果不知道 请在终端输入命令: sudo uname --m 查看
下载Anaconda3-5.2.0-Linux-x86_64sh 文件 执行安装:bash Anaconda3-5.2.0-Linux-x86_64.sh
2.配置环境变量(提示 conda 找不到命令):
3 把TUNA 的一些镜像文件添加到系统仓库中: https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
TUNA 还提供了 Anaconda 仓库的镜像,运行以下命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
即可添加 Anaconda Python 免费仓库。
运行 conda install numpy
测试一下吧。
安装pytorch
一条命令搞定:conda install pytorch torchvision -c pytorch
QUESTION:
Ubuntu16.04 安装后分辨率只有一个选项:
1.打开grub文件:
sudo gedit /etc/default/grub
2.搜索#GRUB_GFXMODE=640*480
3.编辑640×480改成你想要的分辨率,并取消前面的#
4.GRUB_GFXMODE=1920×1080
5.更新 sudo update-grub
6重启 reboot