准备工作
架构与GPU型号:非官方介绍,页面搜索一下GPU就行。这个表显示我应该装CUDA10,但是先8.0凑和着。理论依据,要用9的话会出现这个问题
Pascal (CUDA 8 and later)
SM60 or SM_60, compute_60 –
Quadro GP100, Tesla P100, DGX-1 (Generic Pascal)
SM61 or SM_61, compute_61–
GTX 1080, GTX 1070, GTX 1060, GTX 1050, GTX 1030 (GP108), GT 1010 (GP108) Titan Xp, Tesla P40, Tesla P4, Discrete GPU on the NVIDIA Drive PX2
SM62 or SM_62, compute_62 –
Integrated GPU on the NVIDIA Drive PX2, Tegra (Jetson) TX2
Volta (CUDA 9 and later)
SM70 or SM_70, compute_70 –
DGX-1 with Volta, Tesla V100, GTX 1180 (GV104), Titan V, Quadro GV100
SM72 or SM_72, compute_72 –
Jetson AGX Xavier, Drive AGX Pegasus, Xavier NX
Turing (CUDA 10 and later)
SM75 or SM_75, compute_75 –
GTX/RTX Turing – GTX 1660 Ti, RTX 2060, RTX 2070, RTX 2080, Titan RTX, Quadro RTX 4000, Quadro RTX 5000, Quadro RTX 6000, Quadro RTX 8000, Quadro T1000/T2000, Tesla T4
更新补充,8.0不能凑合,cuda8编译YOLOV4出现fatal error: cuda_runtime.h: 没有那个文件或目录错误,添加软链接就行。
kobosp@KOBOSPP53:~/SLAM_YOLO/YOLOV4$ make
mkdir -p ./obj/
mkdir -p backup
chmod +x *.sh
g++ -std=c++11 -std=c++11 -Iinclude/ -I3rdparty/stb/include -DOPENCV `pkg-config --cflags opencv4 2> /dev/null || pkg-config --cflags opencv` -DGPU -I/usr/local/cuda/include/ -DCUDNN -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC -Ofast -DOPENCV -DGPU -DCUDNN -I/usr/local/cudnn/include -c ./src/image_opencv.cpp -o obj/image_opencv.o
In file included from ./src/image.h:3:0,
from ./src/image_opencv.h:4,
from ./src/image_opencv.cpp:1:
include/darknet.h:41:26: fatal error: cuda_runtime.h: 没有那个文件或目录
compilation terminated.
Makefile:183: recipe for target 'obj/image_opencv.o' failed
make: *** [obj/image_opencv.o] Error 1
kobosp@KOBOSPP53:~/SLAM_YOLO/YOLOV4$ gedit ~/.bashrckobosp@KOBOSPP53:~/SLAM_YOLO/YOLOV4$ gedit /etc/profile
kobosp@KOBOSPP53:~/SLAM_YOLO/YOLOV4$ sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda
[sudo] kobosp 的密码:
kobosp@KOBOSPP53:~/SLAM_YOLO/YOLOV4$ make
chmod +x *.sh
但是解决这个问题后出现。。。再次重装系统吧。
nvcc fatal : Unsupported gpu architecture 'compute_75'
更新
cuda10安装还是比较快,没有遇到啥问题,以下是记录
安装460驱动
安装CUDA10.2,还有两个补丁
sudo sh ./cuda_10.2.89_440.33.01_linux.run
sudo sh ./cuda_10.2.1_linux.run
sudo sh ./cuda_10.2.2_linux.run
sudo gedit /etc/profile
# add follow
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
#
source /etc/profile
nvcc -V
以下是原文
ubuntu 16.04默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。
编辑文件blacklist.conf
sudo gedit /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
更新系统
sudo update-initramfs -u
重启系统(一定要重启),及后验证nouveau是否已禁用。没有信息显示,说明nouveau已被禁用,接下来可以安装nvidia的显卡驱动。
lsmod | grep nouveau
重启命令:
1、reboot
2、shutdown -r now 立刻重启(root用户使用)
3、shutdown -r 10 过10分钟自动重启(root用户使用)
4、shutdown -r 20:35 在时间为20:35时候重启(root用户使用)
如果是通过shutdown命令设置重启的话,可以用shutdown -c命令取消重启
关机命令:
1、halt 立刻关机
2、poweroff 立刻关机
3、shutdown -h now 立刻关机(root用户使用)
4、shutdown -h 10 10分钟后自动关机
如果是通过shutdown命令设置关机的话,可以用shutdown -c命令取消重启
**卸载原来的显卡驱动**
```bash
sudo ./NVIDIA.run --uninstall#.run文件安装
sudo apt-get remove --purge nvidia*#其他
./NVIDIA.run是下载下来的run文件的所在位置及名称
**安装显卡驱动**
下载地址:[NVIDIA 驱动程序下载](https://www.nvidia.cn/Download/index.aspx?lang=cn)
按`ctrl+alt+f1`进入文本模式,
```bash
sudo service lightdm stop
sudo ./NVIDIAT1000-Linux-x86_64-460.39.run –no-opengl-files -no-x-check -no-nouveau-check
sudo service lightdm start
当提示你nvidia-xconfig时,就视自己的电脑情况而定,如果电脑是双显卡(双独显、集显和独显)就选择不安装,如果只有一个显卡就选择安装。查看是否安装成功的指令,显示就行。
nvidia-smi
nvidia-smi -l 1#循环显示
安装CUDA8
run文件下载地址
参照这文章,但是他说的太多拉,这位写的比较高深,有一些操作不是很懂。以下是精简内容及命令。
按Ctrl+Alt+F1进入文本模式(命令行界面),登录账户。
sudo service lightdm stop#关闭图形化界面
cd ~/.GPU_CUDA #切换到cuda安装文件的路径
sudo ./cuda_8.0.61_375.26_linux.run#cuda8本体1.5GB
sudo ./cuda_8.0.61.2_linux.run#cuda8补丁97.5MB
按照提示一步步操作,遇到提示是否安装openGL,选择no,安装成功后,会显示installed,否则会显示failed。
sudo service lightdm start#重新启动图形化界面。
同时按住Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。如果能够成功登录,则表示不会遇到循环登录的问题。
sudo gedit /etc/profile#设置环境变量
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
input reboot or source /etc/profile
最后验证安装正确性
cat /proc/driver/nvidia/version#验证驱动版本
nvcc -V#会输出CUDA的版本信息
cd /home/kobosp/NVIDIA_CUDA-8.0_Samples
make#编译cuda提供的全部例子,时间比较长,17还是7分钟忘了。
cd ./1_Utilities/deviceQuery && make#嫌太长就只编译这个
cd ./bin/x86_64/linux/release
./deviceQuery
./bandwidthTest
要卸载该版本CUDA命令为
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
拷贝CUDNN
cudnn真的阴间,网站还要注册,免费标记数据集,网速还巨卡,开VPN,以下三个都要下载,然后安装。
Download cuDNN v7.1.4 (May 16, 2018), for CUDA 8.0
cuDNN v7.1.4 Runtime Library for Ubuntu16.04 (Deb)
cuDNN v7.1.4 Developer Library for Ubuntu16.04 (Deb)
cuDNN v7.1.4 Code Samples and User Guide for Ubuntu16.04 (Deb)
把cudnn的头文件拷贝到/usr/local/cuda-8.0/include下面,库文件拷贝到/usr/local/cuda-8.0/lib64下面,或者直接安装deb。
cp cuda/include/* /usr/local/cuda-8.0/include/
cp cuda/lib64/* /usr/local/cuda-8.0/lib64/
or
sudo dpkg -i libcudnn7_7.1.4.18-1+cuda8.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.1.4.18-1+cuda8.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.1.4.18-1+cuda8.0_amd64.deb
cat /usr/local/cuda/version.txt# cuda 版本
cat /usr/include/x86_64-linux-gnu/cudnn_v7.h | grep CUDNN_MAJOR -A 2# cudnn 版本
OKK,重装系统搞完了一半。