文件准备:根据自己的硬件配置需求,去NVIDIA官网下载符合显卡的驱动文件和cuda文件,笔者这里以CentOS 7.6下安装RTX 3090为实例。
1、拷贝文件
在系统安装完以后并且确保能上网的情况下,先挂载U盘,将cuda_11.2.0_460.27.04_linux.run和 NVIDIA-Linux-x86_64-460.56.run复制到系统 ~ 文件夹下
然后下载pciutils,gcc,gcc-c++,vim,make,
Yum –y install pciutils(借助lspci | grep NVIDIA查看显卡物理槽位是否认出显卡)
yum –y install gcc
yum –y install gcc-c++
yum –y install make
yum –y install vim
2、查看内核版本
查看内核版本 uname -r
查看目前已有的kernel-devel
uname -a ; rpm -qa kernel\* | sort
下载对应版本
$ sudo yum –y install "kernel-devel-uname-r == $(uname -r)"
如果在系统中无法下载对应版本可以自行百度找到对应压缩包文件,如下图所示:
以957版本为例,下载完将RPM文件拷贝到系统 ~ 文件夹下,运行
rpm –ivh kernel-devel-3.10.0-957.1.3.el7.x86_64(1).rpm
注:这一步关键在于会影响后续显卡驱动的安装,如果内核版本不统一,显卡驱动安装时会报错,如下图所示:
3、屏蔽Nouveau
cd /etc/modprobe.d
找到blacklist.conf,若没有则新建:touch blacklist.conf
vim blacklist.conf
按Insert添加blacklist nouveau
按Esc后输入冒号wq! :wq! 保存退出编辑
(系统中应该有个dccp-blacklist.conf文件,直接vim这个文件里添加到这个好像也是行的)
然后使用dracut重新建立 initramfs image file
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
然后重启系统
重新进入系统以后用lsmod | grep nouveau验证,如果正常无输出说明第三步步骤正确。
4、安装驱动和cuda
进入~文件夹下,运行显卡驱动和cuda
./NNVIDIA-Linux-x86_64-460.56.run
跳出选项选择Ignore CC check , X server 那个选no;
等待安装完成并验证,输入nvidia-smi回车后出现显卡状态即安装成功。
如果因为内核版本遇到无法安装的情况,在run 后边加上 空格--kernel-source-path=/usr/src/kernels/内核版本号
./ cuda_11.2.0_460.27.04_linux.run
出来的界面填入accept,取消install driver ,往下到install回车
安装完成后配置环境变量:
vim ~/.bashrc
按Insert光标移动到文末输入:(标红字的部分一定要和安装的版本一致)
export CUDA_HOME=/usr/local/cuda-11.2
export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
然后输入source ~/.bashrc回车后生效
输入nvcc –version查看版本
5、测试GPU
下载gpu burn
在CentOS下需要先安装wget
yum –y install wget
wget http://www.wili.cc/blog/entries/gpu-burn/gpu_burn-1.1.tar.gz
创建GPU文件夹:mkdir GPU 并把压缩包拷贝进去,删除多余的文件
cp gpu_burn-1.1.tar.gz GPU
rm –rf gpu_burn-1.1.tar.gz
进入GPU文件夹中:cd GPU
利用ls查看到文件夹中的压缩包,进行解压:
tar -xvf gpu_burn-1.1.tar.gz
然后运行make
注意:如果此时make无效,如下图:
则首先vim Makefile
进入以后将下图中的30修改为60:
然后Esc一下 , :wq! 保存退出,重新运行make即可生效
运行./gpuburn 3600 #跑3600秒
在另外一个终端 watch –n 1 –d nvidia-smi ,观测GPU温度和进程
以上即可完成驱动的安装。
参考文档:
https://blog.csdn.net/shiyuedehupo/article/details/51500151?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161492798616780264046720%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=161492798616780264046720&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~baidu_landing_v2~default-1-51500151.first_rank_v2_pc_rank_v29&utm_term=kernel+devel%E7%89%88%E6%9C%AC%E5%A6%82%E4%BD%95%E6%9F%A5%E8%AF%A2
https://blog.csdn.net/fortuna_i/article/details/83141070