centos8 stream下安装cuda、Nvidia驱动、cnDnn、paddlepaddle-gpu、paddleocr过程(自用 GTX A4000显卡)

需要的版本在paddlepaddle官网可以看到。
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
费了几天时间,花了很多功夫,最后还是摸索出来了,记录如下,自用。
记录有些乱,在意请勿继续阅读。

A4000我安装的cuda为11.2。
CUDA 工具包 10.2 配合 cuDNN v7.6.5, 如需使用 PaddleTensorRT 推理,需配合 TensorRT7.0.0.11
CUDA 工具包 11.2 配合 cuDNN v8.2.1, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.0.3.4
CUDA 工具包 11.6 配合 cuDNN v8.4.0, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.4.0.6
CUDA 工具包 11.7 配合 cuDNN v8.4.1, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.4.2.4

1 首先确认内核版本和发行版本,再确认显卡型号
rpm -qa|grep kernel
删除多余内核
yum remove -y kernel-core-4.18.0-358.el8.x86_64
yum remove -y kernel-4.18.0-358.el8.x86_64
安装编译相关东西
sudo yum install -y gcc gcc-c++ kernel-devel kernel-headers epel-release
yum install -y dkms
yum install pciutils
centos8如果是服务器最小化安装的话,还需要安装:
sudo yum install libX11
sudo yum install libXext
默认没有安装locate命令
解决方案:
1、运行下面命令安装locate:
yum install mlocate
2、执行updatedb命令更新文件数据库
updatedb
查看显卡信息
lspci | grep -i nvidia

禁用nouveau驱动

(1)在grub 启动中禁用nouveau,
nano /etc/default/grub
'GRUB_CMDLINE_LINUX’中添加 rd.driver.blacklist=nouveau nouveau.modeset=0

然后更新grub:grub2-mkconfig -o /boot/grub2/grub.cfg

(2)在/usr/lib/modprobe.d/dist-blacklist.conf 或/etc/modprobe.d/blacklist.conf中末尾添加blacklist。如下是/usr/lib/modprobe.d/dist-blacklist.conf的原有内容

nano /usr/lib/modprobe.d/dist-blacklist.conf

在末尾添加:

blacklist nouveau

保存

(3)备份 initramfs nouveau image镜像

mv /boot/initramfs- ( u n a m e − r ) . i m g / b o o t / i n i t r a m f s − (uname -r).img /boot/initramfs- (unamer).img/boot/initramfs(uname -r).img.bak

(4)使用 dracut重新建立 initramfs

dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

(5)reboot 重启,然后lsmod | grep nouveau 确认nouveau没有被加载

参考资料:

https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html

下载地址:

https://www.nvidia.cn/Download/index.aspx?lang=cn

https://cn.download.nvidia.com/XFree86/Linux-x86_64/525.89.02/NVIDIA-Linux-x86_64-525.89.02.run

https://developer.nvidia.com/cuda-downloads

https://developer.nvidia.com/cuda-toolkit-archive

https://developer.nvidia.com/rdp/cudnn-archive

安装驱动:

./NVIDIA-Linux-x86_64-418.113.run

验证 nvidia-smi

然后重启 reboot下,继续安装

安装cuda

./cuda_11.2.2_460.32.03_linux.run

CUDA导出为环境变量

nano /etc/profile

nano ~/.bashrc

增加:

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

source ~/.bashrc

查看是否安装成功

nvcc -V

nvidia-smi

进一步验证。

cd /usr/local/cuda/samples/1_Utilities/deviceQuery

sudo make

./deviceQuery

出现Result = PASS并成功检测出全部显卡,代表显卡驱动和CUDA安装成功。

rpm -ivh libcudnn8-8.2.1.32-1.cuda11.3.x86_64.rpm

rpm -ivh libcudnn8-devel-8.2.1.32-1.cuda11.3.x86_64.rpm

rpm -ivh libcudnn8-samples-8.2.1.32-1.cuda11.3.x86_64.rpm

conda

Linux的版本在官网上找合适版本的软件包

官网:

https://repo.anaconda.com/archive/

Anaconda3-2020.11-Linux-x86_64.sh

我的anaconda3安装在/root/下面,所以需要在相同目录下修改.bashrc的路径。

用命令 vim /root/.bashrc打开后,

添加export PATH=/root/anaconda3/bin:$PATH,

再用source /root/.bashrc生效文件。

创建环境

conda create -n python39 python=3.9.13

5.安装完毕后,查看镜像源

conda config --show channels

显示只有default,则需要修改channels添加国内清华镜像源以加速下载要安装的包

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

.再输入以下命令

conda config --set show_channel_urls yes

conda config --show channels

https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html

paddlepaddle配套的数据:

RTX A4000显卡需要用cuda11.2,cuDNN用8.2.1,驱动越新越好。

安装paddlepaddle-gpu版本 11.2

pip install onnx==1.12.0 -i https://mirrors.tencent.com/pypi/simple

pip install protobuf==3.20.0 -i https://mirrors.tencent.com/pypi/simple

python -m pip install paddlepaddle-gpu==2.4.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

pip install paddleocr -i https://mirrors.tencent.com/pypi/simple

pip install minio -i https://mirrors.tencent.com/pypi/simple

你可能感兴趣的:(paddlepaddle,linux,python,centos)