需要的版本在paddlepaddle官网可以看到。
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
费了几天时间,花了很多功夫,最后还是摸索出来了,记录如下,自用。
记录有些乱,在意请勿继续阅读。
A4000我安装的cuda为11.2。
CUDA 工具包 10.2 配合 cuDNN v7.6.5, 如需使用 PaddleTensorRT 推理,需配合 TensorRT7.0.0.11
CUDA 工具包 11.2 配合 cuDNN v8.2.1, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.0.3.4
CUDA 工具包 11.6 配合 cuDNN v8.4.0, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.4.0.6
CUDA 工具包 11.7 配合 cuDNN v8.4.1, 如需使用 PaddleTensorRT 推理,需配合 TensorRT8.4.2.4
1 首先确认内核版本和发行版本,再确认显卡型号
rpm -qa|grep kernel
删除多余内核
yum remove -y kernel-core-4.18.0-358.el8.x86_64
yum remove -y kernel-4.18.0-358.el8.x86_64
安装编译相关东西
sudo yum install -y gcc gcc-c++ kernel-devel kernel-headers epel-release
yum install -y dkms
yum install pciutils
centos8如果是服务器最小化安装的话,还需要安装:
sudo yum install libX11
sudo yum install libXext
默认没有安装locate命令
解决方案:
1、运行下面命令安装locate:
yum install mlocate
2、执行updatedb命令更新文件数据库
updatedb
查看显卡信息
lspci | grep -i nvidia
禁用nouveau驱动
(1)在grub 启动中禁用nouveau,
nano /etc/default/grub
'GRUB_CMDLINE_LINUX’中添加 rd.driver.blacklist=nouveau nouveau.modeset=0
然后更新grub:grub2-mkconfig -o /boot/grub2/grub.cfg
(2)在/usr/lib/modprobe.d/dist-blacklist.conf 或/etc/modprobe.d/blacklist.conf中末尾添加blacklist。如下是/usr/lib/modprobe.d/dist-blacklist.conf的原有内容
nano /usr/lib/modprobe.d/dist-blacklist.conf
在末尾添加:
blacklist nouveau
保存
(3)备份 initramfs nouveau image镜像
mv /boot/initramfs- ( u n a m e − r ) . i m g / b o o t / i n i t r a m f s − (uname -r).img /boot/initramfs- (uname−r).img/boot/initramfs−(uname -r).img.bak
(4)使用 dracut重新建立 initramfs
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
(5)reboot 重启,然后lsmod | grep nouveau 确认nouveau没有被加载
参考资料:
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
下载地址:
https://www.nvidia.cn/Download/index.aspx?lang=cn
https://cn.download.nvidia.com/XFree86/Linux-x86_64/525.89.02/NVIDIA-Linux-x86_64-525.89.02.run
https://developer.nvidia.com/cuda-downloads
https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive
安装驱动:
./NVIDIA-Linux-x86_64-418.113.run
验证 nvidia-smi
然后重启 reboot下,继续安装
安装cuda
./cuda_11.2.2_460.32.03_linux.run
CUDA导出为环境变量
nano /etc/profile
nano ~/.bashrc
增加:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
查看是否安装成功
nvcc -V
nvidia-smi
进一步验证。
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
出现Result = PASS并成功检测出全部显卡,代表显卡驱动和CUDA安装成功。
rpm -ivh libcudnn8-8.2.1.32-1.cuda11.3.x86_64.rpm
rpm -ivh libcudnn8-devel-8.2.1.32-1.cuda11.3.x86_64.rpm
rpm -ivh libcudnn8-samples-8.2.1.32-1.cuda11.3.x86_64.rpm
conda
Linux的版本在官网上找合适版本的软件包
官网:
https://repo.anaconda.com/archive/
Anaconda3-2020.11-Linux-x86_64.sh
我的anaconda3安装在/root/下面,所以需要在相同目录下修改.bashrc的路径。
用命令 vim /root/.bashrc打开后,
添加export PATH=/root/anaconda3/bin:$PATH,
再用source /root/.bashrc生效文件。
创建环境
conda create -n python39 python=3.9.13
5.安装完毕后,查看镜像源
conda config --show channels
显示只有default,则需要修改channels添加国内清华镜像源以加速下载要安装的包
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
.再输入以下命令
conda config --set show_channel_urls yes
conda config --show channels
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
paddlepaddle配套的数据:
RTX A4000显卡需要用cuda11.2,cuDNN用8.2.1,驱动越新越好。
安装paddlepaddle-gpu版本 11.2
pip install onnx==1.12.0 -i https://mirrors.tencent.com/pypi/simple
pip install protobuf==3.20.0 -i https://mirrors.tencent.com/pypi/simple
python -m pip install paddlepaddle-gpu==2.4.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
pip install paddleocr -i https://mirrors.tencent.com/pypi/simple
pip install minio -i https://mirrors.tencent.com/pypi/simple