检查NPU是否正常在位:
lspci | grep d801
如果服务器上有 N路NPU,回显N行含“d801”字段,表示NPU正常在位
1.创建驱动运行用户HwHiAiUser
groupadd -g 1000 HwHiAiUser
useradd -g HwHiAiUser -u 1000 -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
2.安装驱动和固件
在昇腾社区的“固件与驱动”下载页面下载配套产品的固件驱动软件,上传到服务器任意目录
a.为软件包增加可执行权限。
chmod +x Ascend-hdk-910-npu-driver_23.0.rc1_linux-x86-64.run
chmod +x Ascend-hdk-910-npu-firmware_6.3.0.1.241.run
b.安装驱动。
./Ascend-hdk-910-npu-driver_23.0.rc1_linux-x86-64.run --full --install-for-all
默认安装路径为“/usr/local/Ascend”
npu-smi info
验证安装成功
c.安装固件。
./Ascend-hdk-910-npu-firmware_6.3.0.1.241.run --full
3.驱动固件安装完成后,重启系统。
reboot
CANN软件安装过程需要下载相关依赖,确保安装环境连网,并已配置软件源
apt-get install -y gcc g++ make cmake zlib1g zlib1g-dev openssl libsqlite3-dev libssl-dev libffi-dev unzip pciutils net-tools libblas-dev gfortran libblas3
wget https://www.python.org/ftp/python/3.7.5/Python-3.7.5.tgz
2)解压缩源码包
tar -zxvf Python-3.7.5.tgz
3)源码编译安装Python。
cd Python-3.7.5
./configure --prefix=/usr/local/python3.7.5 --enable-loadable-sqlite-extensions --enable-shared
make
make install
以–prefix=/usr/local/python3.7.5路径为例进行说明。执行配置、编译和安装命令后,安装包在/usr/local/python3.7.5路径。
4)设置python3.7.5环境变量。
#用于设置python3.7.5库文件路径
export LD_LIBRARY_PATH=/usr/local/python3.7.5/lib:$LD_LIBRARY_PATH
#如果用户环境存在多个python3版本,则指定使用python3.7.5版本
export PATH=/usr/local/python3.7.5/bin:$PATH
5)检查是否安装成功。
python3 --version
pip3 --version
6)安装pip依赖。
pip3 install attrs numpy decorator sympy cffi pyyaml pathlib2 psutil protobuf scipy requests absl-py
从昇腾社区“CANN”产品页,根据操作系统架构下载CANN开发套件包。
将其上传到安装环境任意目录。
安装CANN开发套件包。
添加可执行权限
chmod +x Ascend-cann-toolkit_6.3.RC1_linux-***.run
安装
./Ascend-cann-toolkit_6.3.RC1_linux-***.run --install --install-for-all
安装Pytorch前,需要先安装以下依赖。
pip3 install wheel
pip3 install typing_extensions
安装torch
wget https://repo.huaweicloud.com/kunpeng/archive/Ascend/PyTorch/torch-1.11.0-cp37-cp37m-linux_aarch64.whl
pip3 install torch-1.11.0-cp37-cp37m-linux_aarch64.whl
安装torch_npu
wget https://gitee.com/ascend/pytorch/releases/download/v5.0.rc1-pytorch1.11.0/torch_npu-1.11.0-cp37-cp37m-linux_aarch64.whl
pip3 install torch_npu-1.11.0-cp37-cp37m-linux_aarch64.whl
安装对应框架版本的torchvision。
pip3 install torchvision==0.12.0
后面有空再写推理环境搭建
https://huaweicloud.csdn.net/64704bed762a09416a07f3c8.html