服务器AI-template环境搭建记录

安装Python 3.8+

首先服务器用的是Ubuntu18.04,A100 GPU,自带显卡驱动,自带python3.7。然而AItemplate编写时使用的语言至少是python3.8,如果用低于python3.8来运动会报错
安装方法参考以下链接:
centos 7 升级Python3.8 - adao - 博客园
注意正确设置软链接

可能的报错:
ModuleNotFoundError: No module named '_ctypes':
solutioin: apt-get install libffi-dev, then rebuild python (make install)

安装后应该会同时自动安装pip,pip换源方法:
更换(Pypi)pip源到国内镜像-阿里云开发者社区
 

阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学
Simple Index

临时换源
pip install xxx -i Simple Index

可能的报错:
wget: unable to resolve rost address:
这是wget解析域名有问题
在/etc/resolv.conf加入下面两行:
nameserver 8.8.8.8 #google域名服务器
nameserver 8.8.4.4 #google域名服务器

安装CUDA-Toolkit 11.6

CUDA官网下载安装即可,注意安装的时候只选Toolkit不选driver及其他几项(如果你的服务器上本来就有驱动),参考以下链接:
CUDA Toolkit 11.6 Downloads | NVIDIA Developer

安装torch,torchaudio,torchvision

装过太多遍了,建议官网装,换源装最好先下载下来然后本地手动装,从镜像源下载一定要注意是否支持CUDA

安装AI-template

参考官方文档和github:
Installing AITemplate — AITemplate 0.1 documentation
centos 7 升级Python3.8 - adao - 博客园

可能的报错:
ModuleNotFoundError: No module named '_sqlite3'
Solution:sudo apt-get install libsqlite3-dev

ModuleNotFoundError: No module named '_bz2'
Solution:
apt-get install libbz2-dev

ModuleNotFoundError: No module named '_lzma'
Solution:
apt-get install liblzma-dev -y

RuntimeError: Failed to create cutlass library lib: [Errno 2] No such file or directory: '/usr/local/python3/lib/python3.8/3rdparty/cutlass/tools/library/scripts'

Solution:This is due to the lack of 3rdparty libs. 
git submodule update --init --recursive
And set AItemplate to python path

你可能感兴趣的:(python,ubuntu,开发语言)