GPU服务器环境配置踩坑

今天在购买腾讯云服务器时,不小心选择错了环境,也就只能重装系统,然而重装后的系统中没有装入conda环境,需要自己手动按照一下:
博主选择安装miniconda

CONDA安装

下载Miniconda3

wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh

安装Miniconda3

chmod 777 Miniconda3-latest-Linux-x86_64.sh
sh Miniconda3-latest-Linux-x86_64.sh

值得注意的是,最后询问是否初始化Miniconda3时,选“no”。
这样可以防止环境冲突。
在这里插入图片描述

使用vim工具,编辑.bashrc文件

这一步为修改环境变量

vim ~/.bashrc

在最下行输入miniconda3的安装目录作为环境变量,与上面保存的安装目录相同,本文是“/home/ubuntu/miniconda3”

export  PATH="/home/ubuntu/miniconda3/bin:"$PATH

输入命令使.bashrc文件生效

source ~/.bashrc

此时运行conda命令即可。

DETR环境配置

前面的conda环境配置就不再赘述了,主要是在后面配置cuda算子时出现了问题:
依次执行下面命令:

CUDA算子配置

cd models/dino/ops
python setup.py build install
python test.py

在执行test.py时出错了。

Traceback (most recent call last):
  File "test.py", line 18, in <module>
    from functions.ms_deform_attn_func import MSDeformAttnFunction, ms_deform_attn_core_pytorch
  File "/home/cse305/code/vidt-main/ops/functions/__init__.py", line 9, in <module>
    from .ms_deform_attn_func import MSDeformAttnFunction
  File "/home/cse305/code/vidt-main/ops/functions/ms_deform_attn_func.py", line 18, in <module>
    import MultiScaleDeformableAttention as MSDA
ImportError: libcudart.so.10.2: cannot open shared object file: No such file or directory

关于这个问题博主很奇怪,博主明明用的时cuda-11.4,怎么会出现10.2呢?
解决方法:先把ops中原来编译的build文件夹删掉,在终端中执行

export CUDA_HOME=/usr/local/cuda-11.4 #具体版本查看自己电脑的路径

当然也可以直接在.bashrc文件中修改。
随后再次运行,在进行下载resnet权重时报错了。
在这里插入图片描述
这里我们可以选择手动下载,将下载好的权重文件放入到下面路径即可

windows:C:\Users\peng\.cache\torch\checkpoints (peng是你的电脑用户名)
linux:/home/ubuntu/.cache/torch/hub/checkpoints/

切换到linux路径下执行下载命令即可。

sudo wget https://download.pytorch.org/models/resnet50-0676ba61.pth

但这里博主发现在服务器上下载的速度属实太慢,不理解,反而在本地下载速度很快,因此博主决定将其在本地下载完成后上传到服务器。

GPU服务器环境配置踩坑_第1张图片

随后,便完成了配置过程。

你可能感兴趣的:(DETR系列,服务器,linux,运维)