undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11

建议先尝试方案2

方案1

用远程服务器配环境在控制台import torch时有以下报错
undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11_第1张图片找到报错的原因是连接不上动态库,路径是框中所标的,我们可以找一下所有的 libcublas.so.11

find -name libcublas.so.11

得到下面的内容
undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11_第2张图片
找到我们需要的路径后,检查一下环境变量里有没有对应的LD_LIBRARY_PATH
undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11_第3张图片
显然是没有的,所以我们手动添加进去

export LD_LIBRARY_PATH="./anaconda3/envs/detr/lib/python3.8/site-packages/nvidia/cublas/lib/:$LD_LIBRARY_PATH"

问题解决
undefined symbol: cublasLtHSHMatmulAlgoInit, version libcublasLt.so.11_第4张图片

方案2

检查一下torch等的版本适配问题,比如cuda为11.4,误装cuda版本为11.6的torch

你可能感兴趣的:(linux,服务器)