torch_geometric torch_scatter 安装记录

安装torch 的时候,如果显卡是RTX3090 ,对应的cuda版本应该是11.0及以上版本,例如torch1.7.1+cu110 。

第一次安装 torch_geometric torch_scatter 时候, 遇到报错 OSError: libtorch_cuda_cu.so: cannot open shared object file: No such file or directory 。

问题应该是 cuda版本不匹配问题,两个办法:

1、在conda 环境中安装cudatoolkit 包,例如你的torch版本是 torch1.7.1+cu110,就使用命令 conda install cudatoolkit=11.0  进行安装,然后再安装 torch_geometric torch_scatter... , cuda版本也要对应,安装完成之后,可能需要一次系统重启,才会有效。

注意:系统重启后,运行 nvidia-smi 后,可能会出现错误 NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver....., 如果出现这个错误,就参考 


 无法连接NVIDIA驱动:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver_W&J-CSDN博客

2、直接在服务器上再安装cuda11.0 ,在ubuntu上安装过程时可能遇到其它问题,具体问题可查询百度解决。可使用 nvcc -V 命令查看现有的cuda版本

上一个问题解决后,又遇到错误 torch_sparse/_version_cpu.so: undefined symbol: _ZN3c106detail12infer_schema20make_function_schemaENS_8ArrayRefINS1_11ArgumentDefEEES4_ 

这个问题大概率是因为conda环境中有多个版本pytorch(例如同时存在cpu和gpu版本)。

当我们在使用conda命令安装torch时,它会自动安装gpu和cpu版,用pip下载安装时也可能会这样(我就遇到了), 所以可以先下载 torch的whl 文件,然后进行安装,就不会有重复的torch版本了。

最后可能还需要重启一下才能生效。

你可能感兴趣的:(ubuntu,pytorch,深度学习,人工智能)