linuxMINT+anaconda+pytorch+cuda+cudnn

mint装机:
1.mint 安装nVidia显卡,install界面出来后按e,进入 在splash 之后去掉--,输入nomodeset ,按F10或其他提示命令继续
2.安装重启在出来品牌图形之后,立马 shift+esc,进入编辑界面, 在splash 之后去掉--,输入nomodeset ,按F10或其他提示命令继续
3.进入界面后,修改源:中科大、清华;安装nvidia驱动,515或520 之上的都cuda11.X
4.重启即可
5.从系统首选项进入安装输入法,fictx 安装完成后记得配置键盘顺序

安装软件:
1.anaconda:https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/;下载文件:Anaconda3-2022.10-Linux-x86_64.sh,安装:bash XX.sh;配置环境变量 vi~/.bashrc,最后加入:PATH=/home/用户名/anaconda3/bin:$PATH;source ~/.bashrc
输入conda info 验证是否成功;
【- root 不能conda ;  让root和普通用户共享[环境变量](https://so.csdn.net/so/search?q=环境变量&spm=1001.2101.3001.7020),[参考了此篇blog](https://www.cnblogs.com/MemoryOfStars/p/11309625.html)
  首先打开sudoers文件: sudo vi /etc/sudoers
  修改其中的一项内容为:Defaults !env_reset
  然后修改.bashrc文件 :alias sudo='sudo env PATH=$PATH'
  最后再source一下 :source ~/.bashrc
  问题解决】
2.vscode 或者pycharm
deb的包 sudo dpkg -i 后面直接是包名,不能带路径名,带路径名会直接打开文件;

安装pytorh、torchvision
1.离线下包https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
2.离线安装:GPU的:pip install "torch-1.11.0+cu113-cp39-cp39-win_amd64.whl"
print(torch.__version__ )
3.在线安装torchvision  : pip install torchvision==0.12.0+cu113 
4.安装成功测试:是否是gpu的 还是cpu的
import torchvision
import torch
print(torch.cuda.is_available())
print(torchvision.__version__)
torch ==1.11.0+cu113
torchvision.__version__==0.12.0+cu113

安装cuda、cudnn
1.nvidia-smi 验证驱动有没有成功
2.
下载:[https://developer.nvidia.com/cuda-11-3-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_localhttps://developer.nvidia.com/cuda-11-3-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local](https://developer.nvidia.com/cuda-11-3-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local) 11.3版本

下载2.9G包 执行命令:sudo sh cuda_11.3.1_465.19.01_linux.run
执行continue 输入accept,除了驱动之外的都选择,选择X出现是选中。安装后:
修改环境变量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
export PATH=$PATH:/usr/local/cuda-11.3/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.3

3.测试 cuda成功:nvcc -V
4.安装cudnn,注册账号,下载对应的版本cudnn-local-repo-ubuntu2004-8.6.0.163_1.0-1_amd64.deb.deb,sudo cp /var/cudnn-local-repo-ubuntu2004-8.6.0.163/cudnn-local-B0FE0A41-keyring.gpg /usr/share/keyrings/
验证:
import torch
from torch.backends import  cudnn
print(torch.backends.cudnn.version())

虚拟环境
1.创建虚拟环境 
正常创建 conda   create -n name 
方案一:断网创建  
conda create -n name  --offline  
方案二:复制base 环境  
conda create -n name  --clone base
conda create -n B --clone D:\A 带路径
2.进入环境conda activate name
3.报错处理:conda activate激活虚拟环境时报错:
Your shell has not been properly configured to use ‘conda activate‘.
的解决方法
source activate 
conda deactivate
4.删除虚拟环境
删除环境 conda remove -n name --all

安装中的报错解决方法:
报错1:
CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.
To initialize your shell, run
解决:source activate
conda deactivate
报错2:
OSError: libmkl_intel_lp64.so: cannot open shared object file: No such file
先打开当前用户环境变量配置文件bashrc
gedit ./.bashrc
最后加入:
export LD_LIBRARY_PATH=/home/用户名/anaconda3/lib:$LD_LIBRARY_PATH
source ./.bashrc

报错3:
ModuleNotFoundError: No module named 'typing_extensions'
直接:pip install typing_extensions

报错4:
RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB
说明GPU被占用;也有可能GPU不够用了,带不起来模型。

----------------------------------------------以上记录三天的安装历程----------------------------------------

感谢csdn众多大佬的blog 使得我终于安装成功
 

你可能感兴趣的:(五,pytorch,linux,python)