Win11 + WSL2 + cuda + TensorFlow的深度学习开发环境的搭建 并连接mac

前言

前段时间升级了windows台式机,由于双系统实在过于麻烦,而且现在wsl2已经很成熟了, 可以带来比较好的windows上的开发体验, 但是在环境准备过程中还是有不少坑的, 更具网上的资料和官方文档整理一下, 该文档仅代表win11的环境,win10是否适用不清楚

系统环境

  • 硬件
    • 12th Gen Intel(R) Core(TM) i7-12700KF
    • 32G 3600
    • RTX3070ti
  • 系统
    • Windows11 21H2
    • WSL2
    • Ubuntu2004

WSL2 Install

  1. 开启Windows功能: 系统设置 -> 应用 -> 可选功能 -> 最下边的 「更多 Windows 功能」 -> 找到并勾选 「Hyper-V」和「适用于 Linux 的 Windows 子系统」-> 点击确定
# 命令行开启虚拟化(如果下面安装过程中报错的话)
bcdedit /set hypervisorlaunchtype auto

WRAN: 重启电脑

image.png
  1. 配置和安装wsl2和ubuntu
# Wran: 以管理员身份运行terminal
# 1. 设置版本为wsl2
wsl --set-default-version 2
# 更新wsl
wsl --update
# 查看可安装的Linux版本
wsl --list online
# 安装Ubuntu20.04
wsl --install -d Ubuntu-20.04
  1. 安装完成后会自动启动Ubuntu, 然后按照提示配置基本信息

Cuda Install

首先在windows上去官网下载并安装(更新)显卡驱动

windows上显卡驱动安装成功以后wsl2下的ubuntu可以使用nvidia-smi查看gpu的运行状态(以管理员启动terminal)

image.png

安装Cuda

我测试的时候官方文档推荐的方式是使用cuda-toolkit安装11.4版本, 但是我发现和tensorflow还存在兼容性问题, 所以我选择使用官方安装包安装11.2版本的cuda(后面会接受toolkit的方式)

方法1. 官方cuda包安装

# 下载官方cuda安装程序
wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run

# 执行安装程序安装cuda(根据提示操作)
sudo sh cuda_11.2.0_460.27.04_linux.run

方法2. cuda-toolkit安装

sudo dpkg -i cuda*ubuntu*_amd64.deb
sudo dpkg -i cuda*-cross-aarch64*_all.deb
sudo apt-get update
sudo apt-get install cuda-toolkit-x-x -y
sudo apt-get install cuda-cross-aarch64* -y

添加环境变量

vim ~/.bashrc

# cuda
export CUDA_HOME="/usr/local/cuda-11.2"
export PATH="${CUDA_HOME}/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH"

source ~/.bashrc

安装CUDnn

首先去官网下载对应版本的包https://developer.nvidia.com/rdp/cudnn-archive(如果没有nv账号的需要先注册账号)

# 扔到ubuntu上(我选择的是 cudnn-11.2-linux-x64-v8.1.1.33.tgz)
# 解压
tar tar zxvf ./cudnn-11.2-linux-x64-v8.1.1.33.tgz 

# 移动
sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.2/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64
sudo chmod a+r /usr/local/cuda-11.2/include/cudnn*.h 
sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*

安装TensorFlow

注意: tensoflow的版本对于cuda和cudnn的版本, 可以去官网查询https://www.tensorflow.org/install/source#gpu
(tensorflow1.0的版本是分gpu和cpu两种的, 而2.0以后就不分了)

# TensorFlow 2
pip3 install tensorflow==2.6.0

# TensorFlow 1需要单独制定gpu的版本, 不过官网显示1.0的版本不兼容python3.8和当前版本的cuda所以我没有做测试

测试GPU的连接

import tensorflow as tf

print(tf.test.is_built_with_gpu_support())
print(tf.config.list_physical_devices())


# terminal output
root@iMac:~/susur/PythonProject# python3 -u "/root/susur/PythonProject/tf_test.py"
True
2022-04-18 13:46:52.440924: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:923] could not open file to read NUMA node: /sys/bus/pci/devices/0000:01:00.0/numa_node
Your kernel may have been built without NUMA support.
2022-04-18 13:46:52.464878: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:923] could not open file to read NUMA node: /sys/bus/pci/devices/0000:01:00.0/numa_node
Your kernel may have been built without NUMA support.
2022-04-18 13:46:52.465102: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:923] could not open file to read NUMA node: /sys/bus/pci/devices/0000:01:00.0/numa_node
Your kernel may have been built without NUMA support.
[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'), PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

这个ould not open file to read NUMA node:...的警告是wsl的通病, 官方的解释是无害警告, 可以正常运行;

VSCode on WSL

  1. 安装插件: Remote - WSL
image.png
  1. 登入wsl (就可以使用vscode on wsl 开发代码了)


    image.png

Mac ssh登入Wsl2

windows上开发和调试还是不习惯所以我尝试了一下Mac远程连接wsl的方式, 感觉下来还是挺好用的

除了完成传统linux环境下ssh的配置以外, 还需要注意几点

  1. wsl2可以和windows本机共享一个ip, 而wsl2默认的ssh 端口为23, 也就是说其ssh-host为${you-windows-ip}:23, (这里要注意的是, wsl2上的端口要避免和windows上产生冲突);
  2. 虽然是共享ip,但是外界并不能直接访问wsl2, 需要配置端口映射才能访问;
  3. 需要在防火墙开发端口的访问权限;

防火墙开发端口

Windows安全中心 -> 防火墙和网络保护 -> 高级设置


image.png
image.png

配置开放端口


image.png
image.png
image.png

设置端口映射

# option prot proxy
netsh interface portproxy add v4tov4 listenport=23 listenaddress=0.0.0.0 connectport=23 connectaddress=localhost
# show port proxy
netsh interface portproxy show all


侦听 ipv4:                 连接到 ipv4:

地址            端口        地址            端口
--------------- ----------  --------------- ----------
0.0.0.0         23          localhost       23

然后设置完其他常规的ssh配置以后mac上就可以正常使用ssh连接wsl2了

image.png

VSCode on Wsl for Mac

在mac端的vscode上安装插件: Remote-ssh

然后在~/.ssh/config文件中配置ssh连接信息就可以了

# my windows wsl2
Host Wsl2
  HostName 192.168.31.100
  User root
  Port 23
image.png

你可能感兴趣的:(Win11 + WSL2 + cuda + TensorFlow的深度学习开发环境的搭建 并连接mac)