2020年6月,微软公布了Windows Subsystem for Linux 2的最新更新,全面支持CUDA和N卡GPU。在Windows上跑Ubuntu子系统并在其中运行GPU加速的深度学习代码成为现实,开发者终于不用特意为了熟悉的Linux环境而在自己的开发机上安装Windows与Ubuntu的双系统(以及Windows10之后繁琐的boot manager调试设置过程),同时又可以让Windows和Ubuntu共享同一个文件系统。
笔者新买了Workstation,在各种尝试安装Windows和Ubuntu双系统还是安装Windows的Ubuntu子系统两个选择中游走踩坑之后,终于成功在Windows 10中安装了最新的WSL2、Ubuntu系统及NVIDIA Driver,成功在Windows的Ubuntu子系统中运行深度学习代码,GPU资源全部跑满!
首先要确保电脑的BIOS选项中,Virtualization虚拟化功能是打开的。
BIOS设置好之后,我们需要在Windows中安装微软在2020年6月17日最新开放的Windows Insider Build。我们要首先注册为Windows Insider,加入Windows的Dev Channel,然后更新Windows为build 20150或者以上。
未来微软将WSL 2变为稳定版以后,我们只需要输入下面的命令来设置WSL 2:
wsl --install
现在WSL2的功能还是测试版,我们需要用管理员权限打开PowerShell。
首先设置WSL 1:
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
然后设置WSL 2:
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
重启Windows 10:
Restart-Computer
之后WSL 2成为默认之后下面的步骤就可以省略,不过现在我们还需要打开PowerShell将WSL 2设置为默认选项:
wsl.exe --set-default-version 2
在微软商店中安装Ubuntu:
在微软商店中安装Windows Terminal。Windows Terminal的主要好处是未来可以在同一个窗口中一键打开多个PowerShell和Ubuntu Terminal的tab,非常方便。
在Windows开始菜单中打开Ubuntu,第一次打开需要设置Ubuntu系统的用户名和密码,这个账户是和Windows账户分开的。
设置完毕后关掉原先的窗口,然后打开Windows Terminal,在下拉菜单中选择Ubuntu开启一个新的Ubuntu Terminal。
下面这一步很关键,我们要检查确认我们运行的是正确的WSL 2 Linux内核。在Ubuntu中输入:
uname -r
内核版本一定是 4.19.121 或更高。如果不是的话先在Windows的PowerShell中试下:
wsl.exe --update
如果还是不行,检查一下Windows升级设定中”Receive updates for other Microsoft products when you update Windows”这个选项是打开的:
然后再检查一下Windows更新,看看有没有最新的Windows Subsystem for Linux Update。
针对不同显卡安装相应的驱动。
未来Nvidia的驱动会自动集成在Windows Update中,但现在支持WSL2的Nvidia驱动还是开发者测试版,用户需要加入Nvidia Developer Program来获取最新驱动的下载权限。
在Ubuntu Terminal中:
sudo apt -y install docker.io
设置版本的变量,导入Nvidia库的GPG Key,把Nvidia的repo加入到Ubuntu的apt安装源中。在Ubuntu Terminal中:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
curl -s -L https://nvidia.github.io/libnvidia-container/experimental/$distribution/libnvidia-container-experimental.list | sudo tee /etc/apt/sources.list.d/libnvidia-container-experimental.list
更新Ubuntu的apt安装源然后安装Nvidia运行环境:
sudo apt update && sudo apt install -y nvidia-docker2
关闭所有的Ubuntu terminal,打开PowerShell terminal,手动关闭掉Ubuntu内核:
wsl.exe --shutdown Ubuntu
打开一个新的Ubuntu terminal并开启Docker:
sudo dockerd
在另一个新的Ubuntu terminal中运行:
sudo docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark
如果一切设置没问题的话,输出应该和下面的类似:
在另一个新的Ubuntu terminal中运行:
docker run -u $(id -u):$(id -g) -it --gpus all -p 8888:8888 tensorflow/tensorflow:latest-gpu-py3-jupyter
一切正常的话,Terminal最后会给出一个带token的jupter notebook地址。将其复制并在浏览器中打开,我们就成功开启了一个GPU加速的运行Tensorflow的Jupyter notebook:
现在我们就可以在这个Windows的Ubuntu子系统环境中编写、测试和运行支持CUDA的Tensorflow了!