使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈

前言

最近有本地部署深度学习模型的需求,故采购了新电脑,以往都是在云端已经搭建好的环境下操作,还从来没有本地从零搭建,所以来总结一下昨天搭建时碰到的障碍和一些经验分享。注:本文不提供具体教程,因为写同类文章的太多了,需要可以点击这里。另,本文预装torch版本为1.9,明面上支持的cuda版本为10.2,但实际上最新的CUDA11.5也一样能用,所以啥都装最新的就完事了。别信啥特定版本匹配兼容什么的,问就装最新。

拿到新电脑,我该做什么?

我的第一步:找到英伟达控制面板和体验中心(安装最新显卡驱动)
一般来说,英伟达控制面板,即NVIDIA控制面板,在右下角设置里右键是可以找到的,而GeForce Experience是多数游戏电脑会预装,正经电脑不会预装这个,但它用来更新显卡驱动很方便。
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第1张图片
然后点开面板可能会报第一个错误:NVIDIA显示设置不可用:您当前未使用连接到NVIDIA GPU 的显示器。这个错误在台式电脑上就是线插错了,没有把线接到独立显卡上。在拆开机箱重新插线后,此错误解决。
然后可以像大多数教程里所说的查看显卡驱动信息和帮助里的系统信息。一般来说,都是出厂设置的旧驱动,没有什么价值,因为我们只要装最新的就行了。下面是已经更新完毕之后的图。
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第2张图片
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第3张图片
接下来就要安装最新的显卡驱动,一种方式,是你直接上官网根据型号自己选择下载(不推荐,除非你是硬件大佬),另一种方式,就是下载上文中提到的
geforce experience
(直接百度搜索进官网下载)来自动检测显卡最新驱动下载。
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第4张图片
总之打开是这样,在驱动程序里,会显示最新的驱动,选择快速安装就完事了。

我的第二步,该下载的其他东西一口气下载完
先把所有东西下好是个好习惯,既然我们显卡驱动是最新的,那么cuda和cudnn我们也要下载最新的,还是进官网下载(想要把出错率降到最低,首选官网,拒绝无良网盘过气版本整理)。下载完是这样的:
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第5张图片
可能有人说官网好慢进都进不去怎么下载,我只能说我公司网都能5M/s速度下载,实在不行你就上那个软件对吧,就像我下载列的第一个软件(它有官网直接百度搜索名字),懂得都懂,记得节点选择美国西部。

python环境的部署,我还是选择了anaconda,并在安装的时候把添加到环境变量(add to path)勾上,一键安装真省事。

torch的下载,既然要用gpu,就千万别pip install torch==1.9.0这样下载了,需要pip install xxxxxxxxxx.whl,具体版本直接搜索torch gpu。如果你不幸下载了cpu版本的torch,你会发现torch.cuda.is_available()导出的值为False,torch.version.cuda的值为None。

我的第三步,按部就班的安装。

顺序为cuda---->cudnn—>验证安装是否完毕—>安装anaconda—>命令行安装torch的pip wheel–>验证torch能否识别显卡。

cuda的安装直接一路点到底就完事了,有VS会给你安装VS的相关组件,没VS的不会给你安装,不用自定义自己安装。

cudnn的安装需要细化一下,cudnn本质是cuda的扩展组件,所以只要把它的内容复制进cuda目录就行了,问题在于怎么复制,网上讲的云里雾里说法不一,其实很简单,复制进对应文件夹就行,如下:
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第6张图片
cudnn解压出来有三个文件夹,bin和include直接复制进:
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第7张图片
lib里面的lib文件复制进cuda的lib下的x64文件夹:
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第8张图片
验证:
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第9张图片

使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第10张图片具体命令如果图里看不清可以看前言中的链接里写的自己打进去(记得切换到特定目录),或者网上搜索,总之挺多的就不细讲了。
装完cuda之后就是装anaconda,然后装torch,装完后再次验证:
torch.cuda.is_available()
torch.cuda.device_count()
torch.cuda.current_device()
torch.cuda.get_device_capability(device)
torch.cuda.get_device_name(device)
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈_第11张图片
我这里的device识别为0,即0为独立显卡,名称为Quadro RTX 4000。这些命令都能正常出结果就代表大功告成了。其实仔细点的话安装最多一个下午搞定,还是挺简单的。

你可能感兴趣的:(Python,机器学习,python,pytorch,cuda,cudnn)