深度学习跑代码的时候,因为简单的操作不适合cpu运行,我们更习惯用GPU加速代码。
本章将介绍怎么安装pytorch的gpu环境,以及常见的问题
关于conda的安装,参考之前文章:深度学习环境配置:Anaconda 安装和 pip 源
pytorch官网提供的安装:链接:https://pytorch.org/
这里提供的版本都是较新的,电脑的硬件跟不上的话,可以选择之前版本的
网上有很多,这里介绍自己使用的
需要注意的,只有英伟达的显卡支持gpu加速,英特尔的不行
鼠标右键有NVIDIA 控制面板这个选项,就代表电脑有英伟达的显卡(window11 右键可能被隐藏了,点开显示更多选项展开即可)
可能配置不同,打开的界面不一样,没关系,继续操作就行了
点开 NVIDIA控制面板
点这
点开后,再点击这里:点击组件
如下:
说明电脑支持的最大cuda版本是12.0,安装小于等于这个版本的都可以
这里不建议选择最新的,选择之前的稳定一点,这里展示的是10.2版本
在conda新建好环境后,并且激活,利用pip安装即可
换成pip安装,将3删除就行了
等待下载完成即可:
首先还是要激活环境啊,如果你跟着本章来的话,已经在环境里面了就不需要激活
首先进入python环境,导入torch,然后输入torch.cuda.is_available()
当出现True的时候,那么恭喜你,gpu的配置成功了!!!!
这里建议在虚拟环境中,使用pip安装,实在安装不来,再用conda
尽量不要来回混肴使用!!
显卡问题,
这里之前在跑别人项目的时候,总会出现这个问题,当然没人解答,大部分人都说环境坏了,在新建一个就行了....
首先重点是,跑新的项目,一定要新建虚拟环境,这样才不会造成破坏,俗称环境污染?
那么新建好了虚拟环境,我辛辛苦苦看cuda版本,又去官网扒了好久历史版本才安装好的gpu环境。怎么能保证我随便pip install -r requirement就能保证gpu可以运行?
下面是自己的一些理解:
需要知道是,cuda和torch版本是两个概念。例如cuda的11版本,对应torch好多个小版本
torch版本无非有两种,相对于电脑的硬件来说,要么高了,要么低了
低了的才好,因为硬件是向下兼容的,就是说你cuda是11版本的。你跑的项目torch只要低于11版本,那么随便怎么安装requirement文件,都能保证gpu运行。对于大部分成熟的项目来说,torch版本都不会太高,因为越高越不稳定,开发者也不希望别人复现代码的时候一直报红。
第二种就是高了,高了的话,电脑肯定不支持cuda运行了。当然也不是不能解决
需要明白的是,不是开发者非要炫耀自己硬件好,才选择高的版本。有些功能在高的torch版本才有,例如混合精度计算,对于深度学习来说已经很常见了,好像torch1.10版本才支持,这种是没办法的。
如果真的高了,建议新建好环境的时候,看看torch的版本,如果和低版本的torch适应的话,在自身配置符合的情况下可以低几个小版本也没事。大不了在requirement文件把torch删除了就行了,咱们自己配置torch
当然,肯定有人不知道低多少合适。举个例子,你电脑的cuda是11版本的,别人项目需要12版本的cuda。看他torch的对应版本,往下降一点,不就是电脑可以支持的11版本了吗。要是还不知道,安装自身电脑最高的torch版本,然后跑一遍看看报不报错就行了
要是真的是配置跟不上,那真没办法了,搞深度学习还是需要钞能力...