最近跑一个知识图谱的程序,按照论文作者的说明,执行以下命令训练模型:
CUDA_VISIBLE_DEVICES=0 python trainer.py
然而,出现了以下报错:
于是啪的一下,很快啊,立马上Google和百度找解决方案,结果发现,居然没一个有效回答。
但这个问题看样子,确实是困扰了挺多人,光下面这个网页浏览量就达到了3.6K。
于是就只能自己动手丰衣足食了~
想到模型训练一般都是在Linux服务器上跑,而我在win10上测试,会不会是环境的问题?
于是把模型部署到了实验室Ubuntu18.04的服务器上,果然跑通了。
因为第0号显卡被师兄拿来跑程序了,这里我把GPU改成了第1张
CUDA_VISIBLE_DEVICES=1 python trainer.py
这说明这条命令在Linux上是没问题的,只是在windows上不适用。
那么,要用个人PC在windows上运行咋办呢?
其实这条命令的含义很简单,也就是指定某个GPU来运行程序,我们可以在程序开头添加指定GPU的代码,效果是一样的:
import os
os.environ["CUDA_VISIBLE_DEVICES"]='0'
或者在程序外部cmd命令行里执行以下命令,设置临时变量:
set CUDA_VISIBLE_DEVICES=0
由于我的工作机上只插了一张显卡,于是我直接把它设置成了环境变量:
然后在windows上运行 python trainer.py 即可。
(以前遇到问题总是上Google和百度白嫖解决方案,依赖万能网友们,这次花了十分钟写了个自己的解决方案,总算是为互联网贡献了自己的微小贡献了~)