问题来源:博主在训练模型时,显存溢出;所以改小了batchsize,继续训练了10多个小时,Windows系统直接蓝屏重启了。现在在测试模型时发现报错:显示说没有可用的GPU
RuntimeError: No CUDA GPUs are available
当即测试了
torch.cuda.is_available()
显示为:false
然后
torch.cuda.device_count()
显示为:0
说明检测不到我的显卡
用软件查看独显nvidia geforce gtx 3060 显卡内存 1MB,当时一脸问号;到这里,我以为是驱动的问题,或者更严重就是显卡坏掉了。所以测试了一下nvidia-smi 和 nvcc -V (注意是大写的V)
图片如下:
由此感觉不是驱动的问题,在电脑设备管理器的显示适配器中发现电脑在蓝屏之后把我的nvidia驱动给了。------(devmgmt.msc)
启动之后,就一切正常了
Sun Apr 17 18:41:10 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 511.65 Driver Version: 511.65 CUDA Version: 11.6 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... WDDM | 00000000:01:00.0 Off | N/A |
| N/A 44C P0 24W / N/A | 0MiB / 6144MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
torch.cuda.is_available()
Out[4]: True
torch.cuda.device_count()
Out[5]: 1
一场乌龙,在csdn中寻找帮助时发现很少有windows系统cuda问题的博客,所以把自己的错误记录下来,希望可以帮助到大家。