在使用1.14版本的tensorflow-gpu训练之前写的同版本cpu的程序时出现“0 successful operations. 0 derived errors ignored.”的错误信息,具体的提示情况如下图:
我的程序环境配置是:
win11系统
显卡型号:RTX3060
tensorflow-gpu 1.140
cuda 10.0
cudnn 7.4
这个配置可以跑一些网络上的其它神经网络程序,所以可以排除:
1、tensorflow安装错误的情况
本次运行失败的程序在之前的cpu版本上可以完美运行(因为是相关学习课程的课后作业答案),所以可以排除:
2、程序本身存在的问题
上述两点十分重要,很多错误情况都是由这两种原因引起的。
****在cpu版本能运行,在gpu上就出现了问题。因此这个问题是因为程序没有调用gpu设备(这里我也不太懂原理,就是不断的尝试和修改,最后成功了)。
在运行程序的py文件上加入对于特定使用gpu设备的指定语句。
import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" #实现卡号匹配
os.environ["CUDA_VISIBLE_DEVICES"] = "0"