GPU使用问题总结

先记录一些已经遇到的问题,后续会持续补充

 

1. 服务器上, 命令窗 gpustat -i,实时查看动态,如果显卡占用一百多,而且程序跑的很慢,要看下是不是程序没有正确使用GPU

之前遇到过这种情况,运行代码输出框会显示,无法正常使用GPU,或者说当前使用CPU

有一次的问题是这个报错,ImportError: libcudnn.so.5: cannot open shared object file: No such file or directory

这个问题原因是cudnn安装有问题,查看cudnn对应的lib包是否在相关目录下,以及bashrc配置是否正确,具体可详见  环境配置(七)——Linux cuda配置

2. 不同python包对应不同 tensorflow版本,有的tensorflow版本不能安装

这种问题对于很多python包都有的,一种解决方法是从网上搜一下是否有对应的whl,一种方法是从网上找源码,直接pip install

3. DL可视化界面

可以参考 深度学习——可视化界面(一) tensorboard,通过可视化界面,对相关参数,如学习率,dropout值,epoch个数,batchsize大小等进行设置

 

 

 

你可能感兴趣的:(深度学习,#,环境配置,深度学习,GPU)