使用gpu运算卷积网络时报错Failed to get convolution algorithm. This is probably because cuDNN....

在我们完成tensorflow-gpu配置后,我们希望使用其做一些实践,例如我希望可以使用它来加快之前跑起来极慢的facenet人脸识别实践。
配置参数:
cpu:E5-2697 v3
gpu:RTX 2080 TI
内存:64G
数据量:55万张
python:3.7
tensorflow:1.13.1
当我使用--gpu_memory_fraction 0.9控制gpu内存使用率为90%时报错Failed to get convolution algorithm. This is probably because cuDNN failed to initialize.
经过不断地踩坑总结以下几种方法解决这一问题:
(1) 降低tensorflow-gpu版本(不推荐,会导致后期一系列问题,解决起来比较费心神)
(2) 针对ipython可是使用restart kernel实现(不推荐,因为不一定成功)
(3) 减小gpu内存使用率,例如将命令改为--gpu_memory_fraction 0.5(亲测有效,但可能只是针对我的情况)

2019年9月29补充
通过较长时间的实践表明造成这个错误的原因还可能是cuda版本问题,如果出问题的是10.1版本建议卸载后安装10.0即可解决。

你可能感兴趣的:(使用gpu运算卷积网络时报错Failed to get convolution algorithm. This is probably because cuDNN....)