win10系统,使用tensorflow2.0对CIFAR10数据集训练问题总结

使用tensorflow2.0对CIFAR10数据集训练总结

最近在GitHub上找到一个利用tf2跑cifar10数据集跑模型的资源(连接),在跑模型阶段遇到了许多的问题,现在进行一下总结

一、ImportError: Failed to import pydot. You must install pydot and graphviz for pydotprint to work.

缺少pydot和graphviz库
由于 pydot已经停止开发(python3.5、3.6、3.7已经无法使用)选择下载pydotplus

解决办法

1、安装pydotplus
pip install pydotplus
2、安装graphviz
pip install graphviz
3、在模块中导入pydotplus
import pydotplus as pydot

二、InvocationException: GraphViz’s executables not found 解决方案

解决方案

1、下载安装GraphViz(这是一个独立软件)

https://graphviz.gitlab.io/_pages/Download/Download_windows.html

2、下载完后解压缩后,复制bin文件夹的路径。将GraphViz安装目录的bin目录放到环境变量的path路径

下载后缀带.msi即可

3、在代码报错模块中加入
import os
os.environ["PATH"]+= os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/'  #注意修改为你的安装路径

三 、ProfilerNotRunningError: Cannot stop profiling. No profiler is running.

解决方案

对train模块中的log_dir路径进行一下包装处理

log_dir=os.path.join('logs')

四 、在运行过程中还有一些细节性的问题需要修改

strategy = tf.distribute.MirroredStrategy(devices=['/gpu:0','/gpu:1', '/gpu:2', '/gpu:3'])

五、对train模块中的callbacks_list中save_best_only改为False

在win10系统下基本上遇到了这些报错,训练结果其实很模糊win10系统,使用tensorflow2.0对CIFAR10数据集训练问题总结_第1张图片

你可能感兴趣的:(tensorflow2.0,CIFAR10)