使用tensorboard调试模型

概述

截至目前, tensorboard还是神经网络开发调试中比较好的工具, 各大框架厂商都有直接支持或间接借鉴.

以下描述使用方法.

1利用summary记录要显示的信息

1.1 添加要记录的各种类型的变量

scalar/histogram......

tf.summary.histogram('logits', logits)
tf.summary.scalar('loss', loss)
......

1.2打包变量名

merged = tf.summary.merge_all()

 

1.3添加内存和时间要素

# Define metadata variable and RunOptions
run_options = tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE)
run_metadata = tf.RunMetadata()

 

1.4 打开一个记录器

Open a writer to write summaries.

writer = tf.summary.FileWriter(FLAGS.log_dir, session.graph)

1.5训练

feed_dict根据具体任务定义

for step in num_steps:
  ...
  _, summary, loss_val = session.run(
      [optimizer, merged, loss],
      feed_dict=feed_dict,
      options=run_options, 
      run_metadata=run_metadata)
   ...

1.5训练过程中write summaries to writer

# Add returned summaries to writer in each step.
writer.add_run_metadata(run_metadata, 'step%d' % step)
writer.add_summary(summary, step)

1.6训练结束关闭writer

writer.close()

 

 

2显示观察信息

随便打开一个终端,执行如下指令:

tensorboard --logdir 生成checkpoints所在的路径

出现如下连接:

TensorBoard 1.5.1 at http://主机名:6006 (Press CTRL+C to quit)

复制ip地址,在浏览器中打开.

使用tensorboard调试模型_第1张图片

如果提示找不到event文件,请确认:

1) 在路径下文件是否已经生成,没有生成需要等一会儿

2) 路径是否正确,可以pwd指令获取绝对路径再试一下

3)如果系统有多个浏览器,请使用默认浏览器

 

 

 

你可能感兴趣的:(tensorboard)