Linux服务器中Pytorch训练过程可视化之tensorBoard安装使用教程

也是我的一个备注,防止以后忘了怎么使用

  1. 首先就是安装tensorBoard
pip install tensorboard

或者使用清华镜像更快一些

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorboard	 
  1. 导入刚刚安装的包
from torch.utils.tensorboard import SummaryWriter   

这里的SummaryWriter的作用就是,将数据以特定的格式存储到刚刚提到的那个文件夹中。

首先我们将其实例化,这里需要自己创建一个地址,我需要调用tensorBoard的是train.py文件,所以在它的同级目录下创建了“path/to/logging”文件。
因此实例化时,就在train.py中这样写

writer = SummaryWriter('./path/to/logging')
  1. 这里传入的参数就是指向文件夹的路径,之后我们使用这个writer对象“拿出来”的任何数据都保存在这个路径之下。

这个对象包含多个方法,比如针对数值,我们可以调用

writer.add_scalar(tag, scalar_value, global_step=None, walltime=None)

这里的tag指定可视化时这个变量的名字,scalar_value是你要存的值,global_step可以理解为x轴坐标。

举一个简单的例子:

for epoch in range(100)
    mAP = eval(model)
    writer.add_scalar('mAP', mAP, epoch)

这样就会生成一个x轴跨度为100的折线图,y轴坐标代表着每一个epoch的mAP。这个折线图会保存在你刚刚指定的路径下(但是现在还看不到)

同理,除了数值,我们可能还会想看到模型训练过程中的图像。

 writer.add_image(tag, img_tensor, global_step=None, walltime=None, dataformats='CHW')
 writer.add_images(tag, img_tensor, global_step=None, walltime=None, dataformats='NCHW')

4.在完成所有的训练epoch之后,进行可视化
在代码运行窗口中输入

tensorboard --logdir="./path/to/logging" --bind_all

在这里插入图片描述

运行结果为:
Linux服务器中Pytorch训练过程可视化之tensorBoard安装使用教程_第1张图片

最后,在本地windows的浏览器中输入:

你的服务器地址:6006

比如我的服务器是10.1.11.123
则使用:

10.1.11.123:6006

最终结果图:
Linux服务器中Pytorch训练过程可视化之tensorBoard安装使用教程_第2张图片

补充:
1.变量归类
命名变量的时候可以使用形如

writer.add_scalar('loss/loss1', loss1, epoch)
writer.add_scalar('loss/loss2', loss2, epoch)
writer.add_scalar('loss/loss3', loss3, epoch)

的格式,这样3个loss就会被显示在同一个section。

2.同时显示多个折线图
假如使用了两种学习率去训练同一个网络,想要比较它们训练过程中的loss曲线,只需要将两个日志文件夹放到同一目录下,并在命令行运行

你的服务器地址:6006

你可能感兴趣的:(pytorch,服务器,python)