使用Visdom监控PyTorch训练进程

最近用上了Facebook开发的远程可视化神器Visdom,特此记录一下。

安装

pip install visdom -i https://pypi.douban.com/simple

使用scatter函数

import visdom

viz = visdom.Visdom()
win = viz.scatter(X=np.asarray([[0,0]]))
pass

for epoch in range(args.start_epoch, args.epochs):

    # train for one epoch
    loss_avg = train(train_loader, model, criterion, optimizer, epoch, args)
    viz.scatter(X=np.array([[epoch,loss_avg]]),
                name="train",
                win=win,
                update="append")

    # evaluate on validation set
    loss_avg = validate(val_loader, model, criterion, args)
    viz.scatter(X=np.array([[epoch,loss_avg]]),
                name='val',
                win=win,
                update='append')
        
    pass
    

scatter有几个参数:
X代表二维或三维中的点的坐标,格式是array或者tensor;
Y代表label ID,从1到k,图像会自动显示不同的颜色;
update如果是append就是添加点,如果是replace就是替换,是remove就删除;
name会指定trace的名字;
win可以指定显示图像的窗口。

演示一下

我在实验室服务器上跑PyTorch,需要ssh登陆到服务器上查看动态(虽然有了progressbar已经感觉自己很帅了):

但如果想看最近验证集的loss,跑程序前就要记得用tee记录日志,把日志cat出来再grep出loss信息…总之非常麻烦。
现在有了visdom,Chrome打开服务器ip,端口8097,直接看图就完事了!嘻嘻。
使用Visdom监控PyTorch训练进程_第1张图片

注1:需要先在服务器上启动visdom server:python -m visdom.server可以放tmux后台一直开着,或者干脆直接用nohup &
注2:如果你不能直接访问服务器ip,可以用ssh开个隧道。终端输入ssh [email protected] -L 127.0.0.1:8888:127.0.0.1:8097然后浏览器打开xxx.xxx.xxx.xxx:8888就行了

你可能感兴趣的:(深度学习,PyTorch)