1、
训练命令
python main.py ctdet --exp_id pascal_dla_384 --dataset pascal --num_epochs 70 --lr_step 45,60
即,以 pascal 数据集为例,dla34为基础框架运行
2、
对论文CenterNet:Objects as Points的代码进行了阅读,在此记录一下,有纰漏的地方,希望大家能够指出,一起探讨。
3、
最好用pycharm等软件调试阅读,跳到哪查看哪一块。
这里附上 简单的调试教程 和 对ubuntu下使用命令行运行的代码如何在pycharm中运行调试 的链接
# – coding:utf-8 –
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import _init_paths
import os
import torch
import torch.utils.data
from opts import opts
from models.model import create_model, load_model, save_model
from models.data_parallel import DataParallel
from logger import Logger
from datasets.dataset_factory import get_dataset
from trains.train_factory import train_factory
def main(opt):
torch.manual_seed(opt.seed)
#benchmark = True 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题
torch.backends.cudnn.benchmark = not opt.not_cuda_benchmark and not opt.test
# get_dataset函数返回的是一个类,所以 Dataset是一个类的实例对象,用来获取训练特定任务模型需要数据。
#Dataset继承类PascalVOC和CTDetDataset.
#Dataset是一个类的实例对象,实例化的时候只是初始化类,即,只执行__init__函数,以后用到那个函数,调用该实例对象即可。
Dataset = get_dataset(opt.dataset, opt.task)#get_dataset
# 升级数据集信息并设置模型输出heads层。比如我们需要bounding box识别任务, 我们就需要设置三个输出hm, wh, reg.
opt = opts().update_dataset_info_and_set_heads(opt, Dataset)
print(opt)
logger = Logger(opt)
os.environ['CUDA_VISIBLE_DEVICES'] = opt.gpus_str
opt.device = torch.device('cuda' if opt.gpus[0] >= 0 else 'cpu')
print('Creating model...')
#model是DLASeg类的一个实例化对象,实例化的时候只是初始化类,即,只执行__init__函数,以后用到那个函数,调用该实例对象即可。
model = create_model(opt.arch, opt.heads, opt.head_conv)
optimizer = torch.optim.Adam(model.parameters(), opt.lr)
start_epoch = 0
if opt.load_model != '':
model, optimizer, start_epoch = load_model(
model, opt.load_model, optimizer, opt.resume, opt.lr, opt.lr_step)
Trainer = train_factory[opt.task]#结果Trainer是一个类
#trainer是Trainer类的一个实例化对象
trainer = Trainer(opt, model, optimizer)#构建损失函数(loss),再结合opt, model, optimizer构建训练结构。
trainer.set_device(opt.gpus, opt.chunk_sizes, opt.device)
print('Setting up data...')
#验证数据集加载器
val_loader = torch.utils.data.DataLoader(
Dataset(opt, 'val'), #Dataset是PascalVOC类的实例化对象
batch_size=1,
shuffle=False,
num_workers=1,
pin_memory=True
)
if opt.test:
_, preds = trainer.val(0, val_loader)
val_loader.dataset.run_eval(preds, opt.save_dir)
return
# 训练数据集加载器;train_loader是torch.utils.data.DataLoader类的实例化对象,且train_loader中的Dataset继承类PascalVOC和CTDetDataset.
train_loader = torch.utils.data.DataLoader(
Dataset(opt, 'train'), #Dataset是PascalVOC类的实例化对象
batch_size=opt.batch_size,
shuffle=True,
num_workers=opt.num_workers,
pin_memory=True,
drop_last=True
)
print('Starting training...')
best = 1e10
for epoch in range(start_epoch + 1, opt.num_epochs + 1):
mark = epoch if opt.save_all else 'last'
log_dict_train, _ = trainer.train(epoch, train_loader)
logger.write('epoch: {} |'.format(epoch))
for k, v in log_dict_train.items():
logger.scalar_summary('train_{}'.format(k), v, epoch)
logger.write('{} {:8f} | '.format(k, v))
if opt.val_intervals > 0 and epoch % opt.val_intervals == 0:
save_model(os.path.join(opt.save_dir, 'model_{}.pth'.format(mark)),
epoch, model, optimizer)
with torch.no_grad():
log_dict_val, preds = trainer.val(epoch, val_loader)
for k, v in log_dict_val.items():
logger.scalar_summary('val_{}'.format(k), v, epoch)
logger.write('{} {:8f} | '.format(k, v))
if log_dict_val[opt.metric] < best:
best = log_dict_val[opt.metric]
save_model(os.path.join(opt.save_dir, 'model_best.pth'),
epoch, model)
else:
save_model(os.path.join(opt.save_dir, 'model_last.pth'),
epoch, model, optimizer)
logger.write('\n')
if epoch in opt.lr_step:
save_model(os.path.join(opt.save_dir, 'model_{}.pth'.format(epoch)),
epoch, model, optimizer)
lr = opt.lr * (0.1 ** (opt.lr_step.index(epoch) + 1))
print('Drop LR to', lr)
for param_group in optimizer.param_groups:
param_group['lr'] = lr
logger.close()
if __name__ == '__main__':
opt = opts().parse()
main(opt)