实验过程中的问题记录

代码:

if args.local_rank in [-1, 0] and eval_dataset is not None and args.eval_steps > 0 and global_step % args.eval_steps == 0 :
     metric_cur = eval_fn(args, eval_dataset, model, tokenizer, global_step=global_step, file_prefix="eval_")

当参数args.eval_steps的值>0且global_step % args.eval_steps == 0的时候,执行eval_fn方法,
在使用启智平台新建训练任务的时候,
设置参数eval_steps 本来应该是-1.
结果自己没仔细看给设置成1了,导致陷入死循环(QAQ),跑了一晚上还没出结果,我说日志里面咋一直执行evalation验证操作,都执行好几百次了…

注意:使用启智平台填运行参数的时候一定要注意参数的数值,有没有负号。

你可能感兴趣的:(问题记录,python)