代码:
if args.local_rank in [-1, 0] and eval_dataset is not None and args.eval_steps > 0 and global_step % args.eval_steps == 0 :
metric_cur = eval_fn(args, eval_dataset, model, tokenizer, global_step=global_step, file_prefix="eval_")
当参数args.eval_steps的值>0且global_step % args.eval_steps == 0的时候,执行eval_fn方法,
在使用启智平台新建训练任务的时候,
设置参数eval_steps 本来应该是-1.
结果自己没仔细看给设置成1了,导致陷入死循环(QAQ),跑了一晚上还没出结果,我说日志里面咋一直执行evalation验证操作,都执行好几百次了…
注意:使用启智平台填运行参数的时候一定要注意参数的数值,有没有负号。