在写一些很小的机器学习项目的时候,我们往往希望training, testing和inference能共用一个入口main,但是不同的功能使用不同的input参数.当然如果三个功能对应三个.py脚本问题也不大,但是毕竟觉得不太优雅.这个时候就需要考虑如何让代码更加简单有条理.
主要是最近在看parser有关的东西,所以看到了一个项目,里面的使用subparser的地方是值得借鉴的,下面附上代码和部分自己的一些见解
def main():
parser = argparse.ArgumentParser()
subparsers = parser.add_subparsers()
hparams = make_hparams()
# 这个函数是直接写了一些超参数,讲真我不太喜欢这个操作,个人还是比较倾向用一个额外的config文件来存储
# 这些超参,这样输入的只要是config文件的路径即可;主要是这么做可以看到自己每一步的参数是怎么设置的
# 便于后期出现了问题来排错
subparser = subparsers.add_parser("train")
# add subparser here
subparser.set_defaults(callback=lambda args: run_train(args, hparams))
# 加上callback选项,run_train是前期定义的一个函数,这条和后面的args.callback(args)对应
hparams.populate_arguments(subparser)
# 这里就是作者自己定义的一个函数,本质其实还是一系列的add_argument
subparser.add_argument("--numpy-seed", type=int)
subparser.add_argument("--model-path-base", required=True)
subparser.add_argument("--evalb-dir", default="EVALB/")
subparser.add_argument("--train-path", default="data/02-21.10way.clean")
subparser.add_argument("--dev-path", default="data/22.auto.clean")
subparser.add_argument("--batch-size", type=int, default=250)
subparser.add_argument("--subbatch-max-tokens", type=int, default=2000)
subparser.add_argument("--eval-batch-size", type=int, default=100)
subparser.add_argument("--epochs", type=int)
subparser.add_argument("--checks-per-epoch", type=int, default=4)
subparser.add_argument("--print-vocabs", action="store_true")
subparser = subparsers.add_parser("test")
subparser.set_defaults(callback=run_test)
subparser.add_argument("--model-path-base", required=True)
subparser.add_argument("--evalb-dir", default="EVALB/")
subparser.add_argument("--test-path", default="data/23.auto.clean")
subparser.add_argument("--test-path-raw", type=str)
subparser.add_argument("--eval-batch-size", type=int, default=100)
subparser = subparsers.add_parser("ensemble")
subparser.set_defaults(callback=run_ensemble)
subparser.add_argument("--model-path-base", nargs='+', required=True)
subparser.add_argument("--evalb-dir", default="EVALB/")
subparser.add_argument("--test-path", default="data/22.auto.clean")
subparser.add_argument("--eval-batch-size", type=int, default=100)
subparser = subparsers.add_parser("parse")
subparser.set_defaults(callback=run_parse)
subparser.add_argument("--model-path-base", required=True)
subparser.add_argument("--input-path", type=str, required=True)
subparser.add_argument("--output-path", type=str, default="-")
subparser.add_argument("--eval-batch-size", type=int, default=100)
subparser = subparsers.add_parser("viz")
subparser.set_defaults(callback=run_viz)
subparser.add_argument("--model-path-base", required=True)
subparser.add_argument("--evalb-dir", default="EVALB/")
subparser.add_argument("--viz-path", default="data/22.auto.clean")
subparser.add_argument("--eval-batch-size", type=int, default=100)
args = parser.parse_args()
args.callback(args)