【论文学习】InstructGPT:Training language models to follow instructions with human feedback
前言:语言模型的输出依赖于预训练的数据集,研究者想要探索无监督领域的模型,使其仅仅依赖无标签的数据就可以实现不错的效果,为了让模型的泛化性能尽可能的强,研究者会提供尽可能大的数据集。但这样的训练方法存在两个问题:一、有效性。模型的性能依赖于训练时使用的文本,但是研究者并不知道无标签的大批量的数据集是否可以使模型学习到解决指定任务的能力,可能对于特定领域来说,模型根本没见过这样的数据;二、安全性,模