GPT-3在化学中进行低数据发现是否足够?

今天介绍一份洛桑联邦理工学院进行的工作,这份工作被发表在化学期刊预印本网站上。

对于这份工作,有兴趣的朋友可以通过我们的国内ChatGPT镜像站进行测试使用,我们的站点并没有针对特定任务进行建设,是通用性质的。

化学领域进行机器学习研究十分的麻烦,化学任务总是无法形成大规模数据集,这对于数据驱动主导的机器学习算法并不友好。除此之外,每项化学任务都需要结合大量的特殊的专业知识。这篇文章尝试用GPT来进行传统化学领域的机器学习任务,他们的实验发现,GPT在化学领域的AI任务中具有巨大的潜能。

大语言模型可以在不经过二次训练的情况下,很好的处理相关的自然语言任务。而大部分的化学问题,可以使用文本形式表示,因此,评估GPT在化学领域的潜能是十分必要的。下面这个图片,展示了这份工作对GPT进行评估的具体任务:

GPT-3在化学中进行低数据发现是否足够?_第1张图片

首先,这些测试任务基于三个数据集,如左图datasets所示,分别是分子,材料和反应。在这些数据集之上,研究人员进行了三项任务的能力评估:分类任务,回归任务,以及逆向设计。

文章中的一个测试用例是:

What is the phase of ?

<高熵合金的组成>是什么相?

关于这个任务,研究人员仅通过50条数据,就取得了其他科研人员基于1000条数据的成果。

GPT-3在化学中进行低数据发现是否足够?_第2张图片

这里给出GPT和其他相关基准模型的比较,GPT可以在低数据量下取得很好的效果。

你可能感兴趣的:(gpt-3)