11 学习、教育和更多
人工智能的进步为加速科学发现、推动创新和解决各个领域的复杂问题提供了巨大的希望。然而,要充分利用人工智能为科学研究带来的潜力,我们需要面对教育、人才培养和公众参与方面的新挑战。在本节中,我们首先收集了关于每个人工智能和科学领域基础知识的现有资源。接下来,我们确定了三个主要的范式转变,包括学科界限、社区和教育资源。最后,我们指出了最近的进展,并呼吁未来采取行动,建立我们的新知识和社区系统,以支持不断发展的人工智能为科学领域。
11.1 基础人工智能和科学的现有资源
作者:Yuanqi Du、Yaochen Xie、Xiner Li、Shurui Gui、Tianfan Fu、Jimeng Sun、Xiaofeng Qian、Shuiwang Ji
在不断发展的人工智能和科学领域中,传统的学习材料,如书籍和课程,长期以来一直是知识获取的基础。会议,特别是在人工智能和每个科学社区内举行的会议,一直是促进合作和分享开创性研究的传统媒介。在本节中,我们在表34和表36中列出了不同类型的现有资源,涵盖了人工智能和科学各个单独领域的基础知识。具体来说,最具代表性的资源类型是为计算目的而开发的书籍、课程和库。
11.2 人工智能为科学领域的范式转变
作者:Yuanqi Du、Yaochen Xie、Xiner Li、Shurui Gui、Tianfan Fu、Jimeng Sun、Xiaofeng Qian、Shuiwang Ji
尽管已经积累了各个人工智能和科学领域的资源,但人工智能为科学领域这一新兴领域仍然面临着重大的范式转变。特定于人工智能为科学的教育资源类型、社区层面和知识收集方法仍然是分散的,需要进行整合和进一步发展。在本节中,我们确定了三个主要的范式转变。
超越学科界限:人工智能为科学领域的知识体系应该超越学科界限,促进跨学科合作,以解决多方面的挑战和机会(图40)。打破科学学科之间的传统壁垒,有助于全面理解复杂问题,并鼓励创新解决方案的产生。整合来自物理学、生物学、化学和人工智能等领域的多元视角,扩展了知识广度,促进了思想的跨界交流。人工智能和科学之间的这种共生关系不仅允许共同解决问题的方法,还能促进人工智能研究和开发的原则性进展。通过利用科学原理、方法和跨学科技术,可以取得科学发现的突破,解决人工智能为科学领域的紧迫挑战。已有的例子已经展示了集成人工智能和科学的力量,比如用物理定律解释神经网络[Sorscher et al. 2022; Di Giovanni et al. 2023],设计具有动力系统、控制和最优传输的生成模型[Song et al. 2020; Xu et al. 2022a; Liu et al. 2022a; Berner et al. 2022],解决蛋白质结构预测等重大挑战[Jumper et al. 2021],等等。这种合作方法将为科学发现的突破铺平道路,并使我们能够解决人工智能为科学领域中最紧迫的挑战。
图40:传统科学领域已经认识到跨学科合作的力量,导致新领域的出现。同样地,人工智能和科学的交叉领域承诺开辟新的领域,因为这两个领域结合了各自的优势,共同应对人工智能和科学领域的挑战。请注意,还有许多科学领域和跨领域重叠,无法在此图中说明。
培养多元化和灵活性的社区:人工智能为科学社区推崇多样性和灵活性,超越了人工智能和科学的界限,包括学生、研究人员和对推动该领域感兴趣的从业者。虽然像NeurIPS和ACS会议这样的传统活动展示了人工智能和科学研究的前沿,但越来越多人认识到需要超越这些已建立的平台。例如,化学期刊中与人工智能相关的文章数量大幅增加,ACS Omega从2020年到2021年增长了133% [Imberti 2022]。出现了一些旨在促进人工智能和科学社区对话和合作的倡议,如人工智能为科学研讨会和研讨会(表35)。这些活动从地方性聚会到全球会议不等,促进了产业和研究机构之间的合作(图41)。通过拥抱多样性,社区培养了创造力、批判性思维和非传统问题解决能力,充分利用了来自不同背景的个人的专业知识和见解。这种合作环境推动了人工智能为科学的进展。
丰富的教育格局:人工智能为科学领域的教育资源正在超越以往的水平。随着人工智能继续改革科学领域,对人工智能为科学领域高质量教育资源的需求迅速增长。为满足这一需求,许多机构和个人提供了各种教育资源,包括暑期学校、博客、教程、论文阅读小组等(表35)。这些资源涵盖了广泛的主题,从人工智能的基本概念到科学领域的高级技术。此外,学术界与产业界的合作通过提供现实世界的应用和案例研究丰富了教育格局。然而,尽管扩展教育资源所做的值得称赞的努力,但在建立学习人工智能为科学的系统方法方面仍然存在挑战。方法论进步的快速步伐和领域的跨学科性质在策划全面课程方面构成了障碍。为了解决这个问题,有必要优先发展结构化的教育计划,涵盖人工智能为科学的广度和深度。这些计划应该提供对基本概念、高级方法论以及它们在科学领域的应用的全面理解。
图41:在人工智能和科学领域,存在着一个充满活力的全球社区,包括来自不同背景的研究人员、专家和爱好者。这个全球网络还得到了包括大学、研究机构和产业合作伙伴在内的地方社区的补充。通过协同努力和合作,这些社区构成了一个强大的生态系统,推动了创新、知识交流和在本地和全球范围内的变革性发现。
11.3 展望和提出的行动
作者:Yuanqi Du、Yaochen Xie、Xiner Li、Shurui Gui、Tianfan Fu、Jimeng Sun、Xiaofeng Qian、Shuiwang Ji
近年来,已经取得了重大进展,开发了人工智能为科学领域的资源(表35和表36)。然而,这些资源通常独立运作,缺乏一种有凝聚力和系统性的路线图。随着该领域经历范式转变,开发统一的路线图和资源以填补缺失的空白变得至关重要。通过认识到全面教育材料、协作社区平台和有效的知识收集方法的需求,我们可以更好地为研究人员、从业者和学生提供在人工智能为科学领域不断发展的格局中导航所需的工具和见解。在这些基础上,鼓励个人为人工智能为科学领域的子领域贡献自己的专业知识。正是通过集体努力,我们才能充分发挥人工智能为科学领域的潜力。
表34. 基础人工智能或科学领域的学习资源(开源表示代码是公开可用的,并允许进一步开发)。请注意,这个表格远远不是完整的,只包含了一小部分可用资源。
表35. 人工智能为科学的学习资源。请注意,这个表格远远不是完整的,只包含了作者常用的资源。
表36. 推荐的基础人工智能、科学和人工智能为科学领域的书籍。请注意,这个表格远远不是完整的,只包含了作者常用的资源。
12 结论
深度学习的进展已经彻底改革了许多人工智能(AI)领域。最近,深度学习开始通过改进、加速和促进我们对自然现象的理解来推动自然科学的发展,从而催生了一个新的研究领域,即人工智能为科学。从我们的角度和许多其他人的角度来看,人工智能为科学为科学发现的新范式打开了一扇大门,代表了跨学科研究和创新中最令人兴奋的领域之一。一般来说,一些科学过程是用可能太复杂以至于难以求解的方程来描述的,而其他科学过程则是通过(昂贵的)实验获得的可观测数据来理解的。人工智能的使命是准确高效地解决这些科学问题,以及众多其他参数,如AI模型中的对称性、可解释性、超出分布的泛化和因果关系、不确定性量化等。在本文中,我们提供了对人工智能为科学领域的若干研究领域的技术和统一审查,这些研究领域是研究人员在过去几年中一直在进行的。我们通过模拟物理世界的时空尺度来组织人工智能为科学的不同领域。在每个领域中,我们提供了明确定义的问题设置,并讨论了使用人工智能解决此类问题的关键挑战。然后,我们提供了已经开发的主要方法的综述,以及用于评估的数据集和基准。我们进一步总结了尚未解决的挑战,并指出了每个领域的若干未来方向。特别是,由于人工智能为科学是一个新兴的研究领域,我们在本文中编制了分类的资源列表,以促进学习和教育。我们理解,考虑到这个领域不断发展的性质,我们的工作远非全面或最终。因此,我们期望在这个领域不断发展的同时,不断包含更多的主题,并欢迎社区提供任何反馈和意见。