作为工具制造者的大型语言模型

文章目录

  • 摘要
  • 1、简介
  • 2、相关工作
  • 3、LLM as Tool Maker (LATM)
    • 3.1、制作新工具并重用它们
    • 3.2、用Dispatcher处理流数据
  • 4、实验
    • 4.1、实验设置
    • 4.2、工具制作阶段的有效性
    • 4.3、LATM提高轻量级llm的性能
    • 4.4、将LATM扩展到混合任务的流设置
    • 4.5、消融研究
  • 5、结论和未来工作

摘要

论文链接:https://arxiv.org/abs/2305.17126v1
最近的研究显示了通过使用外部工具来增强大型语言模型(llm)解决问题能力的潜力。然而,沿着这条路线进行的先前工作依赖于现有工具的可用性。在这项工作中,我们通过提出一个闭环框架,即llm作为工具制造商(LATM),迈出了消除这种依赖的第一步,llm在其中创建自己的可重用工具来解决问题。我们的方法由两个关键阶段组成:1)工具制作:LLM充当工具制作者,为给

你可能感兴趣的:(高质量AI论文翻译,语言模型,人工智能,自然语言处理)