生成代理:人类行为的交互模拟(Generative Agents: Interactive Simulacra of Human Behavior)

Generative Agents: Interactive Simulacra of Human Behavior

简介

论文是斯坦福大学和deepmind团队联合发表,主要介绍了一种利用LLM模型指导生成Agents代理的方法,让代理具有记忆、反思和规划的能力。
结合LLM模型创造了一个系统架构,架构可以用自然语言的方式记忆agents的历史经验,合成记忆生成更加高阶的反思,并且用反思和记忆去计划行动。
举例说明,实验中让一个用户想举办一个情人节派对,agents自动的进行了传播,并且认识了新的朋友,邀请朋友参加派对,并且准时出现在了排队现场。
这篇论文介绍了一个新的架构和交互模式能够可信任的人类模拟行为。
创新点:用纯文本的方式记录用户的历史行为,结合大模型的prompt能力让agents具备了反思和规划的能力。

智能体交互架构

  1. GA接受目前的环境和过去的经验作为输入,然后生成行为作为输出。

记忆和检索模块

挑战:因为GA的历史行为太多,全部放入LLM进行推理不太现实。


分为了几个模型部分,记忆和记忆检索模块,记忆用可理解的文本方式进行记录,包括自然语言描述和时间戳。

反思模块

挑战:智能体只有原始的观察记忆,很难进行推理和归纳。例如问Klaus,如果你选一个人共处一个小时,你会选谁,如果用原始记忆的话,他会选择接触次数更多的Wolfgang,而不是有共同兴趣和研究方向的Maria。

方法:通过反思归纳的方法,让智能体具有了更高阶的反思记忆,从而可以让用户选择兴趣更相近的Maria。反思是智能体借助LLM模型定期自动进行反思。

规划和行动

挑战:虽然利用LLM模型会生成看似合理的行动,但会花费大量时间和生成错误,例如多次吃午饭。
方法:利用语言模型生成记忆规划,采用从上到下并且递归的方式,生成更多的细节。
首先用智能体的总结描述和前些天的额历史行为,生成一个初始化的计划。然后回生成一个一天行动草图。保存行动计划到记忆中,然后进行递归生成更多的细节。先生成小时级别的,然后生成分钟级别的。
行动并且更新计划,智能体先采取行动,观察周围环境,然后将环境信息记录到记忆流中。
如果行动发生在智能体之间的交互,生成会话。

沙盒环境设置

将环境用文本的方式表示,用树状结构表示位置和物品之间的归属关系,利用LLM模型的理解能力,来进行场景的理解。

传播涌现能力


通过向一个智能体下达开情人节派对的信息后,模型和他遇到的用户进行了信息传播,并且进行了二级的信息传播,最终部分收到信息的用户准时参加了派对,说明了智能体具备了一定的信息理解、记忆、规划、行动的能力。

总结

论文介绍了一种方法来进行智能体的生成,让智能体和环境具备了交互和沟通的能力,并且具备了社交行动的涌现现象。
创新点是完全用文本和结构化文本的方式记录智能体所处的环境,以及记录智能体的历史行为信息。让智能体结合大语言模型的能力,具备了记忆、反思和行动规划的能力。

你可能感兴趣的:(LLM,GA)