读懂AI Agent:基于大模型的人工智能代理

本文原创作者:姚瑞南 AI-agent 大模型运营专家,先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。(转载需经授权)      

目录

⼀、背景介绍

⼆、Agent概述

三、工作原理


⼀、背景介绍

⼤语⾔模型的浪潮推动了AIAgent相关研究快速发展,AIAgent是当前通往AGI的主要探索路线。⼤ 模型庞⼤的训练数据集中包含了⼤量人类行为数据,为模拟人类的交互打下了坚实基础;另⼀⽅⾯, 随着模型规模不断增大,大模型涌现出了上下⽂学习能力、推理能力、思维链等类似⼈类思考方式的多种能力。将大模型作为AIAgent的核⼼⼤脑,就可以实现以往难以实现的将复杂问题拆解成可实现 的子任务、人类的自然语言交互等能力。由于大模型仍存在⼤量的问题如幻觉、上下⽂容量限制等, 通过让大模型借助⼀个或多个Agent的能力,构建成为具备自主思考决策和执⾏能力的智能体,成为 了当前通往AGI的主要研究⽅向。

⼆、Agent概述

Agent是能够自主感知环境并采取⾏动实现⽬标的智能体。基于LLM的Agent,将⼤语⾔模型作为核心计算引擎,实现感知(Perception)、规划(Planning)、行动(Action),形成自主闭环的学习过 程。

• 感知:理解你的指令,收集信息并从中提取相关知识的能⼒

• 规划:思考、拆分,总结感知到的信息,为达成⽬标⽽做出决策的过程

• 执⾏:依赖大模型执行,调用API或与其他Agent交互

• 记忆:将整个过程(思维链条)保存起来,循环迭代

三、工作原理

AI Agent智能体以大模型为技术底座,是⼤模型与记忆、行动、规划、⼯具的“1+4”有机组合。

读懂AI Agent:基于大模型的人工智能代理_第1张图片 

  • 充分借助⼤语⾔模型能⼒,实现精准的意图理解、语⾔翻译、⼈机交互。
  • 具备长短期记忆能⼒,能够记忆常识、记录用户行为习惯、回溯先前经验、制定策略并做出决策。 具备任务规划能力,能够组织思维、设定目标、逻辑推理,并分解任务实现步骤。
  • 具备工具应用能力,能够以⼯具插拔的形式获取实时信息、增强专业知识,充分借助工具完备自身能⼒以应对复杂的交互环境。
  • 具备行动能力,能够基于环境变化实时形成反馈,动态⽣成、维护和调整行为序列,以及开展观察、操纵和导航等具身行动。

实在Agent智能体是基于“TARS(基于通⽤⼤模型基座的⾃研垂直系列⼤模型)+ISSUT(智能屏幕语 义理解技术)”双模引擎,有“大脑”,更有“眼睛和⼿脚”的超自动化智能体。同时,也是能够⾃ 主拆解任务、感知当前环境、执⾏并且反馈、记忆历史经验的RPA全新模式。

 

你可能感兴趣的:(AI行业产品调研,AI行业资讯,大模型落地探索及agent搭建,人工智能,机器人,自然语言处理,AIGC,chatgpt,AI作画)