AI Agent:当年年都是爆发元年时

随着人工智能技术的不断进步,AI Agent的概念已经成为业界的热点。尽管许多公司推出了所谓的“Agent产品”,但这些产品往往只具备基本的自然语言理解能力,远未达到真正的Agent水平。 从海外市场来看,科技巨头们无疑是这场角逐中的主力军。OpenAI、Anthropic、微软、谷歌等企业凭借深厚的技术积累与强大的研发实力,争先展示各自在 AI Agent 领域的阶段性成果,将其视为彰显企业竞争力的关键要素。以 Anthropic 为例,在 10 月推出了名为 “Computer Use” 的 AI Agent 系统,该系统具备独特的功能特性,通过特定 API 的设计,开发者能够借助其向 Claude 下达指令,实现诸如屏幕内容监测、鼠标操控、按钮点击以及文本输入等一系列计算机操作任务,进而达成任务自动化流程,极大提升工作效率,这一创新实践为 AI Agent 在人机交互层面的应用开辟了新路径。

同期,微软也在大力推进 AI Agent 的落地应用,尤其聚焦于企业级服务领域。10 月所公布的一项重要计划中,明确提出面向 Dynamics 365 业务应用平台开发并部署10款AI Agent,精准定位企业销售、会计以及客户服务等核心业务环节,旨在通过智能化手段赋能企业运营,优化业务流程,提升整体效能。
AI Agent:当年年都是爆发元年时_第1张图片

 谷歌虽在前期反应稍显滞后,但在年末发力追赶,于 12 月正式发布全新多模态大模型 Gemini 2.0。依托这一前沿模型架构,谷歌顺势推出三款内置 AI Agent,其中“编程助手” Jules 表现尤为突出。它能够深度嵌入 GitHub 的工作流程系统,凭借自身卓越的代码分析能力,跨越多个代码文件进行问题排查与修复,并自动生成详细的拉取请求,有效减少人工干预,提升软件开发效率。
AI Agent:当年年都是爆发元年时_第2张图片

 OpenAI 作为基础模型领域的领军者,在 AI Agent 布局上初期进展相对平缓。不过据消息称,OpenAI 计划于2025年推出全新 AI Agent——Operator,该系统预期将具备强大的任务执行能力,涵盖代码编写、旅行预订、电商购物自动化等复杂操作场景,且有望在已有类似系统如 “Computer Use” 的基础上进行深度优化与创新拓展,进一步拓宽 AI Agent 的应用边界与适用范围。 而在1月7日的CES 2025上,英伟达CEO黄仁勋的演讲再一次让AI Agent站到科技发展的潮头浪尖。他表示,AI Agent可能是下一个机器人行业,蕴含着价值数万亿美元的机会。以下为相关演讲内容(有删节): 企业界正在发生最重要的事情之一是Agentic AI。Agentic AI是测试时间缩放的一个完美的例子。AI是一个模型系统,要与用户互动。有些是理解能力,有些是从存储器中检索信息,建立语义AI系统。也许它正在上网,正在研究pdf文件,所以它可能正在使用计算器等工具,也可能正在使用生成式AI来生成图表等。AI接受你提出的问题,逐步分解,并通过所有这些不同的模型进行迭代,以便将来回复客户,以便AI做出回应。你提出一个问题,一大堆模型将在后台工作。为了帮助行业构建真正的AI,我们的上市并不是直接面向企业客户。我们走向市场的方式是与IT生态系统中的软件开发人员合作,整合我们的技术以实现新的功能。就像我们对CUDA库所做的那样,我们现在想用AI库来做这件事。如同过去的计算模型有处理计算机图形、线性代数或未来流体动力学的api一样,在这些加速库的基础上,代码加速库将有AI库。
AI Agent:当年年都是爆发元年时_第3张图片

 我们创造了三件事来帮助生态系统构建Agentic AI。英伟达的Nims本质上是AI微服务,全部打包起来。这需要所有这些非常复杂的CUDA软件CDA,DNN切割列表,张量rtlm或Triton,或所有这些不同的非常复杂的软件。以及模型本身,我们将其打包优化,放入容器中。你可以把它带到你喜欢的地方。接下来,巨大的AI服务期是软件编码,全球有3000万软件工程师。每个人都会有一个软件助手帮助他们编码。如果没有,那就会降低生产力,创造出更少的好代码。人工智能代理可能是下一个机器人产业,可能会创造一个价值数万亿美元的机会。

当每年AI Agent都要被拿出来炒一炒时,大家对此的观望中就带了些许玩味。而未来AI Agent将会走向何方,我们也将拭目以待。

你可能感兴趣的:(人工智能算法)