AI Agent：当年年都是爆发元年时

随着人工智能技术的不断进步，AI Agent的概念已经成为业界的热点。尽管许多公司推出了所谓的“Agent产品”，但这些产品往往只具备基本的自然语言理解能力，远未达到真正的Agent水平。从海外市场来看，科技巨头们无疑是这场角逐中的主力军。OpenAI、Anthropic、微软、谷歌等企业凭借深厚的技术积累与强大的研发实力，争先展示各自在 AI Agent 领域的阶段性成果，将其视为彰显企业竞争力的关键要素。以 Anthropic 为例，在 10 月推出了名为 “Computer Use” 的 AI Agent 系统，该系统具备独特的功能特性，通过特定 API 的设计，开发者能够借助其向 Claude 下达指令，实现诸如屏幕内容监测、鼠标操控、按钮点击以及文本输入等一系列计算机操作任务，进而达成任务自动化流程，极大提升工作效率，这一创新实践为 AI Agent 在人机交互层面的应用开辟了新路径。

同期，微软也在大力推进 AI Agent 的落地应用，尤其聚焦于企业级服务领域。10 月所公布的一项重要计划中，明确提出面向 Dynamics 365 业务应用平台开发并部署10款AI Agent，精准定位企业销售、会计以及客户服务等核心业务环节，旨在通过智能化手段赋能企业运营，优化业务流程，提升整体效能。

谷歌虽在前期反应稍显滞后，但在年末发力追赶，于 12 月正式发布全新多模态大模型 Gemini 2.0。依托这一前沿模型架构，谷歌顺势推出三款内置 AI Agent，其中“编程助手” Jules 表现尤为突出。它能够深度嵌入 GitHub 的工作流程系统，凭借自身卓越的代码分析能力，跨越多个代码文件进行问题排查与修复，并自动生成详细的拉取请求，有效减少人工干预，提升软件开发效率。

OpenAI 作为基础模型领域的领军者，在 AI Agent 布局上初期进展相对平缓。不过据消息称，OpenAI 计划于2025年推出全新 AI Agent——Operator，该系统预期将具备强大的任务执行能力，涵盖代码编写、旅行预订、电商购物自动化等复杂操作场景，且有望在已有类似系统如 “Computer Use” 的基础上进行深度优化与创新拓展，进一步拓宽 AI Agent 的应用边界与适用范围。而在1月7日的CES 2025上，英伟达CEO黄仁勋的演讲再一次让AI Agent站到科技发展的潮头浪尖。他表示，AI Agent可能是下一个机器人行业，蕴含着价值数万亿美元的机会。以下为相关演讲内容（有删节）：企业界正在发生最重要的事情之一是Agentic AI。Agentic AI是测试时间缩放的一个完美的例子。AI是一个模型系统，要与用户互动。有些是理解能力，有些是从存储器中检索信息，建立语义AI系统。也许它正在上网，正在研究pdf文件，所以它可能正在使用计算器等工具，也可能正在使用生成式AI来生成图表等。AI接受你提出的问题，逐步分解，并通过所有这些不同的模型进行迭代，以便将来回复客户，以便AI做出回应。你提出一个问题，一大堆模型将在后台工作。为了帮助行业构建真正的AI，我们的上市并不是直接面向企业客户。我们走向市场的方式是与IT生态系统中的软件开发人员合作，整合我们的技术以实现新的功能。就像我们对CUDA库所做的那样，我们现在想用AI库来做这件事。如同过去的计算模型有处理计算机图形、线性代数或未来流体动力学的api一样，在这些加速库的基础上，代码加速库将有AI库。

我们创造了三件事来帮助生态系统构建Agentic AI。英伟达的Nims本质上是AI微服务，全部打包起来。这需要所有这些非常复杂的CUDA软件CDA，DNN切割列表，张量rtlm或Triton，或所有这些不同的非常复杂的软件。以及模型本身，我们将其打包优化，放入容器中。你可以把它带到你喜欢的地方。接下来，巨大的AI服务期是软件编码，全球有3000万软件工程师。每个人都会有一个软件助手帮助他们编码。如果没有，那就会降低生产力，创造出更少的好代码。人工智能代理可能是下一个机器人产业，可能会创造一个价值数万亿美元的机会。

当每年AI Agent都要被拿出来炒一炒时，大家对此的观望中就带了些许玩味。而未来AI Agent将会走向何方，我们也将拭目以待。

AI Agent：当年年都是爆发元年时

你可能感兴趣的:(人工智能算法)