热点研究 | OpenAI 重磅发布 Agents SDK,人人都能手搓 Manus?

3月12日,OpenAI正式发布了 OpenAI Agents SDK这一重要发布不仅为开发者提供了强大的工具,更预示着 AI Agent 技术即将进入快速发展期这些工具为开发者提供更强大功能,使代理能够独立执行复杂任务,如搜索网络、处理文件和自动化计算机操作。Responses API 同步发布,为开发者提供了构建自定义 AI Agent 的能力,能够执行网络搜索、文件检索等任务。

这套新工具和 API 旨在赋能开发者,创建能够应对复杂、多步骤任务的 AI Agents。从检索网络上的实时信息到与遗留系统交互,这些工具承诺弥合差距并解锁新的可能性。

热点研究 | OpenAI 重磅发布 Agents SDK,人人都能手搓 Manus?_第1张图片

这对你意味着什么?无论你是技术爱好者、企业家,还是对 AI 未来感到好奇的人,这些更新都暗示着一个未来:技术为我们工作,而不是相反

什么是 AI Agents?

AI Agents 是旨在代表用户执行任务的自主系统,如前段时间火热的 Manus、OpenManus、OWL等。与主要专注于回答问题的传统 AI 模型不同,AI Agents 能够执行操作、做出决策并与现实世界系统交互

这些 Agents 可以帮助完成各种任务,例如进行研究、管理日程、自动化工作流,甚至与过时系统对接。例如,AI Agents 可以帮助组织日程、检索特定信息或处理重复任务,让你专注于更具战略性和创造性的工作。通过利用这些能力,AI Agents 正成为个人和职业使用中不可或缺的工具。

增强 AI Agent 开发的关键工具

OpenAI 的最新工具解决了 AI 开发中的几个关键挑战,包括检索信息、自动化任务和与多样化系统集成。这些工具旨在增强 AI Agents 的功能和多功能性,使其在现实应用中更加有效。一些突出的新增功能包括:

1. Web Search Tool

该工具使 AI Agents 能够从互联网访问最新的真实信息。通过使用微调的 GPT-4o 模型,它确保搜索结果的准确性和相关性,特别适用于研究、决策和内容生成任务。

调用示例:

const response = await openai.responses.create({    model: "gpt-4o",    tools: [ { type: "web_search_preview" } ],    input: "What was a positive news story that happened today?",});
console.log(response.output_text);

性能方面,GPT-4o 和 GPT-4o mini 的搜索能力表现出色,特别是在 SimpleQA 基准测试中,该测试评估大型语言模型(LLMs)在回答简短、事实性问题时的准确性。

热点研究 | OpenAI 重磅发布 Agents SDK,人人都能手搓 Manus?_第2张图片

2. File Search Tool

专为私有文档搜索设计,该工具支持元数据过滤和直接搜索端点。对于检索增强生成(RAG)等工作流尤其有价值,在这些工作流中,精确的数据检索对于生成准确且与上下文相关的输出至关重要。

调用示例:

const productDocs = await openai.vectorStores.create({    name: "Product Documentation",    file_ids: [file1.id, file2.id, file3.id],});
const response = await openai.responses.create({    model: "gpt-4o-mini",    tools: [{        type: "file_search",        vector_store_ids: [productDocs.id],    }],    input: "What is deep research by OpenAI?",});
console.log(response.output_text);

3. Computer Use Tool

该工具允许 AI Agents 与缺乏现代 API 的虚拟机和遗留系统交互。通过计算机使用模型自动化任务,它增强了兼容性并简化了涉及旧技术的工作流,弥合了现代 AI 系统与过时基础设施之间的差距。

调用示例:

const response = await openai.responses.create({    model: "computer-use-preview",    tools: [{        type: "computer_use_preview",        display_width: 1024,        display_height: 768,        environment: "browser",    }],    truncation: "auto",    input: "I'm looking for a new camera. Help me find the best one.",});
console.log(response.output);

这些工具共同使开发者能够创建不仅更智能,而且更能适应多样化环境和用例的 AI Agents。

Responses API:复杂工作流的通用解决方案

新推出的 Responses API 是 OpenAI 工具包中的重要补充,提供了增强的功能以管理复杂的工作流。该 API 支持多模态输入、多工具调用和多轮交互,非常适合需要动态和交互式响应的应用。与现有的 Chat Completions API 完全向后兼容,Responses API 确保了与现有系统的无缝集成,同时引入了处理复杂任务的先进功能。

热点研究 | OpenAI 重磅发布 Agents SDK,人人都能手搓 Manus?_第3张图片

该 API 特别适用于虚拟助手、客户支持系统和其他需要实时、上下文感知交互的应用。通过允许 AI Agents 处理和响应多样化输入,Responses API 增强了其自主高效执行任务的能力。

从 Swarm 到 OpenAI-Agents

OpenAI 还对其 Agents SDK 进行了重大升级,将其从实验性的 Swarm SDK 转变为健壮的生产就绪框架。这一开源工具包简化了多个 AI Agents 的编排,并引入了多项增强其可用性和功能的先进特性:

  • 多供应商支持: 该功能支持跨不同平台的互操作性,使开发者能够将 AI Agents 与各种系统和工具集成。

  • 自动 JSON 模式生成: SDK 可以从 Python 函数自动生成 JSON 模式,简化了数据结构和管理的流程。

  • 内置监控和防护: 这些功能通过提供跟踪、监控和实施防止错误或滥用的防护措施,确保了可靠性和性能。

目前,Agents SDK 仅支持 Python,但很快将扩展到 JavaScript,提高其可访问性,并允许创建更多样化的 AI 驱动应用。

代码示例:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail
@function_tooldef submit_refund_request(item_id: str, reason: str):    # Your refund logic goes here    return "success"
support_agent = Agent(    name="Support & Returns",    instructions="您是一位可以提交退款申请的客服人员 [...]",    tools=[submit_refund_request],)
shopping_agent = Agent(    name="Shopping Assistant",    instructions="您是一位可以搜索网络的购物助手 [...]",    tools=[WebSearchTool()],)
triage_agent = Agent(    name="Triage Agent",    instructions="将用户引导到正确的Agent。",    handoffs=[shopping_agent, support_agent],)
output = Runner.run_sync(    starting_agent=triage_agent,    input="目前为止,我的穿搭最适合搭配什么鞋子?",)

未来展望

OpenAI 为其 AI 工具和 API 的未来制定了一个雄心勃勃的路线图。虽然 Chat Completions API 将继续得到支持,但新推出的 Responses API 预计将逐步取代 Assistance API,后者计划在 2026 年前淘汰。OpenAI 还计划引入更先进的模型和工具,进一步扩展 AI Agents 的能力。

OpenAI 将 2025 年视为 AI Agents 开发和采用的关键一年旨在将 AI 的重点从仅仅回答问题转向执行现实世界任务,赋能开发者创建不仅智能而且以行动为导向的系统。


内容来源:IF 实验室

图源:https://github.com/openai/openai-agents-python & https://openai.com/index/new-tools-for-building-agents/

你可能感兴趣的:(技术面,php,开发语言,manus,openai,agent)