OpenAI正式推出了全新的o1-preview系列,专注于解决复杂问题

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

OpenAI正式推出了全新的o1-preview系列,专注于解决复杂问题,并于9月12日开始提供。新模型在科学、编程和数学领域表现出色,能够应对比以往更难的任务。

这一系列的AI模型经过特别训练,在回答问题前会花更多时间进行思考。它们可以像人类一样,推理复杂任务并解决难题。这次的发布仅是预览版,未来会不断推出更新和改进。同时,正在开发中的下一个版本也在进行评估。

这些模型的工作原理类似于人类解决问题的思维方式,通过训练,它们学会优化思考过程,尝试不同的策略,并能认识到自己的错误。在测试中,下一版本的模型在物理、化学和生物等高难度基准任务中的表现类似于博士生。在国际数学奥林匹克(IMO)的模拟考试中,GPT-4o仅解决了13%的问题,而这个新模型的得分达到了83%。在编程能力的评估中,新模型在Codeforces竞赛中达到了89%的水平。详细信息可在技术研究报告中查看。

虽然这个早期模型暂时没有像ChatGPT一样的功能,比如浏览网页或上传文件和图片,但在复杂推理任务方面,这无疑是AI能力的一次重大飞跃。因此,OpenAI将这一系列重新命名为o1,并将计数器重置为1。

在安全方面,OpenAI采用了新的安全训练方法,利用这些模型的推理能力,使其更加遵守安全和对齐准则。通过推理安全规则,它们能够更有效地应用这些规定。在一个严苛的绕过安全测试中,GPT-4o的得分仅为22(满分100),而o1-preview模型的得分达到了84。详细信息可在系统卡片和研究报告中阅读。

为匹配新模型的能力,OpenAI加强了安全工作,包括与联邦政府的合作,采用了最佳的红队测试和董事会级别的审查流程。此外,OpenAI还与美国和英国的AI安全研究所签订了正式协议,并为这些机构提供了研究版模型的早期访问权限,以便为未来模型的研究、评估和测试建立流程。

这些新模型的推理能力对于解决科学、编程、数学等领域的复杂问题尤为有用。例如,o1可以帮助医疗研究人员注释细胞测序数据,帮助物理学家生成量子光学所需的复杂数学公式,并为各领域的开发者构建和执行多步骤工作流程。

你可能感兴趣的:(人工智能,语言模型,自然语言处理,chatgpt)