人工智能Agent,有朝一日如何取代工人

广泛使用的聊天机器人 ChatGPT 旨在生成数字文本,从诗歌到学期论文再到计算机程序,应有尽有。但是,当计算机芯片公司英伟达(Nvidia)的人工智能研究人员团队掌握了聊天机器人的底层技术时,他们意识到它可以做更多的事情。

几周之内,他们就教它玩Minecraft,这是世界上最受欢迎的视频游戏之一。在《我的世界》的数字宇宙中,它学会了游泳、采集植物、猎猪、开采黄金和建造房屋。

“它可以进入Minecraft世界,自己探索,自己收集材料,在各种技能上越来越好,”英伟达高级研究科学家林希·范(Linxi Fan)说,他被称为吉姆。

该项目是一个早期迹象,表明世界领先的人工智能研究人员正在将聊天机器人转变为一种称为人工智能代理的新型自主系统。这些代理可以做的不仅仅是聊天。他们可以使用软件应用程序、网站和其他在线工具,包括电子表格、在线日历、旅游网站等。

许多研究人员表示,随着时间的推移,人工智能代理可能会变得更加复杂,并可能取代办公室工作人员,使几乎所有白领工作自动化。

“这是一个巨大的商业机会,可能高达数万亿美元,”不列颠哥伦比亚大学计算机科学教授杰夫·克鲁恩(Jeff Clune)说,他之前曾在旧金山初创公司OpenAI担任研究员,该公司开发了ChatGPT。“这对社会有巨大的好处和巨大的后果。

英伟达的经纪人在玩游戏。类似的座席可以安排会议、编辑文件、分析数据和构建多彩条形图。这个想法是,这些自动化系统最终将充当个人助理,能够处理互联网上的各种任务。

今天的代理人是有限的,他们不能完全组织你的生活。ChatGPT 可以在旅游网站 Expedia 上搜索飞往纽约的航班,但您仍然需要自行预订。

随着研究人员的改进,这项技术可以使办公室工作人员和消费者更有效率。它还可能改变视频游戏的性质,提供新一波的机器人,游戏玩家可以与之一起玩和聊天。

GPT-4 是支撑 ChatGPT 的技术,研究人员称之为大型语言模型。它是一个人工智能系统,通过分析大量数据来学习技能。

在过去的几个月里,该技术以其生成电子邮件、撰写演讲和即兴演奏的方式让数亿人惊叹不已。但它最重要的技能可能是它编写计算机程序的诀窍。

它可以立即生成一个程序,绘制独角兽或在您的笔记本电脑屏幕上投下数字雪花。专业软件开发人员可以要求提供代码,他们可以将其折叠到更大的程序中,包括从社交媒体应用程序到搜索引擎的所有内容。但这只是这项技术可以做的一部分。它还可以生成计算机代码,以利用其他软件应用程序和网站。

范博士和其他英伟达研究人员就是这样教 GPT-4 玩 Minecraft(我的世界)的。“这里最重要的词是代码,”范博士说。“代码可以采取行动。”

人们通过触摸按钮、菜单和其他图形小部件来使用软件应用程序和网站。人工智能代理通过访问其应用程序编程接口(或 A.P.I.)来使用应用程序和网站,API 是允许他们与其他在线服务进行通信的底层软件代码。

例如,如果你要求代理将视频上传到互联网,它可能会生成调用YouTube提供的API的代码。“API只是用来与机器对话的文本,”帮助运行独立人工智能代理项目AutoGPT的研究员Silen Naihin说。

从理论上讲,聊天机器人可以编写代码来访问互联网上的任何API。但今天的聊天机器人还不够熟练,无法完成简单的任务。即使他们是,让他们在互联网上自由漫游也将是一个巨大的安全风险。因此,公司从小规模起步。

在 OpenAI 推出 ChatGPT 几个月后,它悄悄地发布了一种让聊天机器人做更多事情的方法,而不仅仅是生成文本。在安装了各种插件(增强机器人功能的软件)后,你可以让它在Expedia等旅游网站上搜索可用的航班,从谷歌地球获取你家乡的地图,甚至将详细说明你每年支出的电子表格转换为彩色条形图。

ChatGPT 配备了一个名为代码解释器的插件,不仅可以编写代码,还可以运行代码。这使得该技术能够立即执行过去无法执行的任务,包括编辑电子表格和将静止图像转换为视频。谷歌、Microsoft和其他公司正在探索类似的技术。

“在这些项目中,我们设想的基本上是人工智能代表你与其他人工智能合作,”Microsoft副总裁阿什利·洛伦斯(Ashley Llorens)说。

像AutoGPT这样的独立项目正试图将这种事情向前推进几步。这个想法是给系统设定目标,比如“创建公司”或“赚钱”。然后,它将通过向自己提出问题并连接到其他互联网服务来寻找实现这一目标的方法。

今天,这并不那么有效。像 AutoGPT 这样的系统往往会陷入无休止的循环中。但像范博士这样的研究人员正在不断完善这种技术,以使其更有用、更可靠。

其他研究人员正在构建一种新型的人工智能代理,旨在使用软件工具。2022 年夏天,Clune 博士是 OpenAI 研究人员团队的一员,他们构建了一个代理,可以像人一样使用计算机软件——鼠标点击一次,击键一次。

其他公司,包括一家名为Adept的初创公司,正在建立类似的代理,使用Wikipedia,Redfin和Craigslist等网站以及Salesforce等公司的流行办公应用程序。

你可能感兴趣的:(人工智能,chatgpt)