原文作者:比尔·盖茨
原文译自:https://www.gatesnotes.com/AI-agents
今天,我仍然像当年我和保罗·艾伦创办微软时一样热爱软件。尽管几十年来软件已经有了很大的进步,但是在很多方面,软件仍然非常笨拙。
要在电脑上完成任何任务,你都必须告诉设备使用哪个应用程序。你可以用 Microsoft Word 和 Google Docs 来起草一份BP,但它们无法帮你发送电子邮件、分享自拍照、分析数据、安排聚会或购买电影票。即使是最好的程序软件,对你的工作、个人生活、兴趣和人际关系的了解也不全面,利用这些信息为你服务的能力也很有限。这类事项,在今天只有通过人为才能实现,比如你亲密的朋友或私人助理。
未来五年,这种情况将彻底改变。你不必为不同的任务使用不同的App。您只需用日常用语告诉App你想做什么。根据你与它分享的信息,App将做出个性化的回应,因为它对你的生活有了丰富的了解。在不久的将来,任何人都能拥有一个由人工智能驱动的个人助理(App),它的功能远远超出了当今的技术水平。
这种能对自然语言做出恰当处理,并能根据对用户的了解完成许多不同任务的软件被称为agent。近30年来,我一直在思考关于agent的问题,并在 1995 年出版的《未来之路》(The Road Ahead)一书中对其进行了论述。
Agent不仅将改变每个人与计算机的交互方式,它们还将颠覆整个软件行业,带来自敲命令行到点击图标以来计算机领域最大的变革。
有评论家指出,一些软件公司以前也推出过这种产品,但用户并不完全接受。(人们至今还在拿 Clippy 开玩笑,它是微软Office中的一个数字助理,后来被放弃了)。那么为什么人们会使用agents呢?
答案是agents将变得越来越好。你将能够与他们进行细致入微的对话。它们也会更加个性化,而且不会局限于写作这样相对简单的任务。Clippy 与agents的共同点,就像旋转拨号式电话与移动电话的共同点一样多。
只要你愿意,agents就能帮助你完成所有活动。如果您允许它跟踪您在网上的互动和现实世界中的位置,它就会对您所接触的人、地点和活动有深刻的了解。它会了解你的个人和工作关系、个人喜好以及日程安排。你可以选择它介入的方式和时间,以帮助你解决某些问题或提示你做出决定。
为了了解agents将带来的巨大变化,让我们将它与当今的人工智能工具比较一下。这些AI工具大多是机器人,它们仅限于一个应用程序,通常只有在你写下某个特定的单词或寻求帮助时才会介入。因为它们不会学习你的使用习惯,也不会了解你的任何偏好,所以它们不会变得越来越智能。Clippy 是一个机器人,而不是一个智能体。
agents是一个更聪明的智能体。它们更积极主动,能在你提出要求之前就提出建议,它们能跨应用程序完成任务。随着时间的推移,它们会不断改进,因为它们会记住你的活动,并识别你的行为意图和模式。根据这些信息,它们会提供它们认为你需要的服务,但最终决定权始终在你手中。
想象一下,你想计划一次旅行,旅行机器人会找出符合你预算的酒店。而agents将了解你一年中的旅行时间,并根据它对你的了解:比如,你是喜欢经常去不同的地方还是喜欢反复去到同一个地方。然后向你推荐旅行地点。当你提出要求时,它会根据你的偏好和倾向为你推荐相关信息,并为你预订你喜欢的餐厅。但是目前,如果你想要这种深度个性化的规划服务,你需要付钱给旅行社,并且花时间告诉他们你想要什么。
人工智能agents最令人兴奋的是,它将使目前对大多数人来说过于昂贵的服务平民化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力、娱乐和购物。
如今,人工智能在医疗保健中的主要作用是帮助完成行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约时捕捉音频,然后写下笔记供医生查看。
真正的转变是agents未来能够帮助病人进行基本的分诊,获得如何处理健康问题的建议,并决定是否需要寻求治疗。这些agents还将帮助医护人员做出决策,提高工作效率。(目前,Glass Health 等应用程序已经可以分析病人摘要,并提出诊断建议供医生参考)。帮助病人和医护人员对贫穷国家的人们尤其有益,因为那里的许多人根本没有条件去看医生。
当agents能够帮助患者进行基本的分诊,获得如何处理健康问题的建议,并决定他们是否需要寻求治疗时,agents真正的机会就到了。agents还将帮助医护人员做出决策,提高工作效率。(像Glass Health这样的应用程序已经可以分析患者摘要,并提出诊断建议供医生考虑。)帮助患者和医护人员对于不发达国家的人们来说价值尤为重要,因为在这些国家,许多人根本无法找到医生治疗。
这种clinician-agents的推广速度会比其他类型的agents慢一些,因为这事关生死。人们需要看到验证,证明医疗clinician-agents总体上是有益的,尽管它们并不完美,也会犯错。当然,人类也会犯错,无法获得医疗服务也是一个问题。
“需要心理健康护理的美军退伍军人中,有半数得不到此类型服务”。
心理保健是agents将为几乎所有人提供服务的另一个例子。如今,每周一次的心理治疗似乎是一种奢侈。但是,还有很多需求没有得到满足,很多可以从治疗中受益的人却没有机会接受治疗。例如,兰德公司(RAND)发现,需要心理保健的美国退伍军人中,有一半人得不到治疗。
在心理健康方面,训练有素的人工智能agents将使治疗更加经济实惠、更容易获得。Wysa 和 Youper 是其中两个早期的聊天机器人。但是,人工智能agents将更加智能且深入。如果你选择与心理健康agents分享足够多的信息,它就会了解你的生活史和人际关系。它会在你需要的时候出现,而且永远不会不耐烦。甚至在你同意的情况下,它还能通过智能手表监测你对治疗的生理反应,比如当你和老板谈论问题时,你的心跳会开始加速,并建议你何时应该去看心理医生。
几十年来,我一直对软件能让教师工作更轻松、帮助学生学习的各种方式很感兴趣。它不会取代教师,但会补充教师的工作,为学生提供个性化的服务,将教师从文书工作和其他任务中解放出来,让他们有更多的时间从事更重要的工作。这些变化终于开始以戏剧性的方式发生。
目前最先进的技术是可汗学院开发的文本机器人 Khanmigo。它可以辅导学生学习数学、科学和人文学科,例如:它可以解二次方程式,并创建数学问题进行练习,它还可以帮助教师编写教案等。我一直以来都是萨尔·可汗的粉丝和支持者,最近我还请他在我的博客中谈论了教育和人工智能相关话题。
但基于文本的机器人只是第一波浪潮,agents将带来更多的机会。
例如,很少有家庭能够支付一对一辅导老师的费用。如果agents能抓住家教的关键点,他们就能为每一个有需要的人提供这种额外辅导教学。如果辅导agents知道一个孩子喜欢 Minecraft 和 Taylor Swift,就会利用 Minecraft 来教他们计算图形的体积和面积,利用Taylor的歌词来教他们讲故事。体验将更加丰富,比如有图形和声音,而且比现在基于文本的教学更加个性化。
这一领域的竞争已经非常激烈。微软正在将 Copilot 作为 Word、Excel、Outlook 和其他服务的一部分。谷歌也在做类似的事情,将智能助理与 Bard 及其生产力工具结合起来。这些协作机器人可以做很多事情,比如将书面文档转化为幻灯片,用自然语言回答有关电子表格的问题,在代表每个人观点的同时总结电子邮件主题。
agents将做得更多。有了agents,就等于有了一个专门帮你完成各种任务的人,如果你愿意,它还可以独立完成这些任务。如果你有创业的想法,agents会帮你撰写商业计划书,并为你制作PPT,甚至生成产品的图片。公司可以让agents为员工提供直接咨询,并参与每次会议,以便回答问题。
“如果你的朋友刚做完手术,你的agents会主动帮你订花并送到朋友手中”。
无论你是否在办公室工作,你的agents都能像今天的私人助理一样为你提供帮助。如果你的朋友刚做完手术,你的经纪人会主动帮你订花并送过去。如果你告诉agents你想和以前的大学室友叙叙旧,它就会和他们的agents一起安排合适的聚会时间,在你到达之前,它还会提醒你,他们最大的孩子已经在当地大学上学了。
人工智能已经可以做到帮你挑选新电视,推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它可以让你提问(“我喜欢罗伯特-雷德福的哪些电影,在哪里可以看?”),然后根据你过去喜欢的内容进行推荐。Spotify 有一个人工智能驱动的DJ,它不仅能根据你的喜好播放歌曲,还能与你对话,甚至能叫出你的名字。
人工智能不仅能实现推荐功能,还能帮助你采取行动。如果你想买一台相机,你的agents会为你浏览总结所有的评论,据此提出建议,并在你做出决定后帮你下单购买。如果你告诉agents你想看《星球大战》,它就会知道你是否订阅了对应的流媒体服务,如果没有,它就会为你注册。如果你不知道自己想看什么,它还会为你提供定制化的建议,然后想办法播放你选择的电影或节目。
你还能获得为你量身定制的新闻和娱乐内容。CurioAI 可以就你提出的任何主题创建定制内容,这就是未来发展的一个缩影。
简而言之,agents几乎可以在任何活动和生活的任何领域提供帮助。这将对软件行业和社会产生深远影响。
在计算机行业,我们谈论平台、应用程序和服务所依托的技术。安卓、iOS 和 Windows 都是平台。agents将是下一代平台。
“要创建一个新的应用程序或服务,你只需告诉你的agent你想要什么。”
要创建新的应用程序或服务,您不需要知道如何编写代码或进行图形设计。您只需告诉agent您想要什么。它将能够进行应用程序设计、编写代码、创建徽标并将应用程序发布到在线商店。OpenAI 本周推出的 GPT 让我们看到了未来非开发人员也能轻松创建和分享自己的助手。
agent将影响我们使用软件和编写软件的方式,它们将取代搜索网站,因为它们能更好地为你查找和总结信息。它们将取代许多电子商务网站,因为它们能为你找到最优惠的价格,而且不会局限于少数几个供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天各自为政的业务:搜索广告、社交网络、购物、生产力软件将成为一个整体。
我认为不会有任何一家公司主导agents业务,将来会有许多不同的人工智能引擎可供使用。如今,agents被嵌入到文字处理器和电子表格等其他软件中,但它们终将独立运行。虽然有些代理可以免费使用(靠广告业务支持),但我认为大部分agents还是要付费的,这意味着相关公司将有动力让agents为你工作,而不是为广告商工作。从今年开始研究人工智能的公司数量来看,竞争将异常激烈,这将使agents变得非常便宜。
但是,在我所描述的复杂的agents成为现实之前,我们需要面对一些关于技术和如何使用技术的问题。我以前写过关于人工智能所引发的问题的文章,所以在这里我将专门讨论agents问题。
目前还没有人知道agents的数据结构是什么样的。要创建个人agents,我们需要一种新型数据库,它能捕捉到你所有细微的兴趣和关系,并能快速调用这些信息,同时维护你的隐私。我们已经看到了新的信息存储方式,如向量数据库,它可能更适合存储机器学习模型生成的数据。
另一个悬而未决的问题是,人们将与多少个agents互动,你的个人agent会与你的治疗师agent以及你的数学辅导agent分开吗?如果是这样,什么时候你希望它们相互合作,什么时候它们应该各司其职?
“如果你的agent需要与你联系,它会与你通话或出现在你的手机上”。
你将如何与你的代理互动?相关公司正在探索各种方案,包括应用程序、眼镜、吊坠、胸针,甚至全息图。所有这些都是可能的,但我认为人机交互的第一个重大突破将是耳塞。如果你的代理需要帮你办理登机手续,它就会对你说话或出现在你的手机上。(“您的航班延误了,您是想等一等,还是需要我帮忙重新订票?”)如果你愿意,它还能监测传入你耳中的声音,并通过屏蔽背景噪音、放大听不清的语音或让口音重的人以更容易听懂等方式来增强效果。
此外还有其它挑战。目前还没有一种标准协议可以让不同agents之间相互交谈。需要降低成本,这样才能让每个人都能负担得起agents。需要更容易地提示agents,使其给出正确的答案。我们需要防止出现误差,尤其是在健康等领域,因为这些领域对准确性要求极高。我们也不希望agents去做他们不该做的事情。(虽然我不太担心流氓agents,但我更担心人类罪犯利用agents达到恶意目的)。
随着这一切的发生,在线隐私和安全问题将变得比现在更加紧迫。你希望能够决定agents可以访问哪些信息,这样你就可以确信,你的数据只与你选定的人和公司共享。
但是,与agents共享的数据归谁所有,如何确保数据得到合理使用?没有人希望自己收到的广告与自己告诉治疗师agent的事情有关。执法部门能否将你的agent作为不利于您的证据?你的agent何时会拒绝做可能对你或他人有害的事情?谁来选择内置于agents中的价值观?
还有一个问题是,你的agent应该分享多少信息。假设你想见一个朋友:如果你的agent与他们交谈,你不会希望agent说:“哦,她周二要去见其他朋友,不想让你也去”。如果你的agent帮你写工作邮件,它要知道不应该使用你的哪些个人信息或以前工作的专有数据。
对于科技行业和立法者来说,这些问题中的很多都已经成为他们关注的焦点。最近,我与其他技术领袖一起参加了由参议员查克·舒默(Chuck Schumer)组织的人工智能论坛,许多美国参议员也出席了该论坛。我们就这些问题和其他问题交流了看法,并谈到立法者需要建立强有力法规的必要性。
但还有一些问题不是由企业和政府决定的。例如,agents可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住某人的生活细节,比如他的生日,来表达你对他的关心。但当他们知道你的agent可能会提醒你并负责送花时,这对他们来说还有意义吗?
在遥远的未来,agents甚至可能迫使人类面对关于目的的深刻问题。想象一下,如果agents变得如此优秀,以至于每个人无需付出太多的劳动就能拥有高品质的生活。在这样的未来,人们会如何打发时间?当agents掌握了所有答案时,还会有人愿意接受教育吗?当大多数人都有大把空闲时间时,你还能拥有一个安全繁荣的社会吗?
但我们离这个目标还很远。与此同时,agents的时代正在来临。在未来几年里,他们将彻底改变我们的生活方式,无论是在线生活还是离线生活。