人工智能即将全面改变我们使用电脑的方式并彻底重塑软件行业。
作者:Bill Gates
日期:2023 年 11 月 09 日
就像我和 Paul Allen 一起创立 Microsoft 时那样,我对软件的热爱至今未减。但不可否认,尽管几十年来软件已经有了长足进步,它在很多方面仍显得不够聪明。
在电脑上做任何事情,你都需要明确告诉它用哪个应用。不论是用 Microsoft Word 还是 Google Docs 撰写商务提案,它们都无法帮你发送邮件、分享照片、分析数据、策划聚会或购买电影票。即便是最优秀的网站也无法全面理解你的工作、个人生活、兴趣和人际关系,更别提利用这些信息来帮助你了。这种事情目前只能靠人来做,比如你的好友或个人助理。
但在未来五年,一切都将发生翻天覆地的变化。你不再需要为不同的任务切换不同的应用程序。只需用平常的语言告诉你的电脑你想做什么,根据你愿意分享的信息多少,软件就能更个性化地作出反应,因为它将对你的生活有更深入的了解。在不久的将来,任何一个上网的人都能拥有一个由 AI 驱动、能力远超现有技术的个人助理。
这种软件——能够理解自然语言并根据对用户的了解完成多种任务的软件——被称为 AI 智能体。我对 AI 智能体的思考已经近 30 年,并在我 1995 年的书《前路》中提到过它们,但直到近期因为 AI 的发展,这些想法才真正变为可能。
AI 智能体不仅会改变我们与电脑的互动方式,它们还将引领软件行业的一场巨变,这将是自我们从键入命令转向点击图标以来计算机界最重大的革命。
每个人都能拥有的个人助理
一些评论家曾指出,虽然软件公司之前尝试推出类似的服务,但用户并未广泛接受。(例如,我们在 Microsoft Office 中推出后又取消的数字助理 回形针 Clippy,至今仍是人们的笑料)那么,为什么现在的智能体会受到欢迎呢?
原因在于它们将会有质的飞跃。你可以与它们进行深入的对话,它们将更加贴合个人需求,不再仅限于处理简单任务如写信这类。Clippy 和智能体的区别,就如同转盘电话与智能手机的区别。
智能体可以在你同意的情况下,通过跟踪你的在线活动和现实世界中的位置,全面了解你的社交圈、活动地点及参与的活动。它能掌握你的人际关系、兴趣爱好、喜好以及日程安排。你可以自由选择让它在何时介入协助或提醒你做决定。
“Clippy 是一种机器人,而不是智能体。”
我们可以将智能体与当前的 AI 工具进行对比,以此感受它们带来的革命性变化。大多数现有的 AI 工具都是机器人,它们通常只在特定应用中起作用,只有当你输入特定词汇或寻求帮助时才会介入。由于它们不会记住你每次的使用习惯,因此无法逐渐了解你的偏好或变得更加智能。Clippy 就是这样的机器人,不是智能体。
智能体则更为高效。它们能够主动提出建议,甚至在你提出需求之前。它们能跨应用程序执行任务,并且随着时间推移,通过记忆你的活动和识别你行为中的意图与模式,不断进步。它们会根据这些信息主动提供帮助,尽管最终的决策权仍然掌握在你手中。
设想一下,你想规划一次旅行。一个旅行机器人可能只会根据你的预算推荐酒店,而智能体则能根据你旅行的时间以及你是倾向于探索新目的地还是重游旧地,为你提供地点建议。根据你的兴趣和冒险程度,智能体还能为你推荐活动,并在你喜欢的餐馆预定位置。如果你想要如此个性化的规划服务,目前你可能需要付费给旅行社的导游,并花时间向他们说明你的需求。
AI 智能体将使原本昂贵的服务普及化,这一点尤其引人注目。它们将在医疗保健、教育、生产力、娱乐和购物等四个领域产生巨大影响。
医疗保健
目前,AI 在医疗领域主要用于辅助行政任务,比如 Abridge、Nuance DAX 和 Nabla Copilot 这些应用能在医生会诊期间记录音频并撰写笔记。
AI 智能体的真正变革将出现在它们能够帮助患者进行初步判断、提供处理健康问题的建议以及决定是否需要就医时。这些智能体还将协助医疗工作人员作出决策,提高工作效率。(例如,Glass Health 这类应用就能分析患者情况并提出可能的诊断供医生参考。)在资源匮乏的贫困国家,这种帮助对于从未见过医生的人们尤为重要。
由于涉及生死问题,这些临床智能体的推广速度会比其他类型慢。公众需要确信,尽管这些健康智能体并非完美且可能出错,但总体上是有益的。毕竟,人类也会犯错,而且缺乏医疗服务同样是一个问题。
“有一半的美国退伍军人需要心理健康护理却无法获得。”
心理健康护理是另一个例子,AI 智能体将使这种服务为几乎每个人所能享有。现在,每周进行一次心理治疗似乎是一种奢侈,但实际上有许多人需要这样的帮助却得不到。例如,RAND 的研究发现,有一半的美国退伍军人需要心理健康护理却得不到。
训练有素的 AI 智能体在心理健康领域的应用,将极大地降低治疗成本,让更多人轻松获得心理健康服务。例如,Wysa 和 Youper 就是这一领域的先行者。这些智能体的作用不止于此。如果你愿意向心理健康智能体提供足够的信息,它能够理解你的生活经历和人际关系。它随时待命,无论何时你需要帮助,它都能提供,并且从不急躁。有了你的允许,它甚至能通过你的智能手表监控你在接受治疗时的生理反应,比如在谈论工作中的问题时心跳加速,它会建议你何时去咨询人类治疗师。
教育
几十年来,我一直期待软件如何使教师工作更轻松,并帮助学生更好地学习。软件不会取代教师,而是成为他们的有力补充,个性化地指导学生,让教师从繁琐的文书工作中解脱出来,将更多时间投入到教学的关键环节。这种变革终于开始显著地发生。
目前领先的技术是由可汗学院(Khan Academy)开发的基于文本的聊天机器人 Khanmigo。它能在数学、科学和人文领域为学生提供辅导,比如解释二次方程公式,并提供练习题。它还能帮助教师编写教案等。长期以来,我一直是 Sal Khan 和他的工作的支持者,并最近邀请他参加我的 播客,讨论教育和 AI 的发展。
但这仅仅是个开始,基于文本的机器人只是探索的第一步。AI 智能体将为学习开辟更多可能。
比如,很少有家庭能负担得起一对一的家庭辅导。如果 AI 智能体能模仿高效家教的方法,那么每个有需求的家庭都可以享受到这种辅导。假如这样的辅导智能体知道一个孩子喜欢《Minecraft》和 Taylor Swift,它就会用《Minecraft》来教授体积和面积的计算,用智能体能模仿高效家教的方法,那么每个有需求的家庭都可以享受到这种辅导。假如这样的辅导智能体知道一个孩子喜欢《Minecraft》和 Taylor 的歌词来教授叙事和韵律。这种体验将比今天的文字辅导更为丰富,例如通过图形和声音,使学习变得更加个性化和生动。
提升效率
当前,我们见证了这一领域的激烈竞争。例如,Microsoft 正在把它的 Copilot 融入到 Word、Excel、Outlook 等众多服务中。同样,Google 也在用 Assistant with Bard 和其办公工具进行相似的尝试。这些智能助理能完成众多任务,如将文字文档转换成幻灯片,用自然语言解答关于电子表格的问题,甚至能概括电邮对话内容,准确表达每个人的观点。
未来,AI 智能体的作用将更为广泛。拥有一个智能体,就像有一位专业助手随时帮你处理各种任务,甚至可以独立完成这些任务。比如,如果你萌生了一个商业构想,智能体可以帮你撰写商业计划,制作相关演示,并为你的产品想象出可能的外观图。公司也可以提供智能体给员工直接咨询,让它们成为会议中的一员,随时回答问题。
“如果你的朋友最近做了手术,你的智能体会主动提出送花,并可以代你下单。”
无论你是在办公室还是在家工作,智能体都能像现今的私人助理一样给你提供帮助。比如,如果你的朋友最近做了手术,智能体会主动提出送花,并可以代你下单。如果你想重聚大学室友,它会与对方的智能体协调时间,并在你见面前提醒你,对方的大孩子刚入读当地大学。
娱乐和购物新体验
现在,AI 已经能够帮助你选择新电视,并为你推荐电影、书籍、电视节目和播客了。例如,我投资的 Likewise 公司最近推出了 Pix,它能回答你的问题(比如“我会喜欢罗伯特·雷德福的哪些电影,我在哪里可以看?”),并基于你过去的喜好为你提供推荐。Spotify 推出的 AI DJ 不仅能根据你的音乐口味播放歌曲,还能与你互动,甚至能叫出你的名字。
AI 智能体不止于提供推荐,它们还会帮助你实现这些建议。比如,如果你想买相机,你可以让你的 AI 智能体帮你阅读所有评论,为你总结并提出购买建议,甚至在你做出决定后帮你下订单。如果你想看《星球大战》,智能体会知道你是否已经订阅了相应的流媒体服务,如果没有,它甚至可以帮你注册。而如果你不确定想看什么,它还可以根据你的喜好提供个性化推荐,并帮你播放选定的电影或电视剧。
你还能获取完全根据你的兴趣定制的新闻和娱乐内容。CurioAI 就能为你创造定制的播客,针对你关心的任何话题,这只是未来可能的一个缩影。
技术行业的剧变
概括地说,AI 智能体(Agents)将能协助我们处理几乎所有活动和生活各个方面的事务,这对软件行业乃至整个社会都将带来深远的变革。
在计算机领域,我们常说的“平台”是指各种应用和服务所基于的技术。像 Android、iOS 和 Windows 这样的操作系统,都是典型的平台。未来,AI 智能体将成为新一代的重要平台。
“创建一个新应用或服务,你只需向你的 AI 智能体说明需求。”
想要开发新应用或服务,你不再需要精通编程或图形设计。只要向你的 AI 智能体描述你的需求,它就能编写代码、设计应用界面、创建标志并将应用发布至在线商店。OpenAI 最近发布的 GPTs 展示了一个新时代的序幕,在这个时代,即便是非开发者也能轻松打造和分享他们自己的智能助手。
AI 智能体将改变我们使用软件的方式和软件的开发模式。它们会取代传统的搜索引擎,因为它们在寻找和概括信息上更加高效。它们还将取代许多电商网站,为你寻找最优价格,而不会局限于少数几个供应商。此外,它们还将取代文字处理器、电子表格以及其他生产力软件。如今独立运营的业务领域——比如搜索广告、带广告的社交网络、购物平台、生产力软件——未来可能会融合成一个大的商业模式。
我认为,不会有哪家公司能独占 AI 智能体市场——未来将有众多不同的 AI 引擎可供选择。虽然现在 AI 智能体多嵌入在像文字处理器、电子表格这样的软件中,但最终,它们将能独立运行。尽管有些智能体将免费提供(通过广告支持),但大多数可能需要付费,这将激励公司让智能体更多地为用户而非广告商服务。从今年开始投身 AI 研究的公司数量来看,未来市场的竞争将十分激烈,这也将使得 AI 智能体的价格变得非常亲民。
然而,在这种高级 AI 智能体成为现实之前,我们还需要解决一系列关于技术本身及其应用方式的问题。我之前已经探讨过 AI 带来的挑战,这里就专门讨论 AI 智能体的相关议题。
技术挑战
现在,关于 AI 智能体的数据结构应该如何构建,还没有一个明确的答案。为了打造能够理解我们兴趣和关系细节的个人智能体,我们需要一种全新的数据库。这种数据库不仅要快速准确地提取信息,还要确保我们的隐私得到保护。例如,向量数据库这样的新型存储方式,似乎更适合保存机器学习模型生成的数据。
还有一个问题尚待解决:我们将与多少智能体进行互动?比如,你的个人智能体、心理咨询智能体和数学辅导智能体是否应该是分开的?如果是,你希望它们在何时互相协作,何时保持独立?
“当智能体需要与你沟通时,它可以通过语音与你对话,或在你的手机上显示。”
你会如何与智能体互动呢?目前,各公司正在试验包括应用程序、智能眼镜、吊坠、胸针,乃至全息图等多种形式。这些都有可能成为未来的选择。但我认为,人类与智能体之间的首个重大突破可能是智能耳机。比如,当智能体需要通知你某件事(如:“你的航班延迟了,你想等待还是需要我帮你改签?”)时,它可以通过耳机与你沟通。如果你愿意,它甚至能够过滤掉背景噪音,增强难以听清的语音,或帮助你更好地理解口音重的对话。
当然,还存在其他挑战。例如,目前还没有一种标准的协议让不同的智能体之间进行沟通。此外,要让智能体对每个人都负担得起,其成本还需要进一步降低。我们还需要简化智能体的操作方式,以便更容易获得准确的回答。此外,我们需要防止智能体出现幻觉现象,尤其是在像健康这样的重要领域,避免由于偏见而误伤用户。当然,与其担心智能体变得不受控制,我更担心有人会利用智能体进行犯罪活动。
隐私与其他迫切问题
当今科技的快速发展,网络隐私和安全问题迫在眉睫。你必须选择智能体(Agent)能接触哪些信息,这样才能放心你的数据只会和你指定的人或公司共享。
但你和智能体分享的数据究竟归谁所有?如何确保数据的正确使用呢?谁也不愿意因和治疗师智能体的私密交谈而开始收到相关广告。执法机关能否利用你的智能体作为证据?你的智能体何时会拒绝做对你或他人有害的事情?谁来决定智能体内嵌的价值观?
智能体应分享多少信息也是个问题。假设你想见朋友,如果你的智能体和他们的交流,你肯定不希望它说出“她周二要和其他朋友见面,不打算让你加入”这样的话。如果智能体帮你写工作邮件,它得知道不能使用你的个人信息或以前工作的保密数据。
这些问题已经是科技界和立法者的关注重点。我近期参加了 Chuck Schumer 参议员组织的 AI 论坛,许多美国参议员都出席了。我们分享了对这些及其他问题的看法,并讨论了立法者制定严格法律的必要性。
但还有一些问题不由公司和政府决定。例如,智能体可能改变我们和朋友、家人的互动方式。现在,通过记住对方的生日等细节可以表达关心。但当对方知道这是智能体提醒的,并且智能体帮你送了花,这样的关心还有意义吗?
在遥远的未来,智能体可能会让人类面对关于生命目的的深刻问题。想象智能体发展到极致,人们几乎不用工作就能享受高品质生活。在那样的未来,人们将如何利用时间?当智能体掌握所有答案时,人们还会渴望接受教育吗?在大多数人有大量空闲时间的社会中,如何确保社会的安全和繁荣?
我们距离这一天还很远。但智能体的时代即将到来,在未来几年内,它们将彻底改变我们线上和线下的生活方式。