OpenAI首届开发者大会召开了!
关键信息:
OpenAI首届开发者大会于11月7日在旧金山盛大召开,吸引了整个硅谷的开发者。自2007年乔布斯的iPhone改变世界以来,硅谷从未对任何活动如此兴奋。一年前的11月30日,OpenAI发布了ChatGPT,这款AI驱动的聊天机器人在两个月内吸引了1亿用户,创下了用户增长速度最快的历史记录。然而,ChatGPT的增长后来逐渐放缓,这也是所有生成式AI产品都面临的问题:如何获得新的增长动力?今天在开发者大会上,OpenAI提出了解决方案:让生成式AI更便宜、更个性化,并让其无处不在。
两个月前,OpenAI宣布将召开首届开发者大会时,OpenAI CEO奥尔特曼(Sam Altman)声称不会发布GPT-5、GPT-4.5或者相关的大语言模型,他没有食言,不过,今天他还是发布了一个新模型——GPT-4的升级版GPT-4 Turbo。
相较于GPT-4,GPT-4 Turbo有更长的上下文窗口、更快的输出速度,使用成本也更低:
①更长的上下文窗口:GPT-4 Turbo拥有128K(此前为32k)的上下文长度,这是目前硅谷所有已商用大模型中最长的,超过之前由Claude 2保持的100K的纪录。128 K 使得GPT-4 Turbo一次就能读取或答复20万汉字长度的内容,差不多是两本《活着》或是一本《骆驼祥子》的长度,这不仅意味着你可以直接把一本中篇小说喂给它,让它帮你总结提炼,还意味着它在处理问题时的准确率更高、记忆力更强。
中国的大模型训练者近期也在争夺这一指标,就在一周前,百川智能发布了Baichuan2-192K大模型,声称其上下文窗口长度最高可支持192K个token(注:相当于14.4万个单词,不过百川智能称该模型能够处理约35万个汉字),比GPT-4 Turbo和Claude 2都要长。
②更精确的控制:在使用GPT-4 Turbo的「函数调用」等特殊指令时,结果反馈会更加精准。此外还有一个名叫JSON模式的功能,打开这个模式后,GPT-4 Turbo就会以你要求的格式回复你了。
③更丰富的知识:GPT-4 Turbo添加了新的训练数据,数据截止日期更新为2023年4月。在此之前,当你询问ChatGPT有关最近发生的事情时,它都回复「训练数据截至2021年9月」,那会儿,这个日期以后的一切信息都没有被添加到模型里。
④向B端用户开放多模态能力:GPT-4系列模型的多模态能力,现在也可以通过GPT-4 Turbo的API(Application Programming Interface,API)使用,让企业客户通过调用API构建自己的多模态应用。
例如专门为盲人开发的BeMyEye应用就使用这个API,通过手机摄像头它能帮助盲人识别物品。不仅如此,新的「文本转语音」模型与新的「语音转文本」模型都可以通过API使用,且效果都得到了提升。
⑤企业用户可以自定义模型:该服务将允许客户与OpenAI研究人员一起在特定领域训练模型,从而生成独一无二的定制模型。目前该项目仅对企业客户开放,OpenAI表示名额有限,且价格不菲。
⑥放宽速率限制:所有付费GPT-4用户使用模型时的每分钟tokens上限都提高了一倍,意味着未来你可以在一分钟内更频繁地向GPT提问并要求答复。
除了推出具有这么多新功能的迭代模型,OpenAI还降低了几乎所有模型的API使用价格,整体便宜了一半多。例如GPT-4之前每读取1000 tokens长度的内容的价格是0.03美元,现在则是0.01美元;之前每答复1000 tokens长度内容的价格是0.06美元,现在降至0.03美元——低价有望吸引更多开发者和用户。今年夏季之后,不少开发者都遭遇成本挑战。微软旗下加入了生成式AI功能的GitHub被爆亏损,虽然微软后来否认了,不过对于用户每月30美元的订阅费来说,也是不菲的价格。
今天的OpenAI开发者大会上最令人惊艳的还不是上述迭代模型,而是「GPTs」,用Sam Altman的话说就是,每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。
该定制服务拥有一个专门页面「创建GPT」(GPT Builder),页面上的3个按钮「知识」(Knowledge)、「功能」(Capabilities)和「行动」(Actions)使得用户可以通过点击一步步构建自己的GPT。
其中,点击「知识」按钮可以上传用户希望模型学习的本地数据;「功能」按钮则让GPT可以像Agent(智能体)一样执行具体工作,比如访问网页、生成图片和写代码。
创建一个GPT并不复杂,大部分时候只需要以对话的方式告诉ChatGPT你希望定制GPT可以实现什么样的功能,然后再从「创建GPT」菜单中选择需要为此加载的资源和能力即可。是创建一个GPT作为你的代码纠错助手,还是创建一个能够教授桌面游戏规则的教练,这些都取决于你给GPT下达了什么要求、提供了什么知识。
现场演示中,Sam Altman就自制了一个名叫「风投导师」的GPT。在管理OpenAI前,Altman曾是著名风投机构Y Combinator的CEO,这次他通过GPT重操旧业了。
首先,在「创建GPT」的界面里,Altman告诉ChatGPT他要创建一个指导创始人如何开展业务的GPT,名字就叫「风投导师」,同时还让ChatGPT帮助生成了一个logo,于是一个GPT的雏形就建好了。
接下来Altman又说希望给这个GPT添加一些知识,于是就自动跳转到这个GPT的设定页面。在其中的「知识」一栏可以选择上传文件,Altman将在Y Combinator工作时的讲座资料上传,一个有着特殊知识的GPT就制作好了。
最后,任何人制作的GPT都有仅自己可见、公司内任何人可见、获得链接的人可见和公众可见4个选项,Altman选择将这个风投导师GPT设定为仅自己可见。之后,它就出现在了页面左侧的ChatGPT选项下面,你可以在这个区域方便地切换有着不同名字、不同功能的GPTs。当然,你也可以设定将GPT分享给其他人,企业也可以创建一个专门供员工使用的GPT。
本月月底,OpenAI即将上线类似App Store的GPT商店,届时你不仅可以访问其他人创建的GPT,还可以自己创建GPT并赚钱。
OpenAI不仅想通过GPTs把你留在ChatGPT里,它还想把ChatGPT嵌入每个应用,从而无处不在。
在开发者大会的最后,Sam Altman推出了一个面向开发者的工具「Assistants」(助手)API,通过这个API,开发人员可以在自己的应用程序中构建类似ChatGPT的聊天机器人。如果说「GPTs」是让ChatGPT里多了个携程,「Assistants API」就是让携程可以在自己的应用里有个ChatGPT。
「Assistants」(助手)功能也可以利用代码编辑器、函数调用、知识检索这三个工具来增强自己的能力。而且,通过调用Assistants,开发者可以拥有一个长度无限的对话线程(Threads)。通常在ChatGPT里,每当你开启新的对话,就会生成一个对话线程,每个对话线程的长度是固定的,一旦超过这个长度对话就无法继续,只能再开启新的。
OpenAI员工还现场演示了为旅行应用Wanderlust添加ChatGPT助手后的效果。添加后,你就可以直接对着某个城市地图要求ChatGPT为你设计旅行路线,并且规划路线经过的地点。此外,你还可以将飞机行程单和Airbnb住宿单上传到这个ChatGPT里面,要求它帮你计算旅行中每个人应该花费多少钱。
此次开发者大会上,OpenAI的所有努力都围绕着一个主题——如何让GPT无处不在,不论是在工作中还是生活中、在超级应用ChatGPT中还是在其他各大应用程序里。目前,OpenAI已经有200万开发者,92%的《财富》500强公司都在使用GPT的API来构建服务,在个人业务方面,OpenAI也累积了1亿的周活跃用户。
不过这些成绩距离ChatGPT成为万物入口还有一大段路程。在通向万物入口的道路上,有另一家绕不过去的,曾经也号称要掌控万物入口的公司——微软。作为OpenAI最重要的投资人和最紧密的合作伙伴,微软与OpenAI的合作关系从今年年初起一直弥漫着一种紧张。媒体多次爆料称双方在业务上存在冲突,但官方从未承认过这一点,哪怕就在不久前,还有报道称微软正在独立研发的代号为Phi的小尺寸模型也拥有了多模态能力,很可能成为GPT的Plan B。
出乎意料的是,微软CEO萨蒂亚·纳德拉(Satya Nadella)还是来到了OpenAI首届开发者大会现场。
Sam Altman第一个问题就是「你怎么看待目前咱们的合作关系?」,问完后台下所有人都在笑。纳德拉表示,「OpenAI很了不起,从电源到数据中心,到机架、加速器、网络,微软云计算平台Azure的一切都被大模型改变了,不过我们(微软)构建最好的基础设施,你们构建最好的模型。」
紧接着,Altman问了第二个问题「你怎么看待未来咱们的合作关系?」,台下的人笑得更厉害了。纳德拉也笑着表示,「OpenAI激进的推进产品路线图(Roadmap)使微软不得不努力提升基础设施并扩张算力,我们的使命是赋能每个人从人工智能中受益,并且我们(微软)坚信安全至关重要。」