OpenAI公司近期给ChatGPT PLUS用户推送了广受期待的插件(plugin)的功能,本文为对于各插件的功能进行总结,包括OpenAI自主托管的两款插件(网页浏览器web browser与代码解释器code interpreter)和一些第三方插件。
ChatGPT PLUS用户可以在GPT-4 Default / GPT-4 Browsing / GPT-4 Plugins 中选择一个进行使用。其中,GPT-4 Default为原GPT-4模型,GPT-4 Browsing为具备联网功能的GPT-4模型,而GPT-4 Plugins为有更多第三方插件的模型。
笔者写作本文的日期是2023年5月17日,天气预报今天有大雨,因此在计划旅行时需要考虑天气情况,使用以下Prompt:
请根据今天上海的天气,安排游玩的计划。
GPT-4 Browsing模型轻松查找到了天气状况,并安排了没有室外活动的一日游:
下图为OpenAI官网列举的部分插件,其中插件数量还在不断增长。可以看出,部分插件调用了一些商业网站的内部检索数据,例如Spotify、Trip等商业公司开发的插件。
用户每一组对话可以使用三个不同的Plugins,在New Chat中选定Plugins后,一系列的与GPT-4的对话都将分别使用选定的Plugins进行分析。如果想使用其他的Plugins,需要新建另一个New Chat。
各插件宣传页介绍如下,笔者简单分成了几类:
下面将分为网页搜索、AI算法类、文件阅读与分析、生活与出行相关Plugins等四个场景,使用不同的Plugins组合。由于Plugins接入的网站大多为英文网站,因此如果使用中文Prompt可能会报错。
1)网页搜索类,选择Metaphor、KeyMate.AI Search、DEV Community等插件,最近对于自由潜和水肺比较感兴趣,因此使用以下Prompt试用:
How to improve the level of freediving?如何提高自由潜的水平?
接着调用了Metaphor进行检索,但似乎KeyMate.AI Search 和DEV Community两个插件没有响应。
2)AI算法类,选择There's An AI For That、ScholarAI等插件,使用以下Prompt试用:
How to introduce GAN algorithms in reinforcement learning? 如何将GAN算法引入强化学习中?
对于这个问题首先由GPT-4回答了一个段落:
并在第二轮交流中调用了Plugins进行搜索:
回答中所给链接已经失效,但是回答的还是非常全面的。
3)文件阅读与分析类,选择ChatWithPDF、AskYourPDF、WebPilot等插件,使用以下Prompt试用,链接所给文章为著名的Attention Is All You Need:
Please try to interpret the main points of the paper from the following link: https://arxiv.org/pdf/1706.03762.pdf. 请尝试归纳链接所述论文的要点。
使用以上三个插件分析PDF后获得的回答如下图,还是比较凝练准确的:
4)生活类,选择Trip.com、OwlJourney、MixerBox OnePlayer等插件,使用以下Prompt试用:
I'm traveling to Ottawa, Canada in August, what are the best places to see and stay in? What music can be recommended to listen to on a long flight?我8月份将前往加拿大渥太华市,有什么景点和住宿的酒店推荐的?有什么音乐可以推荐在长途飞行中聆听?
首先由GPT-4推荐了几个当地的景点。
又调用第三方Plugins推荐了歌曲:
我继续询问:
I wanted to live in a quiet location and not too far from Capitol Hill. 我想居住于安静的地点,并且离国会山不要太远。
调用插件给出的回答如下:
可以发现,GPT-4 Plugins是在第二次对话及之后自动调用Plugins以检索信息,Plugins成为了网络检索与GPT模型之间的桥梁,并且会特别检索每个Plugins领域内的相关网站,在结果中给出相应信息的链接。虽然链接可能会失效,但大部分Plugins推荐的网页链接是可以打开的。
GPT-4 Plugins着重提升了网页链接的检索与分析能力。虽然GPT-4语言模型在许多任务上表现良好,但GPT-4由于数据集限制只能学习到训练数据中可能过时的信息,并且只能生成文本。Plugins可以被看作是语言模型的“眼睛和耳朵”,让GPT模型获取最新的、个性化的信息,并按用户的请求执行特定的操作,在GPT模型训练的非最新的数据库上引入新的资料,从而极大提高了日常生活中的可用性。OpenAI已在ChatGPT中初步支持插件,开发者也可以自行根据开发文档为ChatGPT构建插件。
总结使用GPT-4 Plugins下来的整体感觉,确实极大地提升了即时信息的检索能力,具备广阔的扩展性,体现了OpenAI希望成为AI基础系统的野心。