现在,第三方可以通过 API 将对话模型 ChatGPT 和语音转文本模型 Whisper 集成到自己的应用程序和服务中了。
来源丨机器之心
2022 年 11 月,OpenAI 上线 ChatGPT,自此以后,这个对话模型一路开挂。毫不夸张的说,与 ChatGPT 相关的话题应该算是继 AlphaGo 以来,最出圈的人工智能热点了,推出仅仅两个月,月活用户就破亿,成为史上用户增长速度最快的消费级应用程序。
ChatGPT 的出现,让大家觉得,AI 似乎终于能够和人正常交流了,虽然有时候会出错,但在交流的过程中至少没有语言和逻辑上的障碍,它能「懂」你在说什么,并且按照人类的思维模式和语言规范给你反馈。
与此同时,各大科技公司、高校甚至是个人也都在紧锣密鼓的投入到类 ChatGPT 的研发中,势必要赶上这波浪潮。
OpenAI 这边也在不断进行模型的升级改造。3 月 1 日,OpenAI 官方宣布,开发者现在可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。
具体来说,OpenAI 现在允许第三方开发人员通过 API 将 ChatGPT 集成到他们的应用程序和服务中,这样做比使用其现有语言模型要便宜得多。除此以外,OpenAI 还宣布了另一个新的 Whisper API,这是 OpenAI 去年 9 月推出的由人工智能驱动的语音转文本模型,可通过 API 使用。OpenAI 这次宣布的两项 API,可以说是相当炸裂了。
OpenAI 表示,其 ChatGPT API 可以用于创建人工智能驱动的聊天界面,该技术已经在科技公司 Snap 的 My AI 上集成。OpenAI 还表示,这次 ChatGPT API 接入的模型名为 gpt-3.5-turbo,这是许多非聊天用例的最佳模型。值得注意的是,该模型可能与 Bing 使用的模型不同,根据 OpenAI 的说法,它比 ChatGPT 、GPT- 3.5 更快、更准确、更强大。
OpenAI 前脚刚官宣,后脚就有人直呼被 ChatGPT 的表现惊呆了。表示自己正在寻找一种快速的方法来提取公司的 logos ,让 ChatGPT 帮忙构建一个工具,仅仅过了 15 分钟 ChatGPT 就给出解决方案,自己只需改变一行代码就能使用。
还有人使用该 API 在 Python 中构建命令行聊天机器人。ChatGPT 给出了 16 行实现代码。
下面我们来看看 ChatGPT API、Whisper API 具体内容有哪些。
OpenAI 表示,gpt-3.5-turbo 与 ChatGPT 产品中使用的是相同的模型。它的费用是 1000 tokens 只需要 0.002 美元,将此前 GPT-3.5 使用成本降低 90%。gpt-3.5-turbo 对于很多非聊天用例也是最佳模型,测试者只要将他们的 prompts 做少量调整,就能从 text-davinci-003 迁移到 gpt-3.5-turbo。
传统上,GPT 模型使用非结构化文本,这些文本在模型中表示为一系列 tokens。而 ChatGPT 模型改用具有元数据的消息序列。在后台,输入仍然作为 tokens 呈现给模型,模型使用的原始格式是一种被称为 Chat Markup Language(ChatML)的新格式。
OpenAI 创建了一个与 ChatGPT 模型交互的新端点。新 API 同样可以通过 Python 绑定的方式使用,只要「import openai」即可,具体代码如下所示。
import openai
cmpletion = openai.ChatCompletion.create (
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": "Tell the world about the ChatGPT API in the style of a pirate."}]
)
print (completion)
OpenAI 不断改进其 ChatGPT 模型,并希望将这些增强的功能开放给开发人员。因此使用 gpt-3.5-turbo 模型的开发人员将始终获得 OpenAI 推荐的稳定模型,同时仍能灵活地选择特定模型版本。比如,OpenAI 今天发布了 gpt-3.5-turbo-0301,该版本将至少在 6 月 1 日之前得到支持。4 月将会更新 gpt-3.5-turbo 的稳定版本。
作为 OpenAI 于 2022 年 9 月开源的语音到文本模型,Whisper 已经获得了开发者社区的盛誉,但运行起来却也很难。
如今,OpenAI 通过开放 APT 向外提供 large-v2 模型,包括方便的按需访问,价格也不贵(0.006 美元 / 分钟)。与其他同类服务相比,OpenAI 高度优化的服务堆栈保证了更快的输出速度。
具体地,Whisper API 通过 transcriptions(源语言转录)或 translations(翻译为英语)端点使用,允许 m4a、mp3、mp4、mpeg、mpga、wav、webm 等各种格式的输入。
Whisper API 同样可以通过 Python 绑定的方式使用,具体代码如下所示。
import openai
file = open ("/path/to/file/openai.mp3", "rb")
transcription = openai.Audio.transcribe ("whisper-1", f)
print (transcription)
ChatGPT 和 Whisper 开放 API,意味着第三方可以开始构建这两个模型赋能的下一代应用程序,并使更多人从中受益。
参考链接:
https://openai.com/blog/introducing-chatgpt-and-whisper-apis
https://www.theverge.com/2023/3/1/23620783/chatgpt-api-openai-pricing-whisper
https://twitter.com/search?q=%20ChatGPT%20API&src=typed_query