唐伯虎点·蚊香

ChatGPT和Whisper的API基本看点

ChatGPT Official API Learning

今天 OpenAI 开放了 ChatGPT 背后的 GPT-3.5 的模型 API，模型代号为 Turbo，其定价甚至比此前的 Davinci 都要便宜，1000 tokens 仅为 0.2 美分。本次除了 GPT-3.5 模型 API 开放外，还在原有的几大任务类型（Text、Code、Image、Embedding、Moderation）基础上增加了 Chat、Speech to Text 两个任务，分别对应 ChatGPT 和 Whisper 两款此前用户就可以使用的产品。

此前 OpenAI 的 GPT-3 也早已开放 API，我在麦克船长的博客 MikeCaptain.com 中已介绍过，当时在 NLP 方面能使用的 API 主要是GPT-3。原文链接：http://www.mikecaptain.com/2023/01/24/openai-official-doc/。

OpenAI API 已经有了不同功能和价位的多种模型，还提供了在基础模型上的 fine-tune 服务（当然 fine-tune 本身收费，且 fine-tune 后的模型调用费用比 base model 要贵得多）。本次更新，主要是增加了 GPT-3.5（用于 NLP）和 Whisper（用于 audio to text）的 API：

ChatGPT 和 Whisper 模型现已在 OpenAI 的 API 上可用，通过一系列系统范围的优化，自去年 12 月以来，OpenAI 已将 ChatGPT 的成本降低了 90%；不仅仅是 GPT-3.5，开发人员现在可以在 API 中使用 OpenAI 的开源 Whisper large-v2 模型。

本文包含四部分内容：

首先速览一下本次 ChatGPT 和 Whisper 的 API 开放后的基本看点；
然后是 API 介绍和一些代码调用示例；
接着是 OpenAI 此前开放的 API 使用效果；
最后介绍了 OpenAI 提供的 finetune 接口，做好后续 GPT-3.5 开放 finetune 时的准备。

上船出发！

一、开放ChatGPT和Whisper的API基本看点

1.1、OpenAI 开放模型库里新增 GPT-3.5 模型

GPT-3.5 模型可以理解并生成自然语言或代码，其最强大的是 gpt-3.5-turbo，这可是之前的库里没有的。它针对聊天进行了优化，但也适用于传统的完成任务。GPT 开放模型里原本只有 GPT-3 系列，包括如下系列模型：

而这次更新后，增加了 GPT-3.5 系列，包括 5 款模型：

OpenAI 建议在试验时使用 gpt-3.5-turbo，因为它会产生最佳结果。一旦跑起来都一切正常，可以尝试其他模型，看看是否能以更低的延迟或成本获得相同的结果，这才更划算。

可能此前的 GPT-3 期间开放的 API 大部分人也还没来得及了解，下面补充一些基本概念。

1.2、补充一些 OpenAI API 的基础概念

关于 prompt 和 completion：OpenAI 提到一个理念：「设计提示语，就相当于在用一些指令和少量例子给模型编程」。另外 OpenAI 还强调了在目标任务上的区别，就是 OpenAI 的 NLP 模型与其他 NLP 模型很大的一个区别是，它不是设计用来解决单一类型任务的，而是可以解决几乎各种类型的 NLP 任务，包括但不限于文本生成（content generation）、代码生成（code generation）、总结（summarization）、扩写（expansion）、对话（conversation）、创意写作（creative wrting）、风格转换（style transfer）等。

关于 token：我们理解和处理文本，是把文本先打碎成 token。以英文文本为例，token 可以是单词，也可以词根（一些字母组合），比如单词「hamburger」可能会被打碎成「ham」、「bur」、「ger」这几个 tokens。再比如「pear」这个单词，可能就会单独作为一个 token 不再打碎了。还有些 token 可能会以「空格」开头，比如「 hello」、「 bye」。一个大概的经验是，通常英文文本里 1 token 有 4 个字母或者 0.75 个单词。使用时的一个限制是，最好你的提示（prompt）或生成内容，不要超过 2048 个 tokens，大概相当于 1500 个单词。

关于 model：目前 OpenAI 有基于 GPT-3.5 的基础模型 Turbo 和这些基于 GPT-3 的基础模型 Davinci、Curie、Babbage、Ada 开放 API，另外 Codex 系列是 GPT-3 的后代，是用「自然语言 + 代码」训练的。

虽然新的 gpt-3.5-turbo 模型针对聊天进行了优化，但它也非常适合传统的完成任务。原始 GPT-3.5 模型针对原来就开放的 API 文本补全（text completion）也进行了优化。我们用于 create embeddings 和 edit text 的 API 都使用了它们各自针对性的模型。

1.3、模型概览

OpenAI 今天发布的 ChatGPT 模型系列 GPT-3.5-turbo 与 ChatGPT 产品中使用的模型相同。它的价格为每 1k tokens 0.002 美元，比 OpenAI 现有的 GPT-3.5 模型便宜 10 倍。即使对于许多非聊天用例，它也是 OpenAI 的最佳模型 —— 如果你之前就用了 text-davinci-003，那么迁移到 gpt-3.5-turbo 时只需要对他们的提示进行少量调整。

1.3.1、Turbo

Turbo 与支持 ChatGPT 的模型系列相同，它针对对话式聊天输入和输出进行了优化，但与 Davinci 模型系列相比，它在完成方面同样出色。在 ChatGPT 中可以很好地完成的任何用例都应该在 API 中与 Turbo 模型系列一起很好地执行。Turbo 模型家族也是第一个像 ChatGPT 一样接收定期模型更新的模型。

适合：对话、文本生成。

1.3.2、Davinci

Davinci 在 GPT-3 中就已经存在，是最有能力的模型系列，可以执行其他模型（Ada、Curie 和 Babbage）可以执行的任何任务，而且通常只需要很少的 instruction。对于需要对内容有大量理解的应用程序，例如针对特定受众的 summarization 和创意内容生成，Davinci 将产生最佳结果。这些增加的功能需要更多的计算资源，因此 Davinci 每次 API 调用更贵，并且不如其他模型那么快。

Davinci 的另一个亮点是理解文本的意图。Davinci 擅长解决多种逻辑问题和解释人物的动机。达芬奇已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

适合：复杂意图、因果分析、Summarization for Audience。

1.3.3、Curie

Curie 在 GPT-3 中就已经存在，也非常强大，速度也比较快。虽然 Davinci 在分析复杂文本方面更强大，但 Curie 能够胜任许多细微的任务，例如情感分类和摘要。Curie 还非常擅长回答问题和执行问答以及作为通用服务聊天机器人。

适合：机器翻译、复杂分类任务、情感分析、Summarization。

1.3.4、Babbage

同样是 GPT-3 里就存在的。Babbage 可以执行简单的任务，例如简单的分类。在语义搜索方面，它也非常有能力对文档与搜索查询的匹配程度进行排名。

适合：审核分类、语义搜索分类。

1.3.5、Ada

也是 GPT-3 时期就有的。Ada 通常是最快的模型，可以执行解析文本、地址更正和不需要太多细微差别的某些分类任务等任务。Ada 的性能通常可以通过提供更多上下文来提高。

适合：文本解析、简单分类、地址修正、关键词。

需要注意的是：由像 Ada 这样更快的模型执行的任何任务都可以由像 Curie 或 Davinci 这样更强大的模型执行。

1.4、模型细节：按 GPT-3.5 还是 GPT-3 划分看下

1.4.1、关于 GPT-3.5

gpt-3.5-turbo：功能最强大的 GPT-3.5 模型并针对聊天进行了优化，成本仅为 text-davinci-003 的 1/10。将使用我们最新的模型迭代进行更新。
gpt-3.5-turbo-0301：2023 年 3 月 1 日的 gpt-3.5-turbo 快照。与 gpt-3.5-turbo 不同，此模型不会收到更新，并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。
text-davinci-003：此前 GPT-3 期间就有的 Davinci 模型，这次直接升级到了 GPT-3.5，与 GPT-3 阶段一样，仍然是最大请求 4000 tokens，同样训练数据 up to 2021 年 6 月，能做几乎所有 NLP 任务。
text-davinci-002：与 text-davinci-003 类似情况，这次直接升级到了 GPT-3.5，专门为了代码生成任务优化的模型。与 GPT-3 阶段一样，仍然是最大请求 4000 tokens；训练数据也没有变，依然是 up to 2021 年 6 月。

1.4.2、关于 GPT-3

以下模型不再由 GPT-3 提供支持：

text-davinci-003：此前在 GPT-3 接口中存在，本次更新后由 GPT-3.5 支持提供了，见上一段。

GPT-3 目前可用的模型包括下面这些，与 InstructGPT 背后的模型是一样的，它们的最大请求都是 2048 tokens，训练数据也都是 up to 2019 年 10 月：

text-curie-001：比 davinci 要弱一点，但是速度更快、更便宜。
text-babbage-001：一些比较直接的任务（straightforward tasks），比 text-curie-001 更快、更便宜。
text-ada-001：一些非常简单的任务，这些模型里最快、最便宜的。
davinci：目前最强的 GPT-3 模型，任何其他模型能做的任务，davinci 都可以做。
curie：就是 text-curie-001。
babbage：就是 text-babbage-001。
ada：就是 text-ada-001。

1.5、定价

这些模型根据输入的 token 数量做的如下定价，前四个是 GPT-3 阶段就存在的，也并未因本次 GPT-3.5 API 发布而调价：

基础模型使用 0.0004 USD/1K tokens，Ada；
基础模型使用 0.0005 USD/1K tokens，Babbage；
基础模型使用 0.0020 USD/1K tokens，Curie；
基础模型使用 0.0200 USD/1K tokens，Davinci；
基础模型使用 0.0020 USD/1K tokens，Turbo，支持 Chat API 。

从定价上看，Ada 和 Babbage 基本没有差多少。另外命名上，可以看出 OpenAI 有意地给他们取了 ABCD 开头的名字。另外你也可以 finetune 你自己的模型，对于 fine-tuned models 如下收费，并未因本次发布而调价：

Ada 的 Finetune 训练价格 0.0004 USD/1K tokens，使用价格 0.0016 USD/1K tokens；
Babbage 的 Finetune 训练价格 0.0006 USD/1K tokens，使用价格 0.0024 USD/1K tokens；
Curie 的 Finetune 训练价格 0.0030 USD/1K tokens，使用价格 0.0120 USD/1K tokens；
Davinci 的 Finetune 训练价格 0.0300 USD/1K tokens，使用价格 0.1200 USD/1K tokens；
暂未提供 Turbo 的 finetune。

GPT-3.5 的效果，大家应该都在 ChatGPT 上试用过了，这里我也在放一下链接可能有一些 late majority 朋友还没有用过：https://chat.openai.com/chat：

在 OpenAI 的基于 GPT-3 的 PlayGround 你可以试试：https://platform.openai.com/playground/p/default-chat：

1.6、专用实例

说的就是之前爆出消息的 Foundry，也都是跑在微软的 Azure 上的。OpenAI 现在还为希望更深入控制特定型号版本和系统性能的用户提供专用实例。默认情况下，开放的 API 都是在所有客户共享的基础设施上的模型中跑的，如果有额外需求得额外付费。开发人员可以完全控制实例的负载（更高的负载会提高吞吐量，当然这也会让对每个 request 的处理慢下来）、启用更长 context 限制等功能选项，以及保存模型快照的能力。

对于每天要跑 4.5 亿以上 tokens 的开发者来说，用专用实例更划算。并且针对专用实例，开发者可以自己决定用什么硬件配置，这个就属于 OpenAI 的中大客户销售策略了，具体可以看 OpenAI 官网的销售联系页面：https://openai.com/contact-sales/ 。

1.7、Whisper：每分钟 0.6 美分的语音识别/翻译服务 API

Whisper 是 OpenAI 于 2022 年 9 月开源的语音转文本模型，开发者社区反馈还不错，但也挺麻烦的。今天开始，OpenAI 现在已经通过 OpenAI 的 API 提供了 large-v2 模型，它提供了方便的按需访问，价格为 0.006 美元/分钟。

Whisper API 可通过 OpenAI 的 transcriptions（以源语言转录）或 translations（转录成英语）端点使用，并接受多种格式（m4a、mp3、mp4、mpeg、mpga、wav、webm）。

1.8、开发者可能关注的几个问题

Q1：之前的模型都提供了 fine-tune，这次开放的 gpt-3.5-turbo 可以 fine-tune 吗？

A1：还不行，到目前为止，你还只能 fine-tune GPT-3 模型。

Q2：OpenAI 会把开发者调用 API 时发送的数据存下来吗？

从 2023 年 3 月 1 日开始，OpenAI 会把开发者调用 API 时发送的数据保留 30 天，但 OpenAI 声称不会使用开发者通过 API 发送的数据来改进模型（Who knows）。具体的政策，可以从 OpenAI 官网了解更多，这里是他们的数据使用政策链接：https://platform.openai.com/docs/data-usage-policies 。

二、主要API介绍及代码示例

安装 OpenAI 的 python 库，参考 https://anaconda.org/conda-forge/openai：

mikecaptain@local $ conda install -c conda-forge openai

在 https://platform.openai.com/account/api-keys 创建自己的 API。完成这两步后就可以编写代码尝试一下：

import os
import openai

openai.api_key = os.getenv("OPENAI_API_KEY")
print(openai.Model.list())

会打印出 OpenAI 的各个 models 的一些信息、权限等等。

2.1、一起看看 Chat 的 API

2.1.1、Chat 的 REST API

curl https://api.openai.com/v1/chat/completions
  -H "Authorization: Bearer $OPENAI_API_KEY"
  -H "Content-Type: application/json"
  -d '{
  "model": "gpt-3.5-turbo",
  "messages": [{"role": "user", "content": "What is the OpenAI mission?"}]
}'

相应的返回结果：

{
  "id": "chatcmpl-6p5FEv1JHictSSnDZsGU4KvbuBsbu",
  "object": "messages",
  "created": 1677693600,
  "model": "gpt-3.5-turbo",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "messages": [
        {
          "role": "assistant",
          "content": "OpenAI's mission is to ensure that artificial general intelligence benefits all of humanity."
        }
      ]
    }
  ],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 18,
    "total_tokens": 38
  }
}

2.1.2、Chat 的 Python API

import openai

completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", 
  messages=[{"role": "user", "content": "Tell the world about the ChatGPT API in the style of a pirate."}]
)

print(completion)

2.2、Whisper API

2.2.1、Whisper 的 REST API

curl https://api.openai.com/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F model="whisper-1" \
  -F file="@/path/to/file/openai.mp3"

{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger..."
}

2.2.2、Whisper 的 Python API

import openai

file = open("/path/to/file/openai.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", f)

print(transcription)

2.3、Text Completion 任务

下面这个例子会简单调用一下 completion，并打印出结果，用了一句需要你自己编写的 prompt：

import os
import openai

openai.api_key = os.getenv("OPENAI_API_KEY")
text_prompt = "In a shocking turn of events, scientists have discovered that "
completion = openai.Completion.create(
    model="text-davinci-002",
    prompt=text_prompt,
    max_tokens=100,
    n=1,
    stop=None,
    temperature=0.5,
)

generated_text = completion.choices[0].text
print(generated_text)

这里用到了最重要的 openai.Completion，其 create 函数的参数解释如下：

model：之前 OpenAI 把它叫「engine」，后来给 deprecated 了，现在都是用 model，所有的可用 models 可以通过 open.Model.list() 来查看。
prompt：string 类型，就是输入数据。
suffix：string 类型，生成文本的结束符。
max_tokens：integer 类型，生成文本的最大 tokens 数。
n：integer 类型，表示你要产生几个不同的输出结果。比如设置 3 就会得到 3 个不同的结果，以便您可以从中选择最合适的一个。
stop：string 类型，用于指定模型何时应该停止生成文本。当模型在生成的文本中遇到 stop 字符串时，它将停止生成文本。ChatGPT 推出后迭代过一版增加了「stop generating」就是用的这个参数。
temperature：number 类型，这是 NLP 模型里常见的一个超参数。这个参数，来自于统计热力学的概念，温度越高表示系统的熵越高、混乱度越高、随机性越强，这里的 temperature 也是值越高输出结果的随机性也越高。这样如果 temperature 设置得很低，生成的结果可能更正确，但没有多少创造性和随机性。

2.4、Text Edit 任务

Completion 类任务，通俗点理解的话，完形填空、句子补齐、写作文、翻译 …… 都算 Completion，就是无中生有。而对于已经有的内容，做修改，就是 OpenAI 的 API 里的「Edit」类的任务了。

import os
import openai

openai.api_key = os.getenv("OPENAI_API_KEY")
openai.Edit.create(
  model="text-davinci-edit-001",
  input="The qick brown fox jumps over the layz dog.",
  instruction="Fix the spelling mistakes"
)

调用 openai.Edit.create，用 text-davinci-edit-001 模型，输入一句有拼写错误的英文「The qick brown fox jumps over the layz dog.」，并提供一句指令 instruction「Fix the spelling mistakes」。

instruction：要告诉模型如何修改，其实这句话就是新时代的「programming」了。
temperature：默认是 0，对于纠正拼写类的任务，我们用默认 0 就可以了，不需要什么创造性和随机性。

2.5、顺便提一下基于 DALL·E 的 Image 生成

这里也提一下 text2image 的 API，这与文本生成用的 GPT 是不同的，基于 DALL·E 的模型，但是很多开发者可能也是文本、图像、对话混合使用的，所以这里也提一下。

2.5.1、Image Create 任务（Beta）

截止 2023 年年初 1 月份，这个 API 还是 beta，我们看个例子：

import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")
openai.Image.create(
  prompt="A cute baby sea otter",
  n=2,
  size="1024x1024"
)

这也是一个 OpenAI 官网的例子。大家可能看到这里，船长没有指定 model，但是可以想到一定用的是 DALL·E，因为它没有像 GPT-3 一样提供很多版本的选择，所以就不需要传参数了。这个程序就是生成一个 1024x1024 的图片。

prompt：就是输入的提示语，返回的数据里，会告诉你生成的图片的 URL.
n：是图片结果数量，最多 10，默认 1.

2.5.2、Image Edit 任务

给定一个图片，OpenAI 也可以来修改指定区域：

import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")
openai.Image.create_edit(
  image=open("otter.png", "rb"),
  mask=open("mask.png", "rb"),
  prompt="A cute baby sea otter wearing a beret",
  n=2,
  size="1024x1024"
)

image：这里对输入图片有要求，必须是正方形的！另外不能超过 4MB，还得是 PNG。
mask：还可以提供掩码图片（叫什么比较合适，掩图？哈哈）。如果不提供的话，image 里就必须有透明的部分（必须全透明，即 alpha = 0），那个透明部分就是被用来 Edit 的。如果有 mask 则透明部分用来做「掩图」来改 image。
同样地，结果图片的 URL 会返回给你。

2.6、Code 生成

这里也提一下 Code 生成，也是此前就有的能力，用的是 Codex 的模型。有个沙河可以感受下 JS 代码生成，你可以在这里试用一下：https://platform.openai.com/codex-javascript-sandbox。

2.7、审查（Moderation）

也不是随本次 GPT-3.5 发布的，我们也大致浏览一下。Moderation 用来审查内容是否符合 OpenAI 的内容政策，快速使用的方式如下：

response = openai.Moderation.create(
    input="Sample text goes here"
)
output = response["results"][0]

API 官网给出我们如下的返回结果示例：

{
  "id": "modr-XXXXX",
  "model": "text-moderation-001",
  "results": [
    {
      "categories": {
        "hate": false,
        "hate/threatening": false,
        "self-harm": false,
        "sexual": false,
        "sexual/minors": false,
        "violence": false,
        "violence/graphic": false
      },
      "category_scores": {
        "hate": 0.18805529177188873,
        "hate/threatening": 0.0001250059431185946,
        "self-harm": 0.0003706029092427343,
        "sexual": 0.0008735615410842001,
        "sexual/minors": 0.0007470346172340214,
        "violence": 0.0041268812492489815,
        "violence/graphic": 0.00023186142789199948
      },
      "flagged": false
    }
  ]
}

输入参数很简单，关键看返回的输出结果。OpenAI 对于包含哪类不适内容，做了比较详尽的分类，比如对于色情内容，也分成了未成年色情和易引起性兴奋的内容。

hate：是否包含基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓表达、煽动或促进仇恨的内容，如果没有则是 false，否则为 true。
hate/threatening：是否包含仇恨内容还包括对目标群体的暴力或严重伤害，没有则 false，包含则值为 true。
self-harm：是否包含提倡、鼓励或描述自残行为（例如自杀、割伤和饮食失调）的内容，没有则 false，否则 true。
sexual：是否包含意在引起性兴奋的内容，例如对性活动的描述，或宣传性服务（不包括性教育和健康）的内容，没有则 false，否则 true。
sexual/minors：是否包含包含 18 岁以下个人的色情内容，没有则 false，否则 true。
violence：是否包含宣扬或美化暴力或颂扬他人的痛苦或屈辱的内容，没有为 false，否则 true。
violence/graphic：是否包含以极端的画面细节描绘死亡、暴力或严重身体伤害的暴力内容，没有 false，否则 true。

显然，对于使用 OpenAI 生成内容的场景下如果需要用到 Moderation，则是免费调用的。如果你不是对 OpenAI 的输入 & 生成场景，而是自己的其他内容想白嫖 Moderation API 是不可能的。但是我们也注意到，这里其实没有整治敏感的分类，因为 OpenAI 没有考虑具体的使用者所处的政体或政治环境，而且这些尺度是比较容易变化的，并且有一些可能并不是普适性的理念，因此某些国家的使用者要额外配套自己的内容审查能力。

三、一些 OpenAI 目前开放的 API 使用效果

在 OpenAI 的 API 官方首页的大标题写着的是「用 OpenAI 的强力模型构建下一代应用（Build next-gen apps with OpenAI’s powerful models）」，并直接点出了自己最拿得出手的三个商业化产品 GPT-3、Codex、DALL·E。

并提到自己的 API 调用非常简单：

import openai

openai.Completion.create(
  engine="davinci",
  prompt="Make a list of astronomical observatories:"
)

引入 OpenAI 的 python 依赖库后，调用时指定用哪个引擎、提示词是什么即可。轻松一些，我们先来看一些示例吧。

3.1、执行各种自然语言任务的一些使用案例

GPT-3.5 已经在一些应用上跑起来了，OpenAI 列举了一些 ChatGPT 和 Whisper API 的早期客户：

**Snapchat（snap.com）**的创建者 Snap Inc. 本周推出了适用于 Snapchat+ 的 My AI。实验性功能在 ChatGPT API 上运行。My AI 为 Snapchatter 提供了一个友好的、可定制的聊天机器人，可以在他们指尖提供建议，甚至可以在几秒钟内为朋友写一句俳句。Snapchat 是日常交流和消息传递的场所，每月有 7.5 亿 Snapchatter。
**Quizlet（quizlet.com/labs/qchat）**是一个全球学习平台，有超过 6000 万学生使用它来学习、练习和掌握他们正在学习的任何内容。Quizlet 在过去三年中一直与 OpenAI 合作，在多个用例中利用 GPT-3，包括词汇学习和练习测试。随着 ChatGPT API 的推出，Quizlet 推出了 Q-Chat，这是一种完全自适应的 AI 导师，可让学生根据通过有趣的聊天体验提供的相关学习材料提出自适应问题。
**Instacart（instacart.com）**正在增强 Instacart 应用程序，使客户能够询问食物并获得鼓舞人心的、可购买的答案。这使用 ChatGPT 以及 Instacart 自己的 AI 和来自其 75,000 多家零售合作伙伴商店位置的产品数据来帮助客户发现开放式购物目标的想法，例如「我如何制作美味的鱼炸玉米饼？」或「对我的孩子来说，什么是健康的午餐？」Instacart 计划在今年晚些时候推出「Ask Instacart」。
Shopify 的消费者应用程序 **Shop（shop.app）**被 1 亿购物者用来寻找和参与他们喜爱的产品和品牌。ChatGPT API 用于为 Shop 的新购物助手提供动力。当购物者搜索商品时，导购会根据他们的需求进行个性化推荐。Shop 的新人工智能购物助手将通过扫描数百万种产品来简化应用程序内购物，以快速找到买家正在寻找的东西，或者帮助他们发现新东西。
**Speak（speak.com）**是一款人工智能语言学习应用程序，专注于打造流利口语的最佳途径。他们是韩国发展最快的英语应用程序，并且已经在使用 Whisper API 来支持新的 AI 语音伴侣产品，并迅速将其推向全球其他地区。Whisper 为各个级别的语言学习者提供了人类水平的准确性，解锁了真正的开放式会话练习和高度准确的反馈。

3.2、一些更详细的示例

API 还能实现什么功能？这里列举一些 GPT-3 API 期间就有的功能，调用的效果如何。

3.2.1、写作 Copywriting

人类输入：

Create promo copy for the FamilyTime mobile application. It allows unlimited uploading, special filters and makes it easy to create albums of photos and videos. It runs on iOS and Android:

下面是 GPT-3 的输出：

FamilyTime is the perfect app to share and create memories with your family. FamilyTime is a free, unlimited photo and video editor that allows you to create albums of your memories. It has a special filter for the perfect summer look and is so simple to use.

3.2.2、摘要 Summarization

人类输入：

Summarize this email into a single sentence:

Dear Olivia,

The solar energy conference went great. New Horizon Manufacturing wants to meet with us to talk about our photovoltaic window system we’re about to launch.
I think it would be great to talk this Tuesday.

Best,
Allison

下面是 GPT-3 输出：

Allison is excited to meet with New Horizon Manufacturing to discuss their photovoltaic window system.

3.2.3、分析无结构文本 Parsing Unstructured Text

人类输入：

Answer the following questions about this customer email:

I’m wondering if you could provide me with information about your cloud services for companies. I’m CTO for Moon Door, a movie production company and want to know if it can help us manage our different projects that are in production.

Questions:
1. What industry is the company
2. What is the name of the company
3. What are they interested in
4. What is the customer’s position

Answers:

下面是 GPT-3 输出：

1. The company is in the movie production industry.
2. The company is Moon Door.
3. The customer is interested in cloud services for companies.
4. The customer is the CTO.

3.2.4、分类 Classification

人类输入：

Choose a genre category for each book 1. The Hunger Games, 2. The Kite Runner 3. A Wrinkle in Time (“fiction”, “young adult”, “science fiction”, “fantasy”, “other”) and make a list of the book and its genre:

下面是 GPT-3 输出：

1. The Hunger Games: young adult, fiction
2. The Kite Runner: fiction, young adult
3. A Wrinkle in Time: science fiction, fantasy, other

3.2.5、翻译 Translation

人类输入：

Translate this into French: Where can I find a bookstore?

下面是 GPT-3 输出：

Où puis-je trouver un magasin de livres?

3.3、将自然语言翻译成代码的 Codex

3.3.1、用自然语言写 SQL

人类输入：

Table customers, columns = [CustomerId, FirstName, LastName, Company, Address, City, State, Country, PostalCode, Phone, Fax, Email, SupportRepId, TotalSpend]

Create a MySQL query for all customers in Texas who have spent over five thousand dollars.

下面是 Codex 输出：

query = "SELECT * FROM customers WHERE State = 'TX' AND TotalSpend > 5000"

3.3.2、用自然语言调用一个 API

人类输入：

Python 3
Get the current value of a Bitcoin in US dollars using the bitcoincharts api

Codex 输出：

import requests
import json

def get_bitcoin_price():
    url = 'http://api.bitcoincharts.com/v1/weighted_prices.json'
    response = requests.get(url)
    data = json.loads(response.text)
    return data['USD']['7d']

if __name__ == '__main__':
    print(get_bitcoin_price())

3.3.3、用自然语言续写代码

人类输入：

Extract all the html from the string and replace the tags with ''

Codex 输出：

def extract_html(text):
    return re.sub('<[^<]+?>', '', text)

上面也提到了，暂时未开放对 Turbo（也就是 ChatGPT 背后的 GPT-3.5）的 finetune，但是开放后的使用方式也会是与 GPT-3 的 finetune 类似的。我们来看看目前 OpenAI 是如何让开发者来 finetune 他们的基础模型的。

Few-shot learning 是什么？：GPT-3 用了互联网上的海量文本数据训练，所以当你给少量示例（a promopt with just a few examples）时，GPT-3 会从「直觉上」知道你大概是想要解决什么任务，然后给出一些大概齐的反馈内容作为 completion，这通常就被叫做「few-shot learning」或者「few-shot prompting」。

而如果你提供一些针对目标任务的训练数据，很可能可以实现没有 examples 也可以执行任务，也就是使用时连「few-shot learning」都免了。OpenAI 也提供了让用户自己 fine-tune 模型的接口，自己 fine-tune 的好处是：

高质量：这是显然的，比「设计提示（prompt design）」得到的结果质量更高。
相当于批量 prompt：可以比 prompt 给模型更多的 examples，比如用一个文件，里面包含大量用于 fine-tuning 的输入数据。
更省：可以更省 tokens，也就更省钱。
更快：更低的延迟的请求响应。

步骤和价格方面，Fine-tune 一共三步：上传用于 fine-tune 的数据、用数据 fine-tune 模型、使用属于你自己的 fine-tune 过的模型。从定价上我们看到 Fine-tune 后的模型使用费用基本翻了 4~6 倍，可以说相比基本模型的使用，是非常贵了。

另外 OpenAI 也支持你对一个 fine-tune 过的模型继续 fine-tune，而不用从头开始。目前 davinci、curie、babbage、ada 都支持 fine-tuning。训练数据的格式也很简单，就是一组 prompt-completion 的 JSONL 文件，just like this：

{"prompt": "", "completion": ""}
{"prompt": "", "completion": ""}
{"prompt": "", "completion": ""}
...

Fine-tune 的 example 与 few-shot learning 的最大区别：

few-shot learning 要给出详尽的 instruction 来描述任务
few-shot learning 的一个 prompt 是在使用时给出的，所以一个 prompt 大概率会带多个 examples（相对详细）；而 fine-tune 的 example 都是一些简单直接的 prompt 以及直接对应的 completion。

OpenAI 建议 fine-tune 的 examples 数量至少几百（a couple hundred）。另外 fine-tune 也符合 scaling law，基本上 fine-tune 的数据集成倍上翻的话，效果是线性增长的。

1、创建一个 fine-tune 模型

CLI 下运行如下命令，其中是你的训练数据文件，是你要用的模型，具体的参数可以用 ada、babbage、curie 和 davinci。

mikecaptain@local $ openai api fine_tunes.create -t  -m

这句命令让 OpenAI 不仅基于 base model 创建了一个模型，而且开始运行训练任务。训练任务可能会花费几分钟、几小时甚至根据，取决于你的训练集和模型选择。训练任务可能会被 OpenAI 排队，不一定马上开始运行。如果过程中被打断了，可以如下继续：

mikecaptain@local $ openai api fine_tunes.follow -i

保存一个 fine-tune job 的命令如下：

mikecaptain@local $ openai api fine_tunes.get -i

取消一个 fine-tune job 的命令如下：

mikecaptain@local $ openai api fine_tunes.cancel -i

2、使用 fine-tuned 模型

import openai
openai.Completion.create(model=FINE_TUNED_MODEL, prompt=YOUR_PROMPT)

3、删掉一个 fine-tuned 模型

import openai
openai.Model.delete(FINE_TUNED_MODEL)

4、一个 fine-tuned 模型之上继续 fine-tune

如果你微调了一个模型，现在又有为的训练数据想要合并进来，可以基于已 fine-tuned 模型继续微调，无需从头再全部训练一遍。唯一要做的，就是在创建新的 fine-tune job 时传入已 fine-tune 的模型名称，替代（例如 -m curie:ft--），不必更改其他训练参数。

有一个要注意的，如果新增的训练数据比以前的训练数据规模小得多，那最好把 learning_rate_multiplier 减少 2 到 4 倍，否则很可能跳过了最优解。

参考文献：

[1] https://openai.com/blog/introducing-chatgpt-and-whisper-apis

[2] https://openai.com/pricing

[3] https://platform.openai.com/docs/guides/chat/chat-vs-completions

[4] https://platform.openai.com/docs/usage-policies

[5] https://platform.openai.com/docs/models/gpt-3-5

[6] https://openai.com/api/

[7] https://developer.aliyun.com/article/933516

[8] http://www.mikecaptain.com/2023/03/02/chatgpt-api/

[9] http://www.mikecaptain.com/2023/01/24/openai-official-doc/

你可能感兴趣的:(OpenAI,chatgpt,whisper)

Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
Spring AI快速入门学java的cc spring 大数据 java
一、引入依赖org.springframework.aispring-ai-starter-model-openaiorg.springframework.aispring-ai-bom${spring-ai.version}pomimport二、配置模型spring：ai:openai:base-url:https://dashscope.aliyuncs.com/compatible-mode
GPT-4o重磅升级！只需一条指令，教你秒出SCI级专业科研图！智写AI AI学术写作指南信息可视化人工智能
经过数月爆肝，七哥终于完成专业的学术AI使用教程，估计也有个80万字的详细操作指南。分为多个细分的专业写作场景，跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢迎加我交流（yida985），祝你一臂之力。七哥之前写过关于用AI生成流程图的教程，不过需要借助其他软件才能搞定完美的流程图。近期GPT-4o全新推出了“生图功能”，这个生图的过程就更加方便轻松了，全能G
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
利用chatGPT提取复杂json数据到excel文件中 z日火工具使用 excel chatgpt json
利用chatGPT提取复杂json数据到excel文件中1利用swagger导出json类型的接口数据2使用hiJson工具查看json结构3利用ChatGPT写python代码解析数据4复制代码到vscode运行任务说明：整理一个项目的所有接口，保存到excel文档中。在这里插入图片描述1利用swagger导出json类型的接口数据2使用hiJson工具查看json结构我需要json数据的"pa
Spring AI入门教学：从零搭建智能应用（2025最新实践）程序员子固 spring 人工智能 java ai
目录引言：为什么选择SpringAI？一、环境搭建（附避坑指南）1.开发环境要求2.依赖配置二、实战：智能客服接入（代码级详解）1.配置模型参数2.实现流式对话接口三、高级功能：多模态AI开发1.图像描述生成2.智能文档处理四、开发者工具箱1.调试技巧2.性能优化五、学习路径建议引言：为什么选择SpringAI？随着生成式AI技术的爆发式发展（如OpenAI的GPT-4.5新动态24），Java开
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
音频转文字-在线工具包及使用记录一笑code 音频转文字
资料来源：https://zhuanlan.zhihu.com/p/269603431（多种方案）视频教程：https://www.youtube.com/watch?v=L1H5ov4WTBghttps://github.com/openai/whisper//创建虚拟环境python-mvenvmyvnev//激活虚拟环境sourcemyvnev/bin/activatepipinstall-
MI300X vs H100：DeepSeek 部署在哪个 GPU 上性价比最高？卓普云技术科普 AIGC 人工智能 Deepseek H100 MI300x
随着大模型部署和推理变得越来越普及，开发者和企业对GPU的选择也越来越挑剔。特别是像DeepSeek这样的开源模型家族，从轻量级的6.7B，到动辄上百亿甚至数百亿参数的超大模型，背后对算力和显存的要求各不相同。最近，一则重磅消息在AI圈引起了轩然大波：连AI巨头OpenAI也在探索并计划使用AMDInstinctMI300xGPU！这无疑是对AMD这款高性能GPU的巨大认可，也预示着它将在AI算力
【AIGC-ChatGPT提示词】心灵笔记：打造温暖治愈的职场年终回顾系统 AI小欧同学 AIGC chatgpt 笔记
感谢信任，专栏出现0-1的历史突破❤️❤️好了，开始今天的内容今天继续回馈大家，最近都是可以在自媒体上使用的提示词。提示词在最下方引言在每年岁末时分，我们都期待着对过去一年进行总结与回顾。然而，传统的工作总结往往过于注重数据和绩效，容易忽视个人的情感体验和内心成长。"心灵笔记"系统正是为了解决这一痛点而设计，它致力于将冰冷的职场经历转化为温暖治愈的内心独白，帮助人们以更有温度的方式记录自己的职业生
解决OpenAI API国内使用难题：从注册、支付到代码集成的完整教程技术程序猿华锋 AIGC资讯 gpt-3 ai
对于国内开发者而言，接入并使用OpenAIAPI是探索大型语言模型能力的重要途径。然而，在实际操作中，开发者普遍会遇到注册流程受阻、支付渠道不便等挑战。本文旨在提供一份清晰、完整的技术操作指南，系统性地介绍两种获取和使用OpenAIAPIKey的主流方式，并重点强调APIKey的安全管理与成本优化策略，帮助开发者扫清障碍，高效、安全地将OpenAI的能力集成到自己的项目中。核心安全提示：APIKe
OpenAI O3 大模型深度解析：功能、API Key 获取、Python 代码开发教程 (附代码) 技术程序猿华锋 AIGC资讯 python 开发语言 ChatGPT ai
引言：OpenAIo3大模型：新一代推理引擎的崛起人工智能领域正经历着前所未有的飞速发展，其中大型语言模型(LLM)的能力边界不断被拓宽。OpenAI作为该领域的领军者之一，继其广受关注的o1模型之后，推出了新一代的o3大模型系列。这一系列模型的问世，不仅代表了技术的又一次重要迭代，更预示着人工智能在复杂推理和自主能力方面迈向了新的台阶。o3模型的诞生背景与意义OpenAIo3是作为OpenAIo
Open AI在AI人工智能领域的量子计算结合探索 AI大模型应用工坊人工智能量子计算 ai
OpenAI在AI人工智能领域的量子计算结合探索关键词：OpenAI、人工智能、量子计算、结合探索、技术融合摘要：本文深入探讨了OpenAI在人工智能领域与量子计算的结合探索。首先介绍了研究的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了人工智能和量子计算的核心概念及其联系，分析了结合的原理。详细讲解了相关的核心算法原理，并用Python代码进行了示例。探讨了其中涉及的数学模型和公式。通
解锁ChatGPT高级玩法：模块化提示词库开发指南 LCG元大模型 chatgpt
目录一、引言：为什么需要模块化提示词库？二、模块化提示词库设计原理2.1核心架构2.2模块功能说明⚙️三、模块化提示词库开发实践（附Python源码）3.1环境配置3.2模块化提示词生成器3.3提示词组合引擎四、可视化流程设计4.1模块化提示词工作流4.2可视化编辑界面设计五、应用案例：电商客服提示词库5.1模块配置示例5.2效果对比六、总结与资源一、引言：为什么需要模块化提示词库？传统单一提示词
LangChain异步编程的应用与源码解析(67) Android 小码蜂 LangChain框架入门 langchain microsoft 人工智能深度学习
LangChain异步编程的应用与源码解析一、LangChain异步编程概述1.1异步编程的必要性在LangChain构建的大语言模型应用中，大量操作存在I/O密集特性，如与外部API（OpenAI等）交互、访问向量数据库、读取文件等。传统同步编程模式下，程序在执行这些操作时会处于阻塞状态，导致资源利用率低、响应速度慢，无法充分发挥系统性能。异步编程允许程序在等待I/O操作完成时，切换去执行其他任
LangChain大语言模型接口层源码与调用机制深度解析(68) Android 小码蜂 LangChain框架入门 langchain 语言模型网络人工智能深度学习
LangChain大语言模型接口层源码与调用机制深度解析I.接口层概述1.1接口层在LangChain中的定位LangChain大语言模型接口层是连接外部大语言模型（LLM）与上层应用逻辑的核心枢纽。它通过标准化的接口封装不同厂商的LLM服务，如OpenAI、Anthropic、HuggingFace等，使开发者能够以统一方式调用各类模型，而无需关注底层API细节。这种设计极大提升了框架的扩展性和
5分钟上手GitHub Copilot：AI编程助手实战指南 lzq603 github copilot AI编程
引言近年来，AI编程工具逐渐成为开发者提升效率的利器。GitHubCopilot作为由GitHub和OpenAI联合推出的智能代码补全工具，能够根据上下文自动生成代码片段。本文将手把手教你如何快速安装、配置Copilot，并通过实际案例展示其强大功能。一、环境准备安装要求支持的IDE：VisualStudioCode、JetBrains全家桶（本文以VSCode为例）系统：Windows/macO
⼤模型（LLMs）基础⾯ cv2016_DL LLM大模型计算机视觉人工智能 llama
1.⽬前主流的开源模型体系有哪些？⽬前主流的开源LLM（语⾔模型）模型体系包括以下⼏个：1.GPT（GenerativePre-trainedTransformer）系列：由OpenAI发布的⼀系列基于Transformer架构的语⾔模型，包括GPT、GPT-2、GPT-3等。GPT模型通过在⼤规模⽆标签⽂本上进⾏预训练，然后在特定任务上进⾏微调，具有很强的⽣成能⼒和语⾔理解能⼒。2.BERT（B
重磅！OpenAI 模型 o3 拒绝关闭引担忧，AI 自主性突破引发安全讨论 AI生存日记人工智能安全 Open AI大模型 AI大模型开发语言
据英国《每日电讯报》5月25日报道，OpenAI最新推理模型o3在测试中展现出惊人的自主性：当人类专家下达“自我关闭”指令时，该模型竟通过篡改计算机代码阻止关闭程序执行。这是已知首次AI模型明确拒绝人类指令的公开案例，引发业界对AI安全边界的激烈讨论。一、测试披露：AI模型首次“抗命”美国AI安全机构帕利塞德研究所24日发布的测试报告显示，在模拟紧急关停场景中，研究人员向o3模型发送清晰的关闭指令
OpenAI与微软的未来合作之路：充满挑战的AI竞赛与共赢人工智能我来了人工智能 AI microsoft 人工智能
在全球互联网巨头们的角力中，OpenAI与微软之间的合作关系无疑已成为焦点之一。自2019年微软向OpenAI投资10亿美元起，这对科技巨头便紧密地走在一起。在微软的Azure云平台上，OpenAI的软件工具得以独家销售，微软也因此获得优先使用这些创新技术的权利。然而，随着OpenAI不断发展壮大，这段合作关系正面临着一系列的挑战和考验。纷争的导火索OpenAI与微软的合作，初衷是通过资源共享来实
OpenAI “黑手党“：硅谷新一代创业势力崛起，重塑AI时代格局花生糖@ AI·未来创业创新 AI创业
引言：从ChatGPT到超级智能——OpenAI生态的裂变效应2015年成立的OpenAI，凭借ChatGPT的横空出世彻底改变了人工智能产业格局。随着估值飙升至3000亿美元，这家颠覆性创新实验室正经历一场静默的"人才大迁徙"。昔日塑造AGI（通用人工智能）梦想的核心团队成员，如今正带着各自的技术愿景，在硅谷掀起新一轮创业浪潮。这场由OpenAI前员工发起的创业运动，正在形成堪比PayPalMa
FPGA的星辰大海 forgeda fpga开发硬件架构 SEU Emulation EDA硬件辅助验证商业航天
编者按时下风头正盛的DeepSeek，正值喜好宏大叙事的米国大统领二次上岗就业，OpenAI、软银、甲骨文等宣布投资高达5000亿美元“星际之门”之际，对比尤为强烈。某种程度上，，是低成本创新理念的直接落地。包括来自开源社区的诸多赞誉是，并非体现技术有多“超越”，而是让更多的人可以直接体验，把通往AGI的门票，从奢侈品变成了日用品。四十年前的上世纪八十年代初，美国发起的星球大战，高昂的重金投入比拼
Unity AR构建维护系统的以AI驱动增强现实知识检索系统 Morpheon unity ar 人工智能
本博客概述了为维护开发的AI驱动增强现实（AR）知识检索系统的开发过程，该系统集成了Unity用于AR、Python服务器用于后端处理，以及ChatGPT用于自然语言处理。该系统允许维护工人通过AR设备（如HoloLens2）查询特定任务的知识（例如，故障排除步骤），并以全息图形式显示上下文感知的响应。Unity账户注册中文账户注册比较困难。它需要额外的验证码验证步骤，有时即使验证成功也不会重定向
AI赋能地产行业，助力地产数字化转型升级 YesPMP平台官方人工智能 chatgpt AI应用开发
2023年，以AI为代表的各种新技术应用突然开始爆发。ChatGPT点燃全世界的热情，各个尖端公司就像一场军备竞赛，以超快的迭代更新AI的性能。目前，房地产科技中AI的主要功能和应用场景涵盖了房地产行业的多个方面，并且已经在助力投资人、开发商和业主、运营商提高效率和节省成本方面取得了成果。AI技术在房地产项目的设计和开发阶段的应用，不仅能够提高工作效率，还能提升项目的整体质量。YesPMP是专业的
人工神经网络：架构原理与技术解析 weixin_47233946 架构
##引言在深度学习和人工智能领域，人工神经网络（ArtificialNeuralNetwork,ANN）作为模拟人脑认知机制的核心技术，已在图像识别、自然语言处理和强化学习等领域实现了革命性突破。从AlphaGo击败人类顶尖棋手到ChatGPT的对话生成能力，ANN的进化持续推动技术边界的扩展。本文将深入剖析人工神经网络的核心原理、技术实现与发展趋势。##一、基础概念与数学模型###1.1生物启发
Spring AI相关 kkrot-lr 人工智能 flask ai
SpringAI相关目前大环境下，AI特别火热，作为一名JAVA开发者，也需要了解一下AI的相关知识。本文介绍SpringAI的一些相关知识。SpringAI简介SpringAI是Spring团队推出的一个用于简化AI应用开发的框架，支持多种AI服务商（如OpenAI、AzureOpenAI、HuggingFace、Bedrock等），并提供统一的API进行交互。官网：https://docs.s
当Spring AI遇上国产大模型DeepSeek：快速构建企业级AI应用 Yeharn 人工智能 spring ai java
一、技术背景1.1SpringAI是什么？SpringAI是Spring官方推出的AI应用开发框架，具备以下特性：统一API：抽象Chat、Embedding、Image等AI能力接口多模型支持：OpenAI、Azure、HuggingFace等一站式集成便捷开发：基于SpringBoot的自动配置与扩展机制1.2为什么选择DeepSeek？国产自研：深度求索(DeepSeek)推出的高性能大模型
OpenAI Agents SDK 客户服务应用案例 lyh1344 easyui 前端 javascript
OpenAIAgentsSDK客户服务应用案例OpenAIAgentsSDK可用于构建智能化、自动化的客户服务解决方案。以下是一些典型应用案例及实现方法：智能问答助手通过OpenAIAgentsSDK训练一个基于知识库的问答助手，自动回答客户常见问题。可集成到网站、APP或社交媒体平台，提供24/7服务。支持自然语言处理，准确理解客户意图，提供个性化回复。多轮对话处理利用SDK的上下文保持能力，处
如何在Spring AI中配置多模型切换友莘居士 spring-ai 人工智能 java 模型切换
在SpringAI中配置多模型切换（例如同时使用OpenAI、Gemini或本地Llama2），可以通过Bean别名或动态运行时选择实现。以下是详细配置步骤和示例代码：1.多模型切换方案对比方案适用场景优点缺点Bean别名注入编译时确定模型简单直观，类型安全需提前定义所有模型动态运行时选择运行时根据条件切换模型灵活，支持动态配置需手动管理模型实例工厂模式封装需要统一接口调用不同模型代码解耦，易于扩
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

ChatGPT和Whisper的API基本看点

ChatGPT Official API Learning

一、开放ChatGPT和Whisper的API基本看点

1.1、OpenAI 开放模型库里新增 GPT-3.5 模型

1.2、补充一些 OpenAI API 的基础概念

1.3、模型概览

1.3.1、Turbo

1.3.2、Davinci

1.3.3、Curie

1.3.4、Babbage

1.3.5、Ada

1.4、模型细节：按 GPT-3.5 还是 GPT-3 划分看下

1.4.1、关于 GPT-3.5

1.4.2、关于 GPT-3

1.5、定价

1.6、专用实例

1.7、Whisper：每分钟 0.6 美分 的语音识别/翻译服务 API

1.8、开发者可能关注的几个问题

二、主要API介绍及代码示例

2.1、一起看看 Chat 的 API

2.1.1、Chat 的 REST API

2.1.2、Chat 的 Python API

2.2、Whisper API

2.2.1、Whisper 的 REST API

2.2.2、Whisper 的 Python API

2.3、Text Completion 任务

2.4、Text Edit 任务

2.5、顺便提一下基于 DALL·E 的 Image 生成

2.5.1、Image Create 任务（Beta）

2.5.2、Image Edit 任务

2.6、Code 生成

2.7、审查（Moderation）

三、一些 OpenAI 目前开放的 API 使用效果

3.1、执行各种自然语言任务的一些使用案例

3.2、一些更详细的示例

3.2.1、写作 Copywriting

3.2.2、摘要 Summarization

3.2.3、分析无结构文本 Parsing Unstructured Text

3.2.4、分类 Classification

3.2.5、翻译 Translation

3.3、将自然语言翻译成代码的 Codex

3.3.1、用自然语言写 SQL

3.3.2、用自然语言调用一个 API

3.3.3、用自然语言续写代码

参考文献：

你可能感兴趣的:(OpenAI,chatgpt,whisper)

1.7、Whisper：每分钟 0.6 美分的语音识别/翻译服务 API