OpenAI API及ChatGPT系列教程1:快速入门

系列文章目录:

  1. OpenAI API及ChatGPT系列教程1:快速入门
  2. OpenAI API及ChatGPT系列教程2:使用手册
  3. OpenAI API及ChatGPT系列教程3:API参考(Python)

本文目录:

  • 系列文章目录:
  • 前言:
  • 一、OpenAI API 介绍
    • 1. 概述:
    • 2. 关键字:
  • 二、快速入门:
    • 1. 介绍:
    • 2. 从一个简单指令开始:
    • 3. 继续添加提示词:
    • 3. 调整设置:
    • 3. 用代码来实现(Python):
  • 三、Python库:
  • 四、模型(Modesl):
      • GPT-4:
      • GPT-3.5:
      • DALL.E:
      • Whisper:
      • Embeddings:
      • Moderation:
      • GPT-3:
  • 四、总结:


前言:

本系列档的主要内容是官方的翻译,同时加入了更多内容,旨在让读者更轻松地上手ChatGPT。在这些添加的内容中,我会提供更多的例子、技巧和提示,以帮助读者更好地理解 ChatGPT 的使用。此外,我们还会讨论 ChatGPT 的历史和发展,以及它在自然语言处理和人工智能领域的应用。通过这些信息,您可以更全面地了解 ChatGPT 的优势和潜力,并更好地应用 ChatGPT 来解决自己的问题。祝您阅读愉快!


一、OpenAI API 介绍

1. 概述:

首先我们得解释一下OpenAI API和ChatGPT之间的关系。好多朋友都不太分得清这两个概念。

ChatGPT 是基于OpenAI(公司)的 GPT-4 模型开发的一款聊天式人工智能。而OpenAI API 是一种开放的应用程序编程接口,通过这个接口,开发者可以将 OpenAI 开发的人工智能技术应用到各种软件中。

So,这篇文章应该叫做“OpenAI API教程”,但是让我们来面对现实,谁会读那个呢?所以加上”ChatGPT“后,恩,高端大气上档次~

下面是官网文档对OpenAI API的介绍:

OpenAI API 几乎可以应用于任何涉及理解或生成自然语言、代码或图像的任务。我们提供一系列具有不同算力级别的模型,适用于不同的任务,并且能够微调您自己的自定义模型。这些模型可用于从内容生成到语义搜索和分类的所有领域。

2. 关键字:

  • 提示词(Prompts):

当您想让ChatGPT执行某些操作时,您需要给它一些指示或示例。这就是我们所说的“提示词”。您可以将其用于几乎任何事情 - 不仅仅是像其他一些 NLP 服务那样的一个特定任务。无论您需要帮助生成代码、编写摘要,甚至只是聊天,ChatGPT都可以为您提供帮助。

(随着人工智能技术的不断发展,在自然语言处理、计算机视觉和语音识别等领域,人们越来越多地使用人工智能模型来处理各种任务。为了让这些模型能够更好地理解和生成自然语言、代码或图像等内容,提示词工程师(Prompt Engineer)这一新兴职位应运而生。

提示词工程师(Prompt Engineer)是设计、开发并优化提示词(Prompt),以便人工智能模型能够更好地理解和生成自然语言、代码或图像等内容。提示词工程师需要对自然语言处理(NLP)和机器学习有深入的理解,能够将业务需求转化为高效的提示词,并持续改进和优化这些提示词,以提高人工智能模型的性能和效果。

  • 代币(Tokens):

官方文档里面提到的是 Tokens,对于开发者来说这个概念很常见,开发者管这个叫“令牌”。但是在这里,它代表着对输入内容的分割。按照翻译,我们应该称之为“标记”,但是在 OpenAPI 中,它也是一个计费标准,收费是根据 Tokens 的数量来计算的。因此,我们也可以把它翻译成“代币”。总之,这个词很容易引起混淆,所以后文都将它称为”标记“。您知道它是什么意思就行了。

我们的模型通过将文本分解为称为标记的小块,来理解和处理文本。这些标记可以是单词或字符块。例如,“hamburger”这个词被分成了“ ham”,“ bur”和“ ger”三个标记,而像“pear”这样的短而常见的单词是一个标记。许多标记以空格开头,例如“ hello”和“ bye”。

我们可以处理的标记数量取决于您提供的文本量。一般来说,英文文本的一个标记大约是4个字符或0.75个单词。根据统计数据,750个单词平均等于1000个标记,而一个中文字符平均等于1.12个标记。要记住的一个限制是,您的文本提示和生成的完成组合必须不超过模型的最大上下文长度(对于大多数模型,这是2048个标记,或大约1500个单词,或大约1800个中文字符)。

  • 模型(Models):

我们通常说的ChatGPT其实是OpenAPI其中的一种模型。而OpenAPI是由一系列模型支撑的,这些模型的能力不同,使用费用也不同。 GPT-4是最新和最强大的模型。 GPT-3.5-Turbo是ChatGPT的动力模型,针对对话格式进行了优化。

二、快速入门:

OpenAI已经训练了先进的语言模型,非常擅长理解和生成文本。我们的API提供对这些模型的访问,并可用于解决几乎涉及语言处理的任何任务。

在这个快速入门教程中,您将构建一个简单的示例应用程序。在此过程中,您将学习使用API解决任何问题的关键概念和技术,包括:

  • 内容生成(Content generation)
  • 摘要(Summarization)
  • 分类、分类和情感分析(Classification, categorization, and sentiment analysis)
  • 数据提取(Data extraction)
  • 翻译(Translation)
  • 等等等等!

1. 介绍:

补全(Completions)端点是OpenAI API的核心,提供了一个非常灵活且强大的简单接口。你所需要做的就是给它一些文本作为提示(Prompt),API将为你提供一个完成(Completion),试图匹配你提供的任何指令或上下文。

举例:

提示:为冰淇淋店写一个标语。

补全:每勺冰激凌都带着微笑!

每勺冰激凌都带着微笑!

可以将其视为非常高级的自动完成 - 模型处理您的文本提示并尝试预测最有可能出现的内容。

2. 从一个简单指令开始:

现在你想给你的宠物取名。从零开始想出名字是很困难的!

首先,你需要一个明确的提示,告诉模型你想要什么。让我们从一条指令开始:

提示:给马取一个名字。

补全:闪电

还不错!现在,试着让你的指示更具体。

提示:给一匹黑马取一个名字。

补全:闪电

如上所见,将一个简单的形容词添加到提示中会改变所得到的补全结果。设计提示词本质上就是如何对模型进行“编程”。

3. 继续添加提示词:

让我们试着让你的指令更复杂:

提示:给马取三个名字,要求类似超级英雄的名字。

补全:

  1. 超级马 (Chaoji Ma)
  2. 勇敢马 (Yonggan Ma)
  3. 英雄马 (Yingxiong Ma)

这个结果不完全符合我们的要求。让我们看看能否得出一些更相关的建议。

有时候不仅仅是告诉模型你想要什么很有用,展示它也很有用。在提示中包含示例可以帮助传达模式或小细节。试一试并加入几个示例,看看效果如何!

提示:给马取三个名字,要求类似超级英雄的名字。

动物:猫
名称:萨伦猫侠(Saren Catman)神秘猫女(Mystique Catwoman)超能猫斯特拉(Supercat Stella)

动物:狗
名称:钢牙 (Steel Fang) 闪电犬 (Lightning Hound) 狼蜜蜂 (Wolf Bee)

动物:马
名称:

补全:

  1. 雷霆闪电马 (Thunderbolt)
  2. 烈焰战马 (Inferno)
  3. 钢铁蹄子马 (Ironhoof)

这就很不错了!可以看到,为给定输入添加输出示例后,是有助于模型提供我们想要的输出。

3. 调整设置:

提示词并不是您可以使用的唯一工具。您还可以通过调整相关设置来控制补全输出。最重要的设置之一称为热度(temperature)

您可能已经注意到,如果您在上面的示例中多次提交相同的提示,模型将始终返回相同或非常相似的补全。这是因为您的热度设置为0

如果将热度设置为1,重新提交几次相同的提示词。会发现,当热度高于 0 时,每次提交相同的提示会导致不同的完成。

请记住,模型预测哪个文本最有可能跟在它前面的文本之后。热度是一个介于 0 和 1 之间的值,基本上可以让您控制模型在进行这些预测时的置信度。降低热度意味着它将承担更少的风险,并且补全将更加准确和确定。升高热度将导致更多样化的补全。

对于这个宠物昵称生成器,您可能希望能够生成很多名字创意。0.6 的适中热度应该是合适的值。

3. 用代码来实现(Python):

  • 首先下载示例代码:

git clone https://github.com/openai/openai-quickstart-python.git

  • 添加API密钥:
  • 运行应用:
python -m venv venv
. venv/bin/activate
pip install -r requirements.txt
flask run
  • 在浏览器中打开http://localhost:5000

三、Python库:

$ pip install openai
import os
import openai

# Load your API key from an environment variable or secret management service
openai.api_key = os.getenv("OPENAI_API_KEY")

response = openai.Completion.create(model="text-davinci-003", prompt="Say this is a test", temperature=0, max_tokens=7)

四、模型(Modesl):

OpenAI API 由具有不同功能和价位的多种模型提供支持。

模型 描述
GPT-4 一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码
GPT-3.5 一组在 GPT-3 上改进的模型,可以理解并生成自然语言或代码
DALL.E 可以在给定自然语言提示的情况下生成和编辑图像的模型
Whisper 一种可以将音频转换为文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
Moderation 可以检测文本是否敏感或不安全的微调模型
GPT-3 一组可以理解和生成自然语言的模型

模型端点兼容性:

端点 模型
/v1/chat/completions gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001
/v1/edits text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptions whisper-1
/v1/audio/translations whisper-1
/v1/fine-tunes davinci, curie, babbage, ada
/v1/embeddings text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations text-moderation-stable, text-moderation-latest

GPT-4:

GPT-4 是一个大型多模态模型(现在能接受文本输入并给出文本输出,将来会出现图像输入),它可以比以前的任何模型更准确地解决难题。GPT-4 针对聊天进行了优化,但也适用于使用聊天完成 API 的传统补全任务。

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都更有力。

GPT-3.5:

GPT-3.5 模型可以理解并生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大且最具成本效益的模型**gpt-3.5-turbo**已针对聊天进行了优化,但也适用于传统的补全任务。

我们建议使用**gpt-3.5-turbo**模型,因为它的成本较低。

DALL.E:

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像。目前支持在输入提示词的情况下,创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

Whisper:

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过API 使用**whisper-1**模型名称获得。

目前, Whisper 的开源版本与通过API 提供的版本之间没有区别。然而,通过API提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。

Embeddings:

嵌入(Embedding)是文本的数字表示,可用于衡量两段文本之间的相关性。第二代Embedding模型**text-embedding-ada-002**旨在以一小部分成本取代之前的 16 种第一代嵌入模型。嵌入可用于搜索、聚类、推荐、异常检测和分类任务。

Moderation:

审核模型(Moderation)旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

GPT-3:

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始 GPT-3 基本模型(davincicurieadababbage)是当前唯一可用于微调的模型。

四、总结:

以上就是本系列文章的第一部分,介绍了如何使用OpenAI API和ChatGPT系列来生成文本。其中包括如何使用提示词和示例来控制模型的输出,以及如何调整设置来影响模型的置信度和多样性。此外,还提供了Python代码示例和各种模型的描述,包括GPT-4、GPT-3.5、DALL.E、Whisper、Embeddings、Moderation和GPT-3。

你可能感兴趣的:(AI,chatgpt,人工智能,大数据,nlp,ai)