官方已有模型 Model

root

概述

OpenAI API由一组具有不同能力和价位的多样化模型驱动。你也可以针对你的具体使用情况对我们的原始基础模型进行有限的定制，并进行微调。

模型描述

GPT-3.5 一组在GPT-3基础上改进的模型，可以理解以及生成自然语言或代码
DALL-E 一个可以生成和编辑自然语言提示的图像的模型
Whisper 一个能将音频转换成文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
CodexLimited beta 一组能够理解和生成代码的模型，包括将自然语言翻译成代码
Moderation 一套可以检测文本是否敏感或不安全的微调模型
GPT-3 一套可以理解和生成自然语言的模型
我们还发布了开放源代码模型，包括Point-E、Whisper、Jukebox和CLIP。

访问我们的研究人员的模型索引，了解更多关于哪些模型在我们的研究论文中出现过，以及InstructGPT和GPT-3.5等模型系列之间的区别。

GPT-3.5

GPT-3.5模型可以理解并生成自然语言或代码。我们最具能力和成本效益的模型是GPT-3.5-turbo，它针对聊天进行了优化，但对传统的完成任务也很有效。

gpt-3.5-turbo 最有能力的GPT-3.5模型，为聊天进行了优化，成本是text-davinci-003的1/10。将根据我们最新的模型迭代进行更新。 4,096个tokens 训练数据 截至2021年9月
gpt-3.5-turbo-0301 从2023年3月1日起，gpt-3.5-turbo的快照。与gpt-3.5-turbo不同的是，该模型不会收到更新，只在2023年6月1日结束的三个月内得到支持。
text-davinci-003 可以完成任何语言任务，与Curie、Babbage或ada模型相比，具有更好的质量、更长的输出和一致的指令遵循。还支持在文本中插入补语。4,000个tokens训练数据 到2021年6月为止
text-davinci-002 与text-davinci-003的功能相似，但用监督下的微调而不是强化学习进行训练 4,000 tokens 训练数据到2021年6月为止
code-davinci-002 针对代码完成任务进行了优化 4,000个标记训练数据 直至2021年6月
我们建议在实验中使用gpt-3.5-turbo，因为它将产生最好的结果。一旦你得到了工作，我们鼓励你尝试其他模型，看看你是否能以更低的延迟或成本获得同样的结果。

OpenAI模型是非决定性的，这意味着相同的输入可以产生不同的输出。将temperature 设置为0将使输出大部分是确定的，但可能仍有少量的变异性。

特定功能的模型

虽然新的GPT-3.5-turbo模型针对聊天进行了优化，但它对传统的完成任务非常有效。原来的GPT-3.5模型是为文本完成而优化的。

我们用于创建嵌入和编辑文本的端点使用他们自己的专门模型集。

Turbo

Turbo是支持ChatGPT的同一个模型系列。它为对话式聊天的输入和输出进行了优化，但与Davinci模型系列相比，它在完成度方面同样表现出色。任何能在ChatGPT中完成的用例都应该在API中的Turbo模型系列中表现良好。

Turbo模型家族也是第一个像ChatGPT一样定期接受模型更新的。
擅长对话和文本生成

Davinci

Davinci是能力最强的模型家族，可以完成其他模型（ada、curie和babbage）可以完成的任何任务，而且往往只需较少的指令。对于需要大量理解内容的应用，如针对特定受众的总结和创造性内容的生成，Davinci将产生最好的结果。这些增加的能力需要更多的计算资源，所以Davinci每次API调用的成本更高，而且速度不如其他模型。

Davinci的另一个闪光点是在理解文本的意图方面。Davinci在解决许多种类的逻辑问题和解释人物的动机方面相当出色。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长于复杂的意图，因果关系，为受众总结

Curie

Curie的功能非常强大，但速度也非常快。虽然Davinci在分析复杂文本时更强大，但Curie对于许多细微的任务，如情感分类和总结，都相当有能力。Curie在回答问题和进行问答方面也相当出色，并且作为一个一般的服务聊天机器人。

擅长语言翻译、复杂分类、文本情感、总结

Babbage

Babbage可以执行简单的分类等直接任务。当涉及到语义搜索时，它也有相当的能力，对文档与搜索查询的匹配程度进行排名。

擅长适度分类，语义搜索分类

Ada

Ada通常是最快的模型，可以执行诸如解析文本、地址更正和某些不需要太多细微差别的分类任务。Ada的性能通常可以通过提供更多的上下文来提高。

擅长解析文本，简单分类，地址更正，关键词

注意：任何由Ada这样的快速模型执行的任务都可以由Curie或Davinci这样的更强大的模型执行。

root

寻找正确的模型

用gpt-3.5-turbo做实验是发现API能做什么的一个好方法。在你对你想要完成的任务有了一个想法之后，你可以继续使用gpt-3.5-turbo或其他模型，并尝试围绕其能力进行优化。

你可以使用GPT比较工具，让你并排运行不同的模型来比较输出、设置和响应时间，然后将数据下载到Excel电子表格中。

DALL-E

DALL-E是一个人工智能系统，可以从自然语言的描述中创建逼真的图像和艺术。我们目前支持的能力是，在给定的提示下，创建具有一定尺寸的新图像，编辑现有的图像，或创建用户提供的图像的变化。

目前通过我们的API提供的DALL-E模型是DALL-E的第二次迭代，它比原来的模型更真实、更准确，并且具有4倍的分辨率。你可以通过我们的实验室界面或通过API来尝试它。

Whisper

Whisper是一个通用的语音识别模型。它是在一个大型的多样化音频数据集上训练出来的，也是一个多任务模型，可以进行多语言语音识别以及语音翻译和语言识别。Whisper v2-large模型目前可通过我们的API获得，模型名称为whisper-1。

目前，Whisper的开源版本和通过我们的API提供的版本之间没有区别。然而，通过我们的API，我们提供了一个优化的推理过程，这使得通过我们的API运行Whisper比通过其他方式运行要快得多。关于Whisper的更多技术细节，你可以阅读该论文。

Embeddings

Embeddings是文本的一种数字表示，可用于衡量两段文本之间的关系。我们的第二代嵌入模型，text-embedding-ada-002，旨在以极低的成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务都很有用。你可以在公告博文中阅读更多关于我们最新的嵌入模型。

Codex 有限测试版

Codex模型是我们GPT-3模型的后代，可以理解和生成代码。他们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。了解更多。

它们在Python中的能力最强，精通十几种语言，包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL，甚至Shell。

我们目前提供两种Codex模式。

code-davinci-002 最有能力的Codex模型。特别擅长于将自然语言翻译成代码。除了完成代码外，还支持在代码中插入补全内容。
code-cushman-001 几乎与Davinci Codex的能力相同，但速度稍快。这一速度优势可能使其更适合于实时应用。最多2,048个令牌
更多信息，请访问我们的Codex工作指南。

在有限的测试期间，Codex模型是免费使用的，并受到降低的速率限制。随着我们对使用情况的了解，我们将寻求提供定价，以实现广泛的应用。

在此期间，只要你的应用遵循我们的使用政策，我们就欢迎你上线。在早期使用过程中，我们欢迎对这些模式的任何反馈，并期待着与社区互动。

特定功能的模型

主要的Codex模型是为了与文本完成端点一起使用。我们还提供专门用于创建嵌入和编辑代码的端点的模型。

Moderation

Moderation模型旨在检查内容是否符合OpenAI的使用政策。这些模型提供了分类功能，可以查找以下类别的内容：仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。你可以在我们的审核指南中了解更多。

text-moderation-latest 最有能力的审核模式。准确度会比稳定模式略高一些
text-moderation-stable 几乎与最新的模型一样有能力，但略显老旧。

GPT-3

GPT-3模型可以理解和生成自然语言。这些模型被更强大的GPT-3.5代模型所取代。然而，最初的GPT-3基础模型（Davinci、Curie、ada和Babbage）是目前唯一可以进行微调的模型。

text-curie-001 能力很强，速度快，成本比Davinci低。 2,048 tokens 训练数据到2019年10月
text-babe-001 能够完成简单的任务，速度非常快，成本较低。 2,048 tokens 训练数据截至2019年10月
text-ada-001 能够完成非常简单的任务，通常是GPT-3系列中最快的型号，成本最低。 2,048 tokens Up to Oct 2019
davinci 最有能力的GPT-3模型。可以做任何其他型号可以做的任务，通常质量更高。 2,048代币 训练数据截至2019年10月
curie 能力很强，但比Davinci更快，成本更低。
babbage 能够完成简单的任务，速度非常快，而且成本较低。
ada 能够完成非常简单的任务，通常是GPT-3系列中最快的型号，成本最低。 2,048代币 训练数据到2019年10月