寻找正确的模型
用gpt-3.5-turbo做实验是发现API能做什么的一个好方法。在你对你想要完成的任务有了一个想法之后,你可以继续使用gpt-3.5-turbo或其他模型,并尝试围绕其能力进行优化。
你可以使用GPT比较工具,让你并排运行不同的模型来比较输出、设置和响应时间,然后将数据下载到Excel电子表格中。
DALL-E
DALL-E是一个人工智能系统,可以从自然语言的描述中创建逼真的图像和艺术。我们目前支持的能力是,在给定的提示下,创建具有一定尺寸的新图像,编辑现有的图像,或创建用户提供的图像的变化。
目前通过我们的API提供的DALL-E模型是DALL-E的第二次迭代,它比原来的模型更真实、更准确,并且具有4倍的分辨率。你可以通过我们的实验室界面或通过API来尝试它。
Whisper
Whisper是一个通用的语音识别模型。它是在一个大型的多样化音频数据集上训练出来的,也是一个多任务模型,可以进行多语言语音识别以及语音翻译和语言识别。Whisper v2-large模型目前可通过我们的API获得,模型名称为whisper-1。
目前,Whisper的开源版本和通过我们的API提供的版本之间没有区别。然而,通过我们的API,我们提供了一个优化的推理过程,这使得通过我们的API运行Whisper比通过其他方式运行要快得多。关于Whisper的更多技术细节,你可以阅读该论文。
Embeddings
Embeddings是文本的一种数字表示,可用于衡量两段文本之间的关系。我们的第二代嵌入模型,text-embedding-ada-002,旨在以极低的成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务都很有用。你可以在公告博文中阅读更多关于我们最新的嵌入模型。
Codex 有限测试版
Codex模型是我们GPT-3模型的后代,可以理解和生成代码。他们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。了解更多。
它们在Python中的能力最强,精通十几种语言,包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至Shell。
我们目前提供两种Codex模式。
code-davinci-002 最有能力的Codex模型。特别擅长于将自然语言翻译成代码。除了完成代码外,还支持在代码中插入补全内容。
code-cushman-001 几乎与Davinci Codex的能力相同,但速度稍快。这一速度优势可能使其更适合于实时应用。 最多2,048个令牌
更多信息,请访问我们的Codex工作指南。
在有限的测试期间,Codex模型是免费使用的,并受到降低的速率限制。随着我们对使用情况的了解,我们将寻求提供定价,以实现广泛的应用。
在此期间,只要你的应用遵循我们的使用政策,我们就欢迎你上线。在早期使用过程中,我们欢迎对这些模式的任何反馈,并期待着与社区互动。
特定功能的模型
主要的Codex模型是为了与文本完成端点一起使用。我们还提供专门用于创建嵌入和编辑代码的端点的模型。
Moderation
Moderation模型旨在检查内容是否符合OpenAI的使用政策。这些模型提供了分类功能,可以查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。你可以在我们的审核指南中了解更多。
text-moderation-latest 最有能力的审核模式。准确度会比稳定模式略高一些
text-moderation-stable 几乎与最新的模型一样有能力,但略显老旧。
GPT-3
GPT-3模型可以理解和生成自然语言。这些模型被更强大的GPT-3.5代模型所取代。然而,最初的GPT-3基础模型(Davinci、Curie、ada和Babbage)是目前唯一可以进行微调的模型。
text-curie-001 能力很强,速度快,成本比Davinci低。 2,048 tokens
训练数据到2019年10月
text-babe-001 能够完成简单的任务,速度非常快,成本较低。 2,048 tokens
训练数据截至2019年10月
text-ada-001 能够完成非常简单的任务,通常是GPT-3系列中最快的型号,成本最低。 2,048 tokens
Up to Oct 2019
davinci 最有能力的GPT-3模型。可以做任何其他型号可以做的任务,通常质量更高。 2,048代币
训练数据截至2019年10月
curie 能力很强,但比Davinci更快,成本更低。
babbage 能够完成简单的任务,速度非常快,而且成本较低。
ada 能够完成非常简单的任务,通常是GPT-3系列中最快的型号,成本最低。 2,048代币
训练数据到2019年10月