閱讀(2.2k) 書簽贊(0) 我要糾錯

OpenAI API 模型

2023-03-16 15:42 更新

概述

OpenAI API 由具有不同功能和價位的多種模型提供支持。您還可以通過 fine-tuning 針對您的特定用例對我們的原始基礎模型進行有限的定制。

模型	描述
GPT-4	一組在 GPT-3.5 上改進的模型，可以理解并生成自然語言或代碼
GPT-3.5	一組在 GPT-3 上改進的模型，可以理解并生成自然語言或代碼
DALL·E	可以在給定自然語言提示的情況下生成和編輯圖像的模型
Whisper	一種可以將音頻轉換為文本的模型
Embeddings	一組可以將文本轉換為數(shù)字形式的模型
Codex	一組可以理解和生成代碼的模型，包括將自然語言翻譯成代碼
Moderation	可以檢測文本是否敏感或不安全的 fine-tuning 模型
GPT-3	一組可以理解和生成自然語言的模型

我們還發(fā)布了開源模型，包括 Point-E、Whisper、Jukebox 和 CLIP。

GPT-4

GPT-4 是一個大型多模態(tài)模型（今天接受文本輸入并發(fā)出文本輸出，將來會出現(xiàn)圖像輸入），由于其更廣泛的常識和高級推理，它可以比我們以前的任何模型更準確地解決難題能力。與 gpt-3.5-turbo 一樣，GPT-4 針對聊天進行了優(yōu)化，但也適用于傳統(tǒng)的補全任務。

GPT-4 目前處于有限測試階段，只有獲得訪問權限的人才能訪問。請加入候補名單，以便在容量可用時獲得訪問權限。

最新模型	描述	最大 TOKENS	訓練日期
gpt-4	比任何 GPT-3.5 模型都更強大，能夠執(zhí)行更復雜的任務，并針對聊天進行了優(yōu)化。將使用我們最新的模型迭代進行更新。	8,192 tokens	Up to Sep 2021
gpt-4-0314	2023 年 3 月 14 日的 gpt-4 快照。與 gpt-4 不同，該模型不會收到更新，并且僅在 2023 年 6 月 14 日結束的三個月內提供支持。	8,192 tokens	Up to Sep 2021
gpt-4-32k	與基本 gpt-4 模式相同的功能，但上下文長度是其 4 倍。將使用我們最新的模型迭代進行更新。	32,768 tokens	Up to Sep 2021
gpt-4-32k-0314	2023 年 3 月 14 日的 gpt-4-32 快照。與 gpt-4-32k 不同，此模型不會收到更新，并且僅在 2023 年 6 月 14 日結束的三個月內提供支持。	32,768 tokens	Up to Sep 2021

對于許多基本任務，GPT-4 和 GPT-3.5 模型之間的差異并不顯著。然而，在更復雜的推理情況下，GPT-4 比我們之前的任何模型都更有能力。

GPT-3.5

GPT-3.5 模型可以理解并生成自然語言或代碼。我們在 GPT-3.5 系列中功能最強大且最具成本效益的模型是 gpt-3.5-turbo，它已針對聊天進行了優(yōu)化，但也適用于傳統(tǒng)的完成任務。

最新模型	描述	最大 TOKENS	訓練日期
gpt-3.5-turbo	功能最強大的 GPT-3.5 模型并針對聊天進行了優(yōu)化，成本僅為 text-davinci-003 的 1/10。將使用我們最新的模型迭代進行更新。	4,096 tokens	Up to Sep 2021
gpt-3.5-turbo-0301	2023 年 3 月 1 日的 gpt-3.5-turbo 快照。與 gpt-3.5-turbo 不同，此模型不會收到更新，并且僅在 2023 年 6 月 1 日結束的三個月內提供支持。	4,096 tokens	Up to Sep 2021
text-davinci-003	可以比 curie、babbage 或 ada 模型更好的質量、更長的輸出和一致的指令遵循來完成任何語言任務。還支持在文本中插入補全。	4,097 tokens	Up to Jun 2021
text-davinci-002	與 text-davinci-003 類似的功能，但使用supervised fine-tuning 而不是強化學習進行訓練	4,097 tokens	Up to Jun 2021
code-davinci-002	針對代碼完成任務進行了優(yōu)化	8,001 tokens	Up to Jun 2021

我們建議使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型，因為它的成本更低。

OpenAI 模型是不確定的，這意味著相同的輸入可以產生不同的輸出。將 temperature 設置為 0 將使輸出大部分具有確定性，但可能會保留少量可變性。

基于特定功能的模型

雖然新的 gpt-3.5-turbo 模型針對聊天進行了優(yōu)化，但它非常適合傳統(tǒng)的完成任務。原始 GPT-3.5 模型針對文本補全進行了優(yōu)化。

我們用于創(chuàng)建嵌入和編輯文本的端點使用它們自己的一組專用模型。

找到合適的模型

試用 gpt-3.5-turbo 是了解 API 功能的好方法。在您了解要完成的任務后，您可以繼續(xù)使用 gpt-3.5-turbo 或其他模型并嘗試圍繞其功能進行優(yōu)化。

您可以使用 GPT 比較工具，讓您并排運行不同的模型來比較輸出、設置和響應時間，然后將數(shù)據(jù)下載到 Excel 電子表格中。

DALL·E

DALL·E 是一個人工智能系統(tǒng)，可以根據(jù)自然語言的描述創(chuàng)建逼真的圖像和藝術作品。我們目前支持在提示的情況下創(chuàng)建具有特定大小的新圖像、編輯現(xiàn)有圖像或創(chuàng)建用戶提供的圖像的變體的能力。

通過我們的 API 提供的當前 DALL·E 模型是 DALL·E 的第 2 次迭代，具有比原始模型更逼真、更準確且分辨率高 4 倍的圖像。

Whisper

Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練，也是一個多任務模型，可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。 Whisper v2-large 模型目前可通過我們的 API 使用 whisper-1 模型名稱獲得。

目前，Whisper 的開源版本與通過我們的 API 提供的版本之間沒有區(qū)別。然而，通過我們的 API，我們提供了一個優(yōu)化的推理過程，這使得通過我們的 API 運行 Whisper 比通過其他方式運行要快得多。

Embeddings

嵌入是文本的數(shù)字表示，可用于衡量兩段文本之間的相關性。我們的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 種第一代嵌入模型。嵌入可用于搜索、聚類、推薦、異常檢測和分類任務。

Codex

Codex 模型是我們可以理解和生成代碼的 GPT-3 模型的后代。他們的訓練數(shù)據(jù)包含自然語言和來自 GitHub 的數(shù)十億行公共代碼。

他們最擅長 Python，精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL，甚至 Shell 等十幾種語言。

我們目前提供兩種 Codex 型號：

最新模型	描述	最大 TOKENS	訓練日期
code-davinci-002	功能最強大的 Codex 型號。特別擅長將自然語言翻譯成代碼。除了補全代碼，還支持在代碼中插入補全。	8,001 tokens	Up to Jun 2021
code-cushman-001	幾乎與 Davinci Codex 一樣強大，但速度稍快。這種速度優(yōu)勢可能使其成為實時應用程序的首選。	Up to 2,048 tokens

Codex 模型在有限的測試版期間可以免費使用，并且會降低速率限制。當我們了解使用情況時，我們將尋求提供定價以支持廣泛的應用程序。

在此期間，只要符合我們的使用政策，歡迎您使用您的應用程序。我們歡迎在早期使用這些模型時提供任何反饋，并期待與社區(qū)互動。

特定功能模型

主要的 Codex 模型旨在與文本完成端點一起使用。我們還提供專門用于我們的端點以創(chuàng)建嵌入和編輯代碼的模型。

審核

審核模型旨在檢查內容是否符合 OpenAI 的使用政策。這些模型提供了查找以下類別內容的分類功能：仇恨/威脅、自殘、性/未成年人、暴力圖片。

審核模型接受任意大小的輸入，該輸入會自動分解以修復模型特定的上下文窗口。

模型	描述
text-moderation-latest	最有能力的審核模型。精度會比穩(wěn)定模型略高
text-moderation-stable	幾乎與最新型號一樣強大，但稍舊一些。

GPT-3

GPT-3 模型可以理解和生成自然語言。這些模型被更強大的 GPT-3.5 代模型所取代。然而，最初的 GPT-3 基礎模型（davinci、curie、ada 和 babbage）是目前唯一可用于微調的模型。

最新模型	描述	最大 TOKENS	訓練日期
text-curie-001	非常有能力，比 Davinci 更快，成本更低。	2,049 tokens	Up to Oct 2019
text-babbage-001	能夠執(zhí)行簡單的任務，速度非?？?，成本更低。	2,049 tokens	Up to Oct 2019
text-ada-001	能夠執(zhí)行非常簡單的任務，通常是 GPT-3 系列中最快的型號，而且成本最低。	2,049 tokens	Up to Oct 2019
davinci	功能最強大的 GPT-3 模型?？梢酝瓿善渌Ｐ涂梢酝瓿傻娜魏稳蝿?，而且通常質量更高。	2,049 tokens	Up to Oct 2019
curie	能力很強，但比 Davinci 更快，成本更低。	2,049 tokens	Up to Oct 2019
babbage	能夠執(zhí)行簡單的任務，速度非?？欤杀靖?。	2,049 tokens	Up to Oct 2019
ada	能夠執(zhí)行非常簡單的任務，通常是 GPT-3 系列中最快的型號，而且成本最低。	2,049 tokens	Up to Oct 2019

模型端點兼容性

端點	模型名稱
/v1/chat/completions	gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions	text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada
/v1/edits text-davinci-edit-001	text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/fine-tunes	davinci, curie, babbage, ada
/v1/embeddings	text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations	text-moderation-stable, text-moderation-latest

此列表不包括我們的第一代嵌入模型和我們的 DALL·E 模型。

持續(xù)的模型升級

隨著 gpt-3.5-turbo 的發(fā)布，我們的一些模型現(xiàn)在正在不斷更新。為了減少模型更改以意外方式影響我們用戶的可能性，我們還提供將在 3 個月內保持靜態(tài)的模型版本。隨著模型更新的新節(jié)奏，我們還讓人們能夠貢獻評估，以幫助我們針對不同的用例改進模型。

以下模型是將在指定日期棄用的臨時快照。如果您想使用最新的模型版本，請使用標準模型名稱，如 gpt-4 或 gpt-3.5-turbo。

模型名稱	棄用日期
gpt-3.5-turbo-0301	June 1st, 2023
gpt-4-0314	June 14th, 2023
gpt-4-32k-0314	June 14th, 2023

以上內容是否對您有幫助：

← OpenAI API 庫

OpenAI API 文本補全 →

寫筆記

我要補充