OpenAI API 由具有不同功能和價位的多種模型提供支持。您還可以通過 fine-tuning 針對您的特定用例對我們的原始基礎模型進行有限的定制。
模型 | 描述 |
---|---|
GPT-4 | 一組在 GPT-3.5 上改進的模型,可以理解并生成自然語言或代碼 |
GPT-3.5 | 一組在 GPT-3 上改進的模型,可以理解并生成自然語言或代碼 |
DALL·E | 可以在給定自然語言提示的情況下生成和編輯圖像的模型 |
Whisper | 一種可以將音頻轉換為文本的模型 |
Embeddings | 一組可以將文本轉換為數(shù)字形式的模型 |
Codex | 一組可以理解和生成代碼的模型,包括將自然語言翻譯成代碼 |
Moderation | 可以檢測文本是否敏感或不安全的 fine-tuning 模型 |
GPT-3 | 一組可以理解和生成自然語言的模型 |
我們還發(fā)布了開源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。
GPT-4 是一個大型多模態(tài)模型(今天接受文本輸入并發(fā)出文本輸出,將來會出現(xiàn)圖像輸入),由于其更廣泛的常識和高級推理,它可以比我們以前的任何模型更準確地解決難題能力。與 gpt-3.5-turbo 一樣,GPT-4 針對聊天進行了優(yōu)化,但也適用于傳統(tǒng)的補全任務。
GPT-4 目前處于有限測試階段,只有獲得訪問權限的人才能訪問。請加入候補名單,以便在容量可用時獲得訪問權限。
最新模型 | 描述 | 最大 TOKENS | 訓練日期 |
---|---|---|---|
gpt-4 | 比任何 GPT-3.5 模型都更強大,能夠執(zhí)行更復雜的任務,并針對聊天進行了優(yōu)化。將使用我們最新的模型迭代進行更新。 | 8,192 tokens | Up to Sep 2021 |
gpt-4-0314 | 2023 年 3 月 14 日的 gpt-4 快照。與 gpt-4 不同,該模型不會收到更新,并且僅在 2023 年 6 月 14 日結束的三個月內提供支持。 |
8,192 tokens | Up to Sep 2021 |
gpt-4-32k | 與基本 gpt-4 模式相同的功能,但上下文長度是其 4 倍。將使用我們最新的模型迭代進行更新。 |
32,768 tokens | Up to Sep 2021 |
gpt-4-32k-0314 | 2023 年 3 月 14 日的 gpt-4-32 快照。與 gpt-4-32k 不同,此模型不會收到更新,并且僅在 2023 年 6 月 14 日結束的三個月內提供支持。 |
32,768 tokens | Up to Sep 2021 |
對于許多基本任務,GPT-4 和 GPT-3.5 模型之間的差異并不顯著。然而,在更復雜的推理情況下,GPT-4 比我們之前的任何模型都更有能力。
GPT-3.5 模型可以理解并生成自然語言或代碼。我們在 GPT-3.5 系列中功能最強大且最具成本效益的模型是 gpt-3.5-turbo,它已針對聊天進行了優(yōu)化,但也適用于傳統(tǒng)的完成任務。
最新模型 | 描述 | 最大 TOKENS | 訓練日期 |
---|---|---|---|
gpt-3.5-turbo | 功能最強大的 GPT-3.5 模型并針對聊天進行了優(yōu)化,成本僅為 text-davinci-003 的 1/10。將使用我們最新的模型迭代進行更新。 |
4,096 tokens | Up to Sep 2021 |
gpt-3.5-turbo-0301 | 2023 年 3 月 1 日的 gpt-3.5-turbo 快照。與 gpt-3.5-turbo 不同,此模型不會收到更新,并且僅在 2023 年 6 月 1 日結束的三個月內提供支持。 |
4,096 tokens | Up to Sep 2021 |
text-davinci-003 | 可以比 curie、babbage 或 ada 模型更好的質量、更長的輸出和一致的指令遵循來完成任何語言任務。還支持在文本中插入補全。 |
4,097 tokens | Up to Jun 2021 |
text-davinci-002 | 與 text-davinci-003 類似的功能,但使用supervised fine-tuning 而不是強化學習進行訓練 |
4,097 tokens | Up to Jun 2021 |
code-davinci-002 | 針對代碼完成任務進行了優(yōu)化 | 8,001 tokens | Up to Jun 2021 |
我們建議使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型,因為它的成本更低。
OpenAI 模型是不確定的,這意味著相同的輸入可以產生不同的輸出。將 temperature 設置為 0 將使輸出大部分具有確定性,但可能會保留少量可變性。
基于特定功能的模型
雖然新的 gpt-3.5-turbo 模型針對聊天進行了優(yōu)化,但它非常適合傳統(tǒng)的完成任務。原始 GPT-3.5 模型針對文本補全進行了優(yōu)化。
我們用于創(chuàng)建嵌入和編輯文本的端點使用它們自己的一組專用模型。
找到合適的模型
試用 gpt-3.5-turbo 是了解 API 功能的好方法。在您了解要完成的任務后,您可以繼續(xù)使用 gpt-3.5-turbo 或其他模型并嘗試圍繞其功能進行優(yōu)化。
您可以使用 GPT 比較工具,讓您并排運行不同的模型來比較輸出、設置和響應時間,然后將數(shù)據(jù)下載到 Excel 電子表格中。
DALL·E 是一個人工智能系統(tǒng),可以根據(jù)自然語言的描述創(chuàng)建逼真的圖像和藝術作品。我們目前支持在提示的情況下創(chuàng)建具有特定大小的新圖像、編輯現(xiàn)有圖像或創(chuàng)建用戶提供的圖像的變體的能力。
通過我們的 API 提供的當前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更準確且分辨率高 4 倍的圖像。
Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓練,也是一個多任務模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。 Whisper v2-large 模型目前可通過我們的 API 使用 whisper-1 模型名稱獲得。
目前,Whisper 的開源版本與通過我們的 API 提供的版本之間沒有區(qū)別。然而,通過我們的 API,我們提供了一個優(yōu)化的推理過程,這使得通過我們的 API 運行 Whisper 比通過其他方式運行要快得多。
嵌入是文本的數(shù)字表示,可用于衡量兩段文本之間的相關性。我們的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 種第一代嵌入模型。嵌入可用于搜索、聚類、推薦、異常檢測和分類任務。
Codex 模型是我們可以理解和生成代碼的 GPT-3 模型的后代。他們的訓練數(shù)據(jù)包含自然語言和來自 GitHub 的數(shù)十億行公共代碼。
他們最擅長 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十幾種語言。
我們目前提供兩種 Codex 型號:
最新模型 | 描述 | 最大 TOKENS | 訓練日期 |
---|---|---|---|
code-davinci-002 | 功能最強大的 Codex 型號。特別擅長將自然語言翻譯成代碼。除了補全代碼,還支持在代碼中插入補全。 |
8,001 tokens | Up to Jun 2021 |
code-cushman-001 | 幾乎與 Davinci Codex 一樣強大,但速度稍快。這種速度優(yōu)勢可能使其成為實時應用程序的首選。 | Up to 2,048 tokens |
Codex 模型在有限的測試版期間可以免費使用,并且會降低速率限制。當我們了解使用情況時,我們將尋求提供定價以支持廣泛的應用程序。
在此期間,只要符合我們的使用政策,歡迎您使用您的應用程序。我們歡迎在早期使用這些模型時提供任何反饋,并期待與社區(qū)互動。
特定功能模型
主要的 Codex 模型旨在與文本完成端點一起使用。我們還提供專門用于我們的端點以創(chuàng)建嵌入和編輯代碼的模型。
審核模型旨在檢查內容是否符合 OpenAI 的使用政策。這些模型提供了查找以下類別內容的分類功能:仇恨/威脅、自殘、性/未成年人、暴力圖片。
審核模型接受任意大小的輸入,該輸入會自動分解以修復模型特定的上下文窗口。
模型 | 描述 |
---|---|
text-moderation-latest | 最有能力的審核模型。精度會比穩(wěn)定模型略高 |
text-moderation-stable | 幾乎與最新型號一樣強大,但稍舊一些。 |
GPT-3 模型可以理解和生成自然語言。這些模型被更強大的 GPT-3.5 代模型所取代。然而,最初的 GPT-3 基礎模型(davinci、curie、ada 和 babbage)是目前唯一可用于微調的模型。
最新模型 | 描述 | 最大 TOKENS | 訓練日期 |
---|---|---|---|
text-curie-001 | 非常有能力,比 Davinci 更快,成本更低。 | 2,049 tokens | Up to Oct 2019 |
text-babbage-001 | 能夠執(zhí)行簡單的任務,速度非???,成本更低。 | 2,049 tokens | Up to Oct 2019 |
text-ada-001 | 能夠執(zhí)行非常簡單的任務,通常是 GPT-3 系列中最快的型號,而且成本最低。 | 2,049 tokens | Up to Oct 2019 |
davinci | 功能最強大的 GPT-3 模型??梢酝瓿善渌P涂梢酝瓿傻娜魏稳蝿?,而且通常質量更高。 | 2,049 tokens | Up to Oct 2019 |
curie | 能力很強,但比 Davinci 更快,成本更低。 | 2,049 tokens | Up to Oct 2019 |
babbage | 能夠執(zhí)行簡單的任務,速度非??欤杀靖?。 | 2,049 tokens | Up to Oct 2019 |
ada | 能夠執(zhí)行非常簡單的任務,通常是 GPT-3 系列中最快的型號,而且成本最低。 | 2,049 tokens | Up to Oct 2019 |
模型端點兼容性
端點 | 模型名稱 |
---|---|
/v1/chat/completions | gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301 |
/v1/completions | text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada |
/v1/edits text-davinci-edit-001 | text-davinci-edit-001, code-davinci-edit-001 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/fine-tunes | davinci, curie, babbage, ada |
/v1/embeddings | text-embedding-ada-002, text-search-ada-doc-001 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
此列表不包括我們的第一代嵌入模型和我們的 DALL·E 模型。
持續(xù)的模型升級
隨著 gpt-3.5-turbo 的發(fā)布,我們的一些模型現(xiàn)在正在不斷更新。為了減少模型更改以意外方式影響我們用戶的可能性,我們還提供將在 3 個月內保持靜態(tài)的模型版本。隨著模型更新的新節(jié)奏,我們還讓人們能夠貢獻評估,以幫助我們針對不同的用例改進模型。
以下模型是將在指定日期棄用的臨時快照。如果您想使用最新的模型版本,請使用標準模型名稱,如 gpt-4 或 gpt-3.5-turbo。
模型名稱 | 棄用日期 |
---|---|
gpt-3.5-turbo-0301 | June 1st, 2023 |
gpt-4-0314 | June 14th, 2023 |
gpt-4-32k-0314 | June 14th, 2023 |
更多建議: