產生式人工智慧 (AI) 是一種電腦程式,可以根據人類提示產生內容。
閱讀本文後,您將能夠:
複製文章連結
產生式人工智慧 (AI) 是一種深度學習模型,可根據提示產生文字、影像、電腦程式碼和視聽內容。
產生式 AI 模型是在大量的原始資料上進行訓練的——通常,這些資料是它們被構建用來產生的相同類型的資料。從這些資料中,它們學會在給出任意輸入時形成回應,這些回應在統計上可能與這些輸入相關。例如,一些產生式 AI 模型經過大量文字的訓練,以便能夠以看似自然且原始的方式回應書面提示。
簡而言之,產生式 AI 可以像人類藝術家或作家一樣對請求做出反應,但速度更快。這些模型產生的內容是否可以被認為是「新的」或「原創的」還有待爭論,但在許多情況下它們可以比得上或超過某些人類的創造力。
流行的產生式 AI 模型包括用於產生文字的 ChatGPT 和用於產生影像的 DALL-E。許多組織也建立了自己的模型。
產生式 AI 是機器學習的一種,這意味著它依靠數學分析來尋找相關概念、影像或模式。然後,它使用此分析來產生統計上可能與其收到的提示相似或相關的內容。
具體來說,產生式 AI 依賴一種稱為深度學習的機器學習。深度學習模型足夠強大,可以從未標記資料中學習。它們使用一種稱為神經網路的運算架構。這種架構由多個節點組成,這些節點相互傳遞資料,類似於人腦透過神經元傳遞資料的方式。神經網路能夠執行高度複雜和精細的任務。
能夠解釋語言的產生式 AI 模型需要理解的不僅僅是單字。它們必須能夠解釋整個句子、段落和文件。早期的機器學習模型很難理解整個句子,並且在到達結尾時會「忘記」句子的開頭,從而導致誤解。
現代產生式 AI 模型使用一種稱為 Transformer 的特定神經網路。它們使用一種稱為「自註意力」的功能來偵測序列中的元素如何連接。Transformer 讓產生式 AI 模型能夠處理大塊文字並將其置於上下文中,而不僅僅是處理單字和短語。
要使其正常運作,必須向產生式 AI 模型提供大量資料:在大多數情況下,比人類一生能夠處理的資料還要多。例如,大型語言模型 ChatGPT 使用了數百萬份文件進行訓練。影像產生器可能會接受數百萬張影像的訓練,程式碼產生器可能會接受數十億行程式碼的訓練。
這些訓練資料儲存在向量資料庫中。在這樣的資料庫中,資料點儲存為向量,或者說是多維欄位中的一組座標。正如緯度和經度使人們能夠在查看地圖時找到附近的位置一樣,將資料儲存為向量使機器學習模型能夠找到「附近」的資料點。這使得模型能夠建立關聯並理解單字、影像、聲音或任何其他類型內容的上下文。
一旦產生式 AI 模型達到一定程度的精調,它就不需要那麼多的資料來產生結果。例如,語音產生 AI 模型可能需要數千小時的錄音進行訓練。但一旦經過精調,一些模型只需要幾秒鐘的樣本錄音就可以真實地模仿某人的聲音。
產生式 AI 模型越來越受歡迎,因為它們提供了許多潛在的好處。這些好處包括但不限於:
然而,產生式 AI 也有其缺點,包括:
「大型語言模型」(LLM) 是產生式 AI 模型的技術詞彙,可以處理語言並產生文字,包括人類口語和程式設計語言。熱門的 LLM 包括 ChatGPT(來自 OpenAI)、Llama(來自 Meta)、Bard(來自 Google)、Copilot(來自 GitHub)和 Bing Chat(來自 Microsoft)。
AI 影像產生器的工作原理與 LLM 類似,但針對的是影像而不是文字。DALL-E 和 Midjourney 就是兩個流行的基於產生式 AI 的影像產生器。
Cloudflare 讓開發人員和企業能夠建立自己的產生式 AI 模型。Cloudflare 提供 Vectorize,讓開發人員可以根據自己的資料在 Cloudflare 全球網路上產生和儲存嵌入,並提供 Cloudflare Workers AI,以便在全球 GPU 網路上執行產生式 AI 任務。詳細瞭解 Cloudflare 如何支援新一代產生式 AI。