什麼是產生式 AI?

產生式人工智慧 (AI) 是一種電腦程式,可以根據人類提示產生內容。

學習目標

閱讀本文後,您將能夠:

  • 定義產生式 AI
  • 說明產生式 AI 的工作原理
  • 列出產生式 AI 的優點和缺點

複製文章連結

什麼是產生式 AI?

產生式人工智慧 (AI) 是一種深度學習模型,可根據提示產生文字、影像、電腦程式碼和視聽內容。

產生式 AI 模型是在大量的原始資料上進行訓練的——通常,這些資料是它們被構建用來產生的相同類型的資料。從這些資料中,它們學會在給出任意輸入時形成回應,這些回應在統計上可能與這些輸入相關。例如,一些產生式 AI 模型經過大量文字的訓練,以便能夠以看似自然且原始的方式回應書面提示。

簡而言之,產生式 AI 可以像人類藝術家或作家一樣對請求做出反應,但速度更快。這些模型產生的內容是否可以被認為是「新的」或「原創的」還有待爭論,但在許多情況下它們可以比得上或超過某些人類的創造力。

流行的產生式 AI 模型包括用於產生文字的 ChatGPT 和用於產生影像的 DALL-E。許多組織也建立了自己的模型。

產生式 AI 如何運作?

機器學習、深度學習和神經網路

產生式 AI 是機器學習的一種,這意味著它依靠數學分析來尋找相關概念、影像或模式。然後,它使用此分析來產生統計上可能與其收到的提示相似或相關的內容。

具體來說,產生式 AI 依賴一種稱為深度學習的機器學習。深度學習模型足夠強大,可以從未標記資料中學習。它們使用一種稱為神經網路的運算架構。這種架構由多個節點組成,這些節點相互傳遞資料,類似於人腦透過神經元傳遞資料的方式。神經網路能夠執行高度複雜和精細的任務。

Transformer 和自註意力

能夠解釋語言的產生式 AI 模型需要理解的不僅僅是單字。它們必須能夠解釋整個句子、段落和文件。早期的機器學習模型很難理解整個句子,並且在到達結尾時會「忘記」句子的開頭,從而導致誤解。

現代產生式 AI 模型使用一種稱為 Transformer 的特定神經網路。它們使用一種稱為「自註意力」的功能來偵測序列中的元素如何連接。Transformer 讓產生式 AI 模型能夠處理大塊文字並將其置於上下文中,而不僅僅是處理單字和短語。

訓練資料

要使其正常運作,必須向產生式 AI 模型提供大量資料:在大多數情況下,比人類一生能夠處理的資料還要多。例如,大型語言模型 ChatGPT 使用了數百萬份文件進行訓練。影像產生器可能會接受數百萬張影像的訓練,程式碼產生器可能會接受數十億行程式碼的訓練。

這些訓練資料儲存在向量資料庫中。在這樣的資料庫中,資料點儲存為向量,或者說是多維欄位中的一組座標。正如緯度和經度使人們能夠在查看地圖時找到附近的位置一樣,將資料儲存為向量使機器學習模型能夠找到「附近」的資料點。這使得模型能夠建立關聯並理解單字、影像、聲音或任何其他類型內容的上下文。

一旦產生式 AI 模型達到一定程度的精調,它就不需要那麼多的資料來產生結果。例如,語音產生 AI 模型可能需要數千小時的錄音進行訓練。但一旦經過精調,一些模型只需要幾秒鐘的樣本錄音就可以真實地模仿某人的聲音。

產生式 AI 有哪些優點和缺點?

產生式 AI 模型越來越受歡迎,因為它們提供了許多潛在的好處。這些好處包括但不限於:

  • 內容構思:使用產生式 AI 可以幫助內容創作者更快提出創意方向。
  • 更好的聊天機器人:產生式 AI 模型可以整合到聊天機器人中,以便更好地回答客戶問題、吸引潛在客戶等。
  • 增強研究:產生式 AI 模型可以快速處理大量資料,包括醫學資料或科學研究,以幫助科研工作。
  • 改進搜尋結果:搜尋引擎和虛擬助理可以整合產生式 AI 功能,以更快地提供相關資訊來回應查詢。
  • 娛樂:許多人使用公開的產生式 AI 工具只是為了好玩。
  • 其他好處:AI 是一個快速發展的領域,產生式 AI 的更多好處仍在探索中。

然而,產生式 AI 也有其缺點,包括:

  • 幻覺和其他不準確之處:產生式 AI 模型通常非常擅長識別模式,但有時它們會識別實際上並不存在的模式。這可能會導致模型提供錯誤資訊,這種現象稱為「幻覺」。此外,產生式 AI 模型的準確性取決於提供給它們的資料,並且在無法存取來源資料的情況下,很難對產生式 AI 輸出進行事實檢查。
  • 資料外洩:模型可以獲得提示中輸入的資料,並可能在意想不到的環境中洩漏這些資料。已有多家大型企業因這種方式而意外洩漏機密資訊或原始程式碼。
  • 意外抄襲或濫用智慧財產權:由於產生式 AI 模型是基於預先存在的內容,因此它們可能會在未經內容原作者或版權所有者許可的情況下複製被提供的內容。
  • 惡意回應操縱:攻擊者可以將資料提供給產生式 AI 模型,使其為其他使用者產生危險或不安全的資訊。
  • 偏見:訓練模型時輸入的資訊中的任何偏見都可能保留甚至加劇,除非對模型進行微調以修正這些偏見。即便如此,在不審查整個訓練集的情況下確保結果不存在偏見幾乎是不可能的。

什麼是大型語言模型 (LLM)?

大型語言模型」(LLM) 是產生式 AI 模型的技術詞彙,可以處理語言並產生文字,包括人類口語和程式設計語言。熱門的 LLM 包括 ChatGPT(來自 OpenAI)、Llama(來自 Meta)、Bard(來自 Google)、Copilot(來自 GitHub)和 Bing Chat(來自 Microsoft)。

什麼是 AI 影像產生器?

AI 影像產生器的工作原理與 LLM 類似,但針對的是影像而不是文字。DALL-E 和 Midjourney 就是兩個流行的基於產生式 AI 的影像產生器。

Cloudflare 是否支援產生式 AI 開發?

Cloudflare 讓開發人員和企業能夠建立自己的產生式 AI 模型。Cloudflare 提供 Vectorize,讓開發人員可以根據自己的資料在 Cloudflare 全球網路上產生和儲存嵌入,並提供 Cloudflare Workers AI,以便在全球 GPU 網路上執行產生式 AI 任務。詳細瞭解 Cloudflare 如何支援新一代產生式 AI