AI 幻覺是生成式 AI 模型給出的不正確或錯誤回應。
閱讀本文後,您將能夠:
相關內容
訂閱 TheNET,這是 Cloudflare 每月對網際網路上最流行見解的總結!
複製文章連結
人工智慧 (AI) 幻覺是指生成式 AI 模型輸出的虛假或不準確資訊。這些錯誤往往隱藏在看似合乎邏輯或其他方面正確的內容中。隨著生成式 AI 和大型語言模型 (LLM) 的使用越來越廣泛,人們已經觀察到許多 AI 幻覺的案例。
「幻覺」這個詞是比喻性的,AI 模型實際上並不會像精神異常的人類那樣真的產生幻覺,而是指它們會根據提示詞產生與現實不符的意外輸出。它們可能會錯誤識別模式、誤解上下文,或從有限或有偏見的資料中獲取這些意外輸出。
一些記錄在案的 AI 幻覺範例包括:
雖然 AI 有許多使用案例和現實世界應用,但在許多情況下,AI 模型容易產生幻覺,這意味著不能在沒有人類監督的情況下完全依賴 AI。
所有 AI 模型都由訓練資料和演算法組成。在 AI 的語境中,演算法是一組規則,規定了電腦程式應如何加權或評估某些屬性。AI 演算法包含數十億個參數,即關於如何評估屬性的規則。
生成式 AI 需要訓練資料,因為它透過數百萬(或數十億、數萬億)個範例來學習。從這些範例中,生成式 AI 模型可以學習識別資料集中項目之間的關係——通常使用將資料儲存為向量的向量資料庫,使模型能夠量化和測量資料項目之間的關係。(「向量」是不同資料類型的數位表示,包括文字或影像等非數學類型。)
模型訓練完成後,它會根據收到的提示詞不斷完善其輸出。其開發人員還會針對更具體的用途對該模型進行微調,繼續改變演算法的參數,或者使用低秩適應 (LoRA) 等方法來快速調整模型以適應新的用途。
總而言之,最終將得出一個模型,它可以根據之前饋入的樣本產生文字或影像,從而回應人類的提示詞。
然而,人類提示詞的複雜程度可能差異巨大,並會導致模型出現意外的行為,因為模型不可能為所有可能的提示詞做好準備。而且,即使在大量的訓練和微調之後,模型也可能會誤解或曲解概念和項目之間的關係。意外的提示和對模式的錯誤感知可能導致 AI 產生幻覺。
訓練資料的來源:審查訓練資料並非易事,因為 AI 模型需要的資料太多,人類無法審查全部。未經審查的訓練資料可能不正確或在某個方向上權重過大。想像一下,一個 AI 模型被訓練來寫賀卡,但它的訓練資料集最終主要包含生日賀卡,而開發人員對此並不知情。因此,它可能會在不適當的情境下生成快樂或有趣的資訊,例如當被提示寫一張「早日康復」的祝福卡時。
生成式 AI 設計的固有局限性:AI 模型利用概率來「預測」哪些文字或視覺元素可能會一起出現。統計分析可以協助電腦建立看似合理的內容——更有可能被人類理解的內容。但統計分析是一個數學過程,可能會錯過一些語言和含義的細微差別,從而導致幻覺。
缺乏對現實世界的直接體驗:如今的 AI 程式無法偵測在外部現實中某件事是「真」還是「假」。例如,人類可以透過實驗來確定某個科學原理的對錯,而 AI 目前只能在預先存在的內容上進行自我訓練,而不能直接在實際宇宙中進行訓練。因此,它很難區分準確和不準確的資料,尤其是在它自己的回應中。
難以理解上下文:AI 只看文字資料,可能無法理解文化或情感背景,導致產生不相關的回應和 AI 幻覺。例如,諷刺可能會讓 AI 感到困惑(甚至人類也經常將諷刺與事實混淆)。
偏見:如果資料集不夠廣泛,所使用的訓練資料可能會導致內在偏見。偏見可能會使 AI 模型傾向於給出某些類型的答案,甚至可能導致種族或性別刻板印象的傳播。
針對模型的攻擊:惡意者可以使用提示詞插入攻擊來改變生成式 AI 模型感知提示和產生結果的方式。一個廣為人知的範例發生在 2016 年,當時 Microsoft 推出了聊天機器人 Tay,但由於 Twitter(現為 X)使用者向其提供扭曲其回應的資訊,該機器人在一天之內就開始產生種族主義和性別歧視內容。從那時起,AI 模型變得更加精密,但仍然容易受到此類攻擊。
過度擬合:如果 AI 模型在其初始訓練資料集上訓練過多,它可能會失去概括、偵測趨勢或從新資料中得出準確結論的能力。它還可能偵測到訓練資料中實際上並不重要的模式,導致一些不太明顯的錯誤,直到向其輸入新資料才能發現這些錯誤。這些情況稱為「過度擬合」:模型與其訓練資料的擬合程度過高。舉一個過度擬合的範例,在 COVID-19 疫情期間,根據醫院 COVID 患者的掃描結果訓練的 AI 模型開始識別不同醫院使用的文字字型,並將該字型視為 COVID 診斷的預測因素。對於生成式 AI 模型,過度擬合可能會導致幻覺。
雖然開發人員可能無法完全消除 AI 幻覺,但他們可以採取一些具體步驟來減少幻覺和其他不準確之處。
瞭解 Cloudflare for AI 如何幫助開發人員在世界任何地方構建和執行 AI 模型,以及瞭解 Cloudflare Vectorize 如何幫助開發人員在全球分散式向量資料庫中產生和儲存嵌入。