深度學習是一種強大的機器學習類型,可以處理未標記資料並識別模式。深度學習是許多 AI 類型的基礎。
閱讀本文後,您將能夠:
複製文章連結
深度學習是一種機器學習,可以識別複雜的模式並以與人類類似的方式進行關聯。它的能力涵蓋識別相片中的項目、識別聲音、駕駛汽車以及建立插圖。從本質上講,深度學習模型是一種可以展現智慧的電腦程式,這要歸功於其複雜而精密的資料處理方法。
深度學習是人工智慧 (AI) 的一種,它是許多 AI 服務和模型發揮作用的核心。ChatGPT、Bard 和 Bing Chat 等大型語言模型 (LLM) 以及 Midjourney 和 DALL-E 等影像產生器依靠深度學習來學習語言和上下文,並產生真實的回應。預測式 AI 模型使用深度學習從龐大的歷史資料集合中獲得結論。
通常,使用電腦程式需要精確的輸入才能獲得正確的輸出。相比之下,深度學習可以攝入任意或不精確的資料並產生相關的輸出。例如,傳統的電腦程式可能能夠判斷兩張數位肖像是否完全相同。深度學習模型也許能夠辨識肖像主體的相似之處,即使肖像本身不同。
深度學習依賴大型資料集和大量運算能力——隨著這兩者的可用性的增加,深度學習模型變得更加複雜。如今,大數據收集和 GPU 驅動的雲端運算服務使開發人員和日常使用者比以往任何時候都更容易獲得深度學習。
機器學習是一種無需明確指令即可學習的電腦程式。深度學習是一種特殊的機器學習,就像噴射機是特殊的飛機一樣。兩者都涉及讓電腦程式從一組資料中自行學習。然而,深度學習可以做更多的事情,就像噴射機比螺旋槳飛機或滑翔機更強大一樣。
深度學習還可以從未標記資料中學習,而更基本的機器學習模型可能需要更多有關所輸入資料的上下文才能正確「學習」。最後,深度學習模型是使用神經網路構建的。機器學習模型可能建立在神經網路上,但並非總是如此。
當今世界上深度學習已經有大量應用,而且新的用途仍在探索中。目前的用例包括:
在機器學習領域,無監督學習是在沒有資料集所包含內容的上下文的情況下,識別大型資料集中的模式和關聯的方法。而監督學習會為模型提供範例輸入和輸出。深度學習可以使用監督式學習來訓練模型,但其無監督學習的能力使其有別於其他類型的機器學習。
想像一下,向機器學習模型提供新聞文章的範例,並指示每篇文章的主題。經過充分的訓練後,該模型也許能夠「寫」一篇關於給定主題的文章。這就是監督學習。
現在,想像一下向一個深度學習模型輸入一系列新聞文章範例,但沒有關於每篇文章內容的指導。這樣的模型如果足夠強大,也許能夠在僅提供該主題作為輸入的情況下,就給定主題撰寫一篇文章。這就是無監督學習。
未標記資料是沒有分類、標記或標籤的資料。未標記資料集可以包含任何任意資料,並且可以採取任何形式:隨機相片、影片編譯、長檔案名稱清單、記錄資料或上述所有內容的組合。沒有提供上下文的新聞文章(來自前面的範例)屬於未標記資料。
深度學習模型能夠將未標記資料置於上下文中並予以「理解」。通常,輸入的資料越多,模型就會變得越複雜。
未標記資料通常也是非結構化的。非結構化資料不遵循任何特定格式,因此可以包含任何類型的數字資訊。物件儲存體通常用於儲存此類非結構化資料。此類資料集合可能無限增長,而物件儲存體是一種高度可擴展且相當經濟高效的儲存方式。
當深度學習模型獲得大量資料來學習時,即使這些資料是未標記和非結構化的,深度學習模型也會變得更加有效。因此,物件儲存體是深度學習模型的重要資源。
神經網路是一種基於人腦運作方式的機器學習架構。神經網路是節點的集合;每個節點都是它自己的處理單元。具有統計意義的資料從一個節點傳遞到下一個節點。
這些節點分佈在至少三層:一個輸入層、一個隱藏層和一個輸出層。通常每層有幾個節點。可以有多個隱藏層,深度學習模型往往有很多隱藏層。
將神經網路視為一個共同努力解決問題的團隊。團隊中的每個成員都負責問題的一個方面,一旦他們完成自己的職責,他們就會將其交給下一個團隊成員。最後,團隊共同得出完整的解決方案。
神經網路已經存在了幾十年,但現代深度學習使用的層數比過去的神經網路更多。如今的深度學習模型還可以獲得比以往更多的運算能力和資料,使開發人員能夠加速 AI 技術的進步。
Cloudflare 可協助開發人員輕鬆建立可以從任何地方以最小延遲存取的 AI 應用程式。Cloudflare Workers AI 提供對 Cloudflare 全球網路上的無伺服器 GPU 的存取權限,以執行進階機器學習模型。Cloudflare R2 是一種無需輸出費用的物件儲存體,可更經濟高效地儲存大型資料集,後者可用於訓練深度學習模型。
瞭解有關 Cloudflare for AI 的所有資訊。