What is a vector database?

A vector database stores data as mathematical representations called vectors. It is designed to cluster related items, which enables powerful capabilities like similarity searches. Vector databases are foundational for building advanced AI applications.

How do vector databases work?

Each object — whether it's a word, an image, or a document — is represented by a vector, which is a list of numbers. These numbers define the object's location across many different dimensions or characteristics. The database then groups or clusters vectors that are close to each other, allowing a machine learning model to quickly find similar items.

What is a "vector" in the context of AI?

A vector is an array of numerical values that represents an object. Think of it as a list of coordinates, like {12, 13, 19, 8, 9}, that pinpoints the object's location within a multi-dimensional space based on its various attributes.

What are the main uses for vector databases?

Vector databases are primarily used for similarity and semantic searches, machine learning and deep learning, and large language models (LLMs), which power AI agents and other advanced AI applications.

What are the advantages of using a vector database with a machine learning model?

Using a vector database is much faster and more cost-effective than querying a machine learning model directly for every task. The model only needs to process a dataset once to create embeddings, which are then stored in the vector database. This saves a huge amount of processing time and makes it possible to build user-facing applications that return results in milliseconds.

什麼是向量資料庫？

向量資料庫將資訊儲存為向量。向量資料庫將相關項目聚集在一起，從而實現相似性搜尋和建立強大的 AI 模型。

學習目標

閱讀本文後，您將能夠：

解釋向量和向量資料庫
瞭解嵌入
列出向量資料庫的用途

想要繼續瞭解嗎？

訂閱 TheNET，這是 Cloudflare 每月對網際網路上最流行見解的總結！

複製文章連結

什麼是向量資料庫？

向量資料庫是以數學表示形式儲存的資料的集合。向量資料庫使機器學習模型更容易記住先前的輸入，從而允許機器學習用於支援搜尋、推薦和文字產生用例。可以根據相似性指標而不是精確匹配來識別資料，從而使電腦模型能夠根據上下文理解資料。

當人們參觀鞋店時，銷售人員可能會推薦與人們喜歡的鞋子類似的鞋子。同樣，在電子商務商店購物時，商店可能會在「客戶還購買了...」之類的標題下建議類似的商品。向量資料庫使機器學習模型能夠識別類似的物品，就像銷售人員可以找到類似的鞋子以及電子商務商店可以推薦相關產品一樣。（事實上，電子商務商店可能會使用這樣的機器學習模型來進行推薦。）

總而言之，向量資料庫使電腦程式能夠進行比較、識別關係和理解上下文。這使得能夠建立進階人工智慧 (AI) 程式，如大型語言模型 (LLM)。

在這個簡單的向量資料庫中，右上角的文件可能彼此相似。

什麼是向量？

向量是一個數值陣列，表示浮點數在多個維度上的位置。

用更日常的語言來說，向量是一個數字清單，如：{12, 13, 19, 8, 9}。這些數字表示空間內的位置，就像列號和欄號表示試算表中的某個儲存格一樣（例如「B7」）。

向量資料庫如何運作？

向量資料庫中的每個向量對應於一個物件或項目，無論是單字、影像、影片、電影、文件或任何其他資料。這些向量可能很長且複雜，表示每個物件在數十個甚至數百個維度上的位置。

例如，電影的向量資料庫可以沿著諸如播放時間、類型、發行年份、家長指導評級、共同演員的數量、共同觀眾的數量等維度來定位電影。如果準確建立這些向量，那麼相似的電影最終可能會在向量資料庫中聚集在一起。

如何使用向量資料庫？

相似性和語義搜尋：向量資料庫允許應用程式將相關項目連接在一起。聚集在一起的向量是相似的，並且可能彼此相關。這可以幫助使用者搜尋相關資訊（例如影像搜尋），同時也幫助應用程式：
- 推薦同類產品
- 推薦歌曲、電影或節目
- 推薦影像或影片
機器學習與深度學習：利用連接相關資訊項目的能力，可以建立機器學習（和深度學習）模型來執行複雜的認知任務。
大型語言模型 (LLM) 和產生式 AI： LLM（就像 ChatGPT 和 Bard 所基於的 LLM 模型一樣）依賴因向量資料庫而成為可能的文字上下文分析。透過將單字、句子和想法相互關聯，LLM 可以理解自然的人類語言，甚至產生文字。

什麼是嵌入？

嵌入是由神經網路產生的向量。深度學習模型的典型向量資料庫由嵌入組成。對神經網路經過適當的微調後，它就可以自行產生嵌入，這樣就不必手動建立它們。然後，這些嵌入可以用於相似性搜尋、上下文分析、產生式 AI 等，如上所述。

使用向量資料庫有哪些優勢？

在沒有向量資料庫的情況下單獨查詢機器學習模型既不快速也不經濟。機器學習模型無法記住超出其訓練內容的任何內容。它們必須每次都成為上下文（這就是許多簡單聊天機器人的工作原理）。

每次將查詢的上下文傳遞給模型非常慢，因為這可能包含大量資料；而且成本高昂，因為資料必須四處移動，必須重複消耗運算能力讓模型剖析相同的資料。在實踐中，大多數機器學習 API 可能會受到它們一次可以接受的資料量的限制。

這就是向量資料庫派上用場的地方：資料集僅通過模型一次（或在變更時定期通過模型），並且該資料的模型嵌入儲存在向量資料庫中。

這節省了大量的處理時間。它使得圍繞語義搜尋、分類和異常偵測構建面向使用者的應用程式成為可能，因為結果會在幾十毫秒內傳回，而無需等待模型處理整個資料集。

對於查詢，開發人員要求機器學習模型提供該查詢的表示（嵌入）。然後嵌入可以傳遞到向量資料庫，它可以傳回類似的嵌入——這些嵌入已經透過模型執行過。然後，這些嵌入可以對應回其原始內容：無論是頁面的 URL、影像的連結還是產品 SKU。

總結一下：向量資料庫可以大規模工作、快速工作，並且比在沒有向量資料庫的情況下查詢機器學習模型更具成本效益。

Cloudflare 是否提供使用向量資料庫的功能？

Vectorize 是 Cloudflare 提供的全球分散式向量資料庫。基於 Cloudflare Workers 建構的應用程式可以使用 Vectorize 查詢 Workers KV 中儲存的文件、R2 中儲存的影像或 D1 中儲存的使用者設定檔。正如 Workers 允許開發人員在無需啟動任何後端基礎架構的情況下建立應用程式一樣，Vectorize 允許開發人員無需建立自己的向量資料庫基礎架構，即可在其應用程式中建立 AI 功能。為了建立嵌入，Cloudflare 提供了 Workers AI。

瞭解如何在 Cloudflare 上建立 AI 驅動的應用程式。

常見問題集

什麼是向量資料庫？

向量資料庫將資料儲存為稱為「向量」的數學表示形式。它旨在將相關項目群集在一起，實現如相似性搜尋等強大功能。向量資料庫是打造先進 AI 應用程式的基礎。

向量資料庫如何運作？

每個物件（單字、影像或文件）都由一個向量表示，該向量是一串數字。這些數字定義了物件在多個不同維度或特徵上的位置。然後，資料庫將彼此接近的向量分組或群集，使機器學習模型能夠快速找到相似的項目。

在 AI 的語境中，「向量」是什麼？

向量是一組代表某個物件的數值陣列。可以把它想像成一組座標，例如 {12, 13, 19, 8, 9}，根據該物件的各種屬性，指出它在多維空間中的位置。

向量資料庫的主要用途有哪些？

向量資料庫主要用於相似性和語意搜尋、機器學習與深度學習，以及支援大型語言模型 (LLM)，這些模型驅動了 AI 智慧體和其他先進的 AI 應用程式。

將向量資料庫與機器學習模型搭配使用有哪些優勢？

使用向量資料庫比每次針對任務直接查詢機器學習模型要快得多，也更省成本。模型只需處理一次資料集來建立嵌入，然後將其儲存在向量資料庫中。這大幅節省了處理時間，並使建構能在數毫秒內回傳結果的使用者面向應用程式成為可能。

開始使用

人工智慧

機器學習

大數據

學習中心