物件儲存體是適用於非結構化資料的彈性且可擴充的雲端儲存模型。
閱讀本文後,您將能夠:
相關內容
訂閱 TheNET,這是 Cloudflare 每月對網際網路上最流行見解的總結!
複製文章連結
物件儲存體是一種在雲端中儲存大量資料(尤其是非結構化資料)的方法。業務活動產生的大部分資料都是非結構化的,包括記錄、影片和相片內容、感應器資料和網頁,以及許多其他範例。物件儲存體可在多個雲端伺服器上維護此資料,每個檔案或資料區段都作為自己的物件,並附有中繼資料和唯一的名稱或識別碼,以供資料擷取使用。
物件儲存體不會將這些物件儲存在資料夾中,就像在傳統的檔案架構中一樣,所有物件都會一起儲存在單一「資料湖泊」中(也稱為「資料集區」)。因此,物件儲存體可以非常快速地儲存大量資料,就像將衣服扔進袋子裡一樣,相比將衣服小心折疊和分類到行李箱中,這是一種更快的旅行打包方式。
物件儲存體可以包含如此多的資料,幾乎是無限的。它也比其他一些可用的雲端儲存方法更具成本效益。但是,儲存資料後存取資料(稱為「資料輸出」)的成本有時會令人望而卻步,具體取決於廠商。
雲端運算通常涉及從雲端供應商租用運算能力和儲存空間,而不是使用內部部署的伺服器和電腦。雲端儲存只是意味著將資料儲存在雲端供應商的基礎結構上,可能存在於一個或多個遠端實體位置。
在雲端儲存環境中,物件是資料的單元。一個物件可以是任意格式和任意大小。照片、音訊檔案、網路記錄和電子郵件都可以被儲存為物件。
與典型的桌上型電腦本機儲存或雲端式檔案儲存空間不同,物件儲存體不會被分類到資料夾中。沒有到達每個物件的階層路徑;可以透過各種路徑到達物件。如果 Jerry 在他電腦的 C: 磁碟機中保存了一張魷魚的圖片,他可能會把它保存在一個名為「照片」的資料夾中,並保存在一個名為「魷魚圖片」的子資料夾中。為了找到這張照片,Jerry 打開 C:,然後打開「照片」,然後是「魷魚圖片」,最後是照片本身。Jerry 的照片路徑看起來像這樣:
桌上型電腦 --> C: -->「照片」->「魷魚圖片」--> 打開照片
但是,如果 Jerry 的電腦運作更像是物件儲存體,他會改用魷魚圖片的中繼資料,也許是檔案名稱、拍攝日期或其精確尺寸,以便稍後尋找。而不是遵循像上面那樣的結構化路徑,他只是找到並打開檔案:
桌上型電腦 --> 搜尋照片 -> 打開照片
這更像是物件儲存體的運作方式。可直接存取物件,並非儲存在一系列子資料夾中,而是將它們一起儲存在資料湖中(定義如下)。
物件儲存體的其他重要元件包括:
中繼資料:中繼資料是檔案的相關資訊,例如檔案名稱、類型或大小。中繼資料的使用有助於將物件儲存體與區塊儲存體(另一種雲端儲存方法)分開。由於物件儲存體是非結構化的,因此中繼資料可以視需要擴充,而且可採用任何形式。例如,Jerry 可以將任意數量的中繼資料標籤分配給他的魷魚照片,以確保他以後可以快速找到它。他甚至可以為其指派一個唯一號碼或「唯一識別碼」。
唯一識別碼:唯一識別碼是指派給物件儲存體中每個物件的字串(字元序列)。這樣可以稍後更快地查找和擷取該物件。
資料輸出:當物件儲存體的客戶要求載入或存取某個物件時,儲存體提供者必須透過網路將物件傳輸給客戶。這個過程稱為資料輸出。許多物件儲存體提供者會收取高昂的費用來讀取儲存的資料,這樣可以降低許多企業的物件儲存成本效益。
資料湖或資料集區是非結構化資料的集合,可視需要盡可能大。資料湖儲存任意數量的資料。資料湖中的資料不需要放入結構、重新格式化、壓縮,或在進入湖中之前對其進行任何其他操作,正如水可以從多條河流和溪流以及以固體和液體形式進入現實世界中的湖泊一樣。
Blob 儲存體是一種物件儲存體。它儲存二進位大型物件(口語稱為「blob」),就像物件儲存體一樣。Blob 不必遵循給定的格式,也不必具有與之關聯的任何中繼資料。它們是一系列位元組,每個位元組由 8 個位元(1 或 0,因此稱為「二進位」描述元)組成,任何類型的資料都可以放入 blob 中。
任何產生大量資料的活動都可以與物件儲存體很好地搭配使用。如果不需要經常存取資料,則尤其如此。一些範例包括:
物件儲存體往往:
資料輸出費用可抵消物件儲存體的成本效益。這篇部落格文章詳細說明了物件儲存體供應商有時如何為存取已儲存物件收取高額費用。
物件儲存體的效能可能會較慢,特別是對於資料擷取而言。區塊儲存體的設計可以更快速地載入所要求的資料,但成本通常相對較高。
Cloudflare R2 是免收輸出費用的物件儲存體,使其價格比許多其他雲端儲存選擇更經濟實惠。Cloudflare R2 與 Cloudflare 全球 CDN 整合,以實現最大效能。它還與 Cloudflare Workers 整合,以增強決策和自訂請求路由。深入瞭解 R2 物件儲存體。