개체 스토리지는 비정형 데이터를 위한 유연하고 확장 가능한 클라우드 스토리지 모델입니다.
이 글을 읽은 후에 다음을 할 수 있습니다:
관련 콘텐츠
인터넷에서 가장 인기 있는 인사이트를 한 달에 한 번 정리하는 Cloudflare의 월간 요약본 theNET를 구독하세요!
글 링크 복사
개체 스토리지는 대량의 데이터, 특히 비정형 데이터를 클라우드에 저장하는 방법입니다. 비즈니스 활동에서 생성되는 데이터의 대부분은 로그, 동영상 및 사진 콘텐츠, 센서 데이터, 웹페이지 등 비정형 데이터입니다. 개체 스토리지는 각 파일 또는 데이터 세그먼트가 메타데이터 및 데이터 검색을 위한 고유한 이름 또는 식별자를 갖춘 고유한 개체로 여러 클라우드 서버에서 이 데이터를 유지 관리합니다.
개체 스토리지는 기존의 파일 기반 계층 구조에서처럼 이러한 개체를 폴더에 저장하지 않고 모든 개체를 단일 "데이터 레이크"("데이터 풀" 이라고도 함)에 함께 저장합니다. 따라서 개체 스토리지는 옷을 여행 가방에 정성스럽게 접어 넣고 분류하는 것보다 가방에 옷을 던져 넣는 것이 짐을 더 빨리 싸는 방법인 것처럼 방대한 양의 데이터를 매우 빠르게 저장할 수 있습니다.
개체 스토리지에는 사실상 무제한에 가까울 정도로 많은 데이터를 저장할 수 있습니다. 또한 사용 가능한 다른 클라우드 스토리지 방법보다 비용 효율적입니다. 그러나 데이터가 저장된 후 데이터에 액세스하는 데 드는 비용("데이터 송신")은 벤더에 따라 굉장히 비싼 경우도 있습니다.
일반적으로 클라우드 컴퓨팅은 온프레미스 서버와 컴퓨터를 사용하는 것이 아니라 클라우드 공급자로부터 컴퓨팅 성능과 저장 공간을 임대하는 것입니다. 클라우드 스토리지는 단순히 하나 이상의 원격 물리적 위치에 존재할 수 있는 클라우드 공급자의 인프라에 데이터를 저장하는 것을 의미합니다.
클라우드 스토리지 환경에서 개체는 데이터의 단위입니다. 개체는 모든 형식과 크기로 만들 수 있습니다. 사진, 오디오 파일, 네트워크 로그, 이메일 등을 모두 개체로 저장할 수 있습니다.
일반적인 데스크톱 컴퓨터 로컬 스토리지 또는 클라우드 기반 파일 스토리지와 달리 개체 스토리지는 폴더로 정렬되지 않습니다. 각 개체에 도달하는 계층적 경로는 하나도 없으며 다양한 경로를 통해 개체에 도달할 수 있습니다. Jerry가 컴퓨터에 오징어 사진을 C: 드라이브에 저장했다면 "사진" 이라는 폴더와 "오징어 사진"이라는 하위 폴더에 저장했을 수 있습니다. 나중에 이 사진에 접근하기 위해 Jerry는 C:, "사진,", "오징어 사진,", 사진 자체를 차례로 엽니다. Jerry가 사진으로 가는 경로는 다음과 같습니다.
데스크톱 컴퓨터 --> C: --> "사진" --> "오징어 사진" --> 사진 열기
하지만 Jerry의 컴퓨터가 개체 스토리지처럼 작동한다면 파일 이름, 촬영 날짜, 정확한 크기 등 오징어 사진에 대한 메타데이터를 사용하여 나중에 해당 사진을 찾을 수 있을 것입니다. 그리고 위와 같은 구조적 경로를 따르는 대신 단순히 파일을 찾아서 열 것입니다.
데스크톱 컴퓨터 --> 사진 검색 --> 사진 열기
이는 개체 스토리지가 작동하는 방식과 비슷합니다. 개체는 직접 액세스되며 일련의 하위 폴더에 저장되는 대신 데이터 레이크(아래에 정의됨)에 모두 함께 저장됩니다.
개체 스토리지의 다른 중요한 구성 요소는 다음과 같습니다.
메타데이터: 메타데이터는 파일 이름, 유형 또는 크기와 같은 파일에 대한 정보입니다. 메타데이터를 사용하면 다른 클라우드 스토리지 방법인 블록 스토리지와 개체 스토리지를 차별화할 수 있습니다. 개체 스토리지는 비구조적이므로 메타데이터는 원하는 만큼 광범위할 수 있으며 어떤 형태든 가능합니다. 예를 들어 Jerry는 오징어 사진에 메타데이터 레이블을 얼마든지 지정하여 나중에 빠르게 찾을 수 있도록 할 수 있습니다. 고유 번호 또는 "고유 식별자"를 할당할 수도 있습니다.
고유 식별자: 고유 식별자는 개체 스토리지의 각 개체에 할당되는 문자열(문자 시퀀스)입니다. 이렇게 하면 나중에 해당 개체를 더 빠르게 조회하고 검색할 수 있습니다.
데이터 송신: 개체 스토리지 고객이 개체 로드 또는 액세스를 요청하면 스토리지 공급자는 네트워크를 통해 해당 개체를 전송해야 합니다. 이 프로세스를 데이터 송신이라고 합니다. 많은 개체 스토리지 공급자는 저장된 데이터를 읽는 데 높은 요금을 청구하기 때문에 많은 기업에서 개체 스토리지의 비용 효율성이 떨어질 수 있습니다.
데이터 레이크 또는 데이터 풀은 필요에 따라 얼마든지 커질 수 있는 비정형 데이터의 모음입니다. 데이터 레이크는 데이터의 양에 상관없이 저장합니다. 현실 세계에서 물이 고체와 액체 형태로 여러 강과 개울에서 호수로 유입되는 것처럼, 데이터 레이크의 데이터는 레이크로 유입되기 전에 구조체에 넣거나, 형식을 변경하거나, 압축하거나, 다른 작업을 할 필요가 없습니다.
Blob 스토리지는 개체 스토리지의 한 유형입니다. 개체 스토리지와 마찬가지로 바이너리 대형 개체(구어체로는 "blob")를 저장합니다. Blob은 지정된 형식을 따르거나 관련된 메타데이터를 가질 필요가 없습니다. Blob은 일련의 바이트로, 각 바이트는 8비트(1 또는 0, 따라서 "바이너리" 설명자)로 구성되며 모든 유형의 데이터가 블롭에 포함될 수 있습니다.
대량의 데이터를 생성하는 모든 활동은 개체 스토리지와 잘 작동할 수 있습니다. 데이터에 자주 액세스할 필요가 없는 경우 특히 그렇습니다. 몇 가지 예는 다음과 같습니다.
개체 스토리지는 다음과 같은 경향이 있습니다.
데이터 송신료는 개체 스토리지의 비용 이점을 상쇄할 수 있습니다. 이 블로그 게시물에서는 개체 스토리지 공급자가 저장된 개체에 액세스할 때 어떻게 많은 추가 요금을 청구하는지에 대해 자세히 설명합니다.
특히 데이터 검색 시 개체 스토리지를 사용하면 성능이 느려질 수 있습니다. 블록 스토리지는 요청된 데이터를 더 빠르게 로드하도록 설계되었지만, 그에 상응하는 비용이 더 많이 드는 경우가 많습니다.
Cloudflare R2는 송신료가 없는 개체 스토리지로 다른 많은 클라우드 스토리지 옵션보다 훨씬 저렴합니다. Cloudflare R2는 Cloudflare 글로벌 CDN과 통합되어 성능을 극대화합니다. 또한 향상된 의사 결정과 맞춤형 요청 라우팅을 위해 Cloudflare Workers와 통합됩니다. R2 개체 스토리지에 대해 자세히 알아보세요.