Como a transferência de dados afeta os resultados

Economizando dinheiro em todos os lugares, exceto na saída de dados

A incerteza econômica significou cortes de pessoal, congelamento de gastos e cortes de marketing. No entanto, na era do Big Data, talvez um dos lugares mais óbvios para simplificar os gastos tenha passado despercebido: o custo significativo da saída de dados.

Segundo o IDC, o Global DataSphere atingiu 64 zettabytes em 2020. O mesmo relatório acrescenta que a quantidade de dados criados nos últimos três anos é superior à quantidade de dados criados nos últimos 30 anos. Todos esses dados residem em algum lugar e, para muitas organizações, residem em nuvem, especialmente o armazenamento de objetos baseado em nuvem oferecido por provedores como Amazon S3, Google Cloud Storage e Azure Blob Storage.

Para muitas organizações, a eliminação dos custos de leitura dos dados armazenados pode satisfazer os cortes orçamentários necessários e até permitir o crescimento dos negócios.

Cobrar altas taxas de saída - apenas porque podem

Antigamente, os dados eram armazenados em servidores controlados pela empresa em instalações próprias, mas hoje, a nuvem, especialmente o armazenamento de objetos em nuvem tornou o armazenamento de dados praticamente ilimitado. As organizações salvam tudo que podem, desde dados de usuários até logs e extensos backups de dados.

Assim, com exceção das organizações que enfrentam regulamentações de dados extremamente rígidas ou que operam redes isoladas, os dados são principalmente armazenados remotamente em nuvem, por um terceiro.

O custo de operar o armazenamento de dados no local inclui a manutenção de racks de servidores, desde eletricidade até atualizações de hardware e pessoal. E recuperar dados armazenados é tão simples quanto acessar o servidor onde eles foram salvos. Olhando para o futuro, à medida que uma organização antecipa o crescimento futuro, ela adquire mais hardware para expandir.

Por outro lado, a nuvem escala sob demanda, tanto para cima quanto para baixo, conforme o exigido pela empresa, tornando-a muito mais atraente. E quando os dados são armazenados por um provedor de serviços em nuvem, o armazenamento de dados se torna um serviço. Essa mudança de CapEx para OpEx criou uma oportunidade para os provedores aproveitarem e cobrarem taxas exorbitantes dos clientes para acessar seus dados. Essas taxas de saída de dados cresceram a níveis completamente desproporcionais aos custos incorridos pelos provedores de nuvem com largura de banda.

Essencialmente, os provedores de armazenamento de objetos estão cobrando altas taxas de saída de dados porque podem.

O impacto acentuado e de alto custo da leitura de dados

Vejamos um exemplo de uma empresa que armazena 1.000 TB de dados no S3 e lê um quinto ou 200 TB desses dados por mês.

A estrutura de custos do Amazon S3 é a seguinte:





Usando a estrutura de custos acima, o custo total para armazenar os dados desse cliente é de US$ 21.550, então ler um quinto desses dados custa mais US$ 13.800, totalizando um valor de US$ 35.350 por mês.

Em um ano, o custo mensal de transferência de dados por si só chega a US$ 165.600. Ao longo de cinco anos, US$ 828.000 e ao longo de 10 anos, US$ 1.656.000.

Este pequeno exemplo demonstra o custo de oportunidade de armazenar dados com provedores que operam nesse modelo.

Não há mais taxas de saída?

É claro que enviar dados através de uma rede não é gratuito. Os provedores devem pagar pelo uso de largura de banda de trânsito, o direito de enviar dados através das redes com as quais estão conectados. No entanto, normalmente, a largura de banda é paga como uma taxa mensal, não com base em um modelo de "pague pelo que você usa". Essa taxa mensal geralmente é baseada no número de Mbps que a rede usa em sua capacidade máxima, e não na quantidade total de dados transferidos pela rede.

Para simplificar: os provedores de armazenamento pagam pela capacidade, e não pelo volume. No entanto, eles cobram de seus clientes com base no volume, e não na capacidade. Talvez não seja surpreendente que os custos baseados na capacidade sejam quase exponencialmente menores do que os custos baseados no volume cobrados de seus clientes.

Isso é especialmente verdadeiro se, como frequentemente ocorre, as taxas de trânsito de largura de banda forem consideravelmente reduzidas ou totalmente isentas. Na verdade, a maioria dos provedores de hospedagem no setor oferece descontos significativos ou isenta completamente as taxas de saída ao enviar tráfego de sua rede para um parceiro.

E se o provedor de hospedagem não estiver pagando pelos custos de largura de banda, essas economias também devem ser repassadas aos clientes. De acordo com esse modelo, a Cloudflare oferece um serviço de armazenamento em nuvem sem taxas de saída com o Cloudflare R2. Os clientes são cobrados apenas pelo armazenamento em si, não pela leitura dos dados. O R2 também é compatível com o S3, eliminando o aprisionamento tecnológico e permitindo a portabilidade dos dados.

À medida que as organizações buscam reduzir custos, as taxas de saída devem ser examinadas com rigor. A Cloudflare concorda com isso e elimina totalmente as taxas de saída.

