Repatriação Cloud: Por Que Empresas Estão Voltando para Bare Metal (E Quando Não Deveriam)
Em outubro de 2022, a 37signals anunciou que estava deixando a AWS. Não por problemas técnicos ou insatisfação com o serviço, mas por uma razão bem mais direta: custos. A empresa projetou economizar $7 milhões em cinco anos migrando o Basecamp e o Hey para 8 servidores Dell em dois datacenters próprios. Um ano depois, a migração estava completa e os números se confirmaram.
Essa decisão não é isolada. Dados de 2024 da Andreessen Horowitz mostram que aproximadamente 30% das empresas estão avaliando alguma forma de repatriação, embora apenas 5% estejam realmente executando. A diferença entre avaliar e executar não é acidental: a migração inversa é complexa, cara e definitivamente não compensa para todos os cenários.
A questão fundamental não é “cloud vs bare metal” como uma escolha binária. É entender exatamente onde seus custos de cloud estão concentrados, quais workloads são candidatos viáveis para migração, e se você tem as condições organizacionais para assumir a responsabilidade de gerenciar hardware físico. Os números podem ser tentadores, mas a realidade operacional é bem mais nuançada.
Anatomia dos Custos Ocultos: O Que Realmente Custa na AWS
Quando você olha sua fatura AWS, compute e storage são apenas parte da história. Análises de múltiplas empresas que fizeram repatriação revelam que 40-60% dos custos totais vêm de “fees” que não aparecem diretamente nos calculadores básicos: egress, NAT Gateway, VPC peering, cross-AZ transfers, API calls.
O egress é frequentemente o vilão invisível. A AWS cobra $0.09 por GB após os primeiros 100GB mensais. Parece razoável até você fazer as contas: transferir 100TB por mês custa $9.000 apenas em egress. Empresas reportam custos de egress entre $50.000 e $500.000 mensais como o principal driver de decisões de repatriação. Se você serve muito conteúdo para usuários finais, mídia pesada ou opera APIs públicas com alto throughput, o egress se torna um custo estrutural significativo.
NAT Gateway é outro exemplo clássico. O serviço cobra $0.045/GB processado, mais uma taxa fixa de $0.045/hora. Para aplicações que fazem muitas chamadas externas ou processam grandes volumes de dados, isso se acumula rapidamente. A Prezly, ao migrar da AWS para Hetzner em 2024, reduziu custos de €27.000 para €7.000 mensais - uma economia de 74%. A diferença não estava primariamente em compute, mas nesses custos periféricos que escalam linearmente com uso.
Cross-AZ transfers custam $0.01-0.02/GB. Se sua arquitetura distribuiu workloads em múltiplas availability zones para alta disponibilidade (o que é recomendado), você paga por cada byte que trafega entre elas. Microsserviços conversando intensamente entre AZs podem gerar milhares de dólares mensais apenas em transfers internos.
O problema não é que a AWS cobra por esses serviços - há custos reais de infraestrutura envolvidos. O problema é que esses custos são frequentemente subestimados por um fator de 3-5x durante planejamento inicial. Você começa com uma estimativa de compute/storage, adiciona margem de segurança, e descobre seis meses depois que a fatura real é o dobro porque não contabilizou egress de backups, logs enviados para agregadores externos, ou traffic patterns que mudaram conforme o produto cresceu.
Números Reais: Três Casos de Repatriação Documentados
A 37signals é o caso mais documentado e transparente de repatriação recente. Eles estimavam gastar $3.2 milhões na AWS ao longo de cinco anos. Investiram $600.000 em hardware próprio - 8 servidores Dell R7625 distribuídos em dois datacenters para redundância. Após amortização do hardware, o custo anual operacional caiu para aproximadamente $280.000, comparado aos $840.000 anuais projetados na cloud.
O workload deles é relativamente estável: aplicações Rails servindo o Basecamp e o Hey, com tráfego previsível e sem picos extremos sazonais. Essa previsibilidade é fundamental. Eles não precisam de elasticidade instantânea, não estão lançando produtos novos semanalmente que exigem infraestrutura totalmente diferente, e têm expertise técnica in-house para gerenciar hardware. O próprio David Heinemeier Hansson, CTO da empresa, é explícito sobre os trade-offs: você perde a conveniência de elasticidade instantânea e assume responsabilidade total por hardware failures.
Dropbox é o caso mais conhecido de repatriação em grande escala, embora mais antigo. Entre 2014-2016, a empresa migrou a maioria do armazenamento do S3 para infraestrutura própria chamada Magic Pocket. A economia reportada foi de $75 milhões em dois anos (2016-2017) comparado ao custo projetado de permanecer na AWS. O ROI positivo aconteceu em aproximadamente três anos, mas com investimento inicial de centenas de milhões em hardware e desenvolvimento customizado.
Detalhe crítico: Dropbox permaneceu na AWS para compute, edge locations e failover capacity - um modelo híbrido. Eles não simplesmente “saíram da cloud”. Identificaram que armazenamento em escala de exabytes era economicamente inviável na AWS, mas que outros componentes da infraestrutura continuavam fazendo sentido em cloud pública. Essa é uma decisão arquitetural sofisticada que só se justifica em escala massiva.
A Prezly, uma empresa europeia de médio porte, fez uma migração mais pragmática e recente (2024). Mudaram de AWS para Hetzner, um provedor europeu de servidores dedicados e colocation, reduzindo custos mensais de €27.000 para €7.000. A migração levou três meses. Esse caso é interessante porque representa uma categoria diferente: não é uma migração para datacenter próprio, mas para um modelo de bare metal gerenciado com pricing mais previsível e custos de egress significativamente menores.
Calculando o Break-Even: Quando Bare Metal Começa a Compensar
Um servidor bare metal equivalente a uma instância AWS c6i.8xlarge (32 vCPUs) custa entre $15.000-25.000 de investimento inicial, enquanto a mesma capacidade on-demand na AWS custa aproximadamente $150.000 anuais. Matematicamente, o break-even acontece entre 2-3 anos, assumindo utilização consistente.
Essa matemática simplificada ignora fatores críticos. Utilização é o primeiro: se você precisa dessa capacidade apenas 40% do tempo, Reserved Instances ou Savings Plans mudam completamente a equação. Se sua utilização é acima de 70% de forma consistente e previsível, bare metal começa a fazer sentido econômico. Abaixo disso, você está pagando por capacidade ociosa que não pode realocar.
Egress é o segundo fator. Se você transfere mais de 50TB mensais para fora da AWS, você está pagando $4.500+ apenas em egress. Em um ano, $54.000. Em três anos, $162.000 - o custo de um pequeno rack de servidores bare metal. Empresas com alto egress veem o break-even acontecer muito mais rápido, frequentemente em 12-18 meses ao invés de 36.
Retenção é o terceiro. Você precisa amortizar hardware ao longo de 3-5 anos. Se há risco de mudanças dramáticas no modelo de negócio, shutdown de produtos, ou pivots que tornariam o hardware obsoleto, você assume um risco de capital significativo. A 37signals opera produtos maduros com crescimento estável. Startups em estágios iniciais raramente têm essa previsibilidade.
Clientes da Oxide Computer, que produz sistemas de infraestrutura integrada para repatriação, reportam economias de 50-70% comparadas a cloud pública. Mas esses clientes têm perfis específicos: empresas com workloads bem definidos, equipes DevOps experientes (tipicamente 5+ engenheiros), e compromisso de longo prazo com hardware próprio.
A análise de break-even não pode ignorar custos operacionais além de hardware. Você precisa considerar: salários de equipes para gerenciar hardware físico, custos de colocation ou espaço em datacenter (se não for self-hosted), contratos de suporte com fornecedores, budget para replacement de hardware que falha, e custos de networking. Bandwidth em colos não é grátis, embora seja muito mais barato que AWS egress.
Decisões Arquiteturais: O Que Funciona em Bare Metal, O Que Não Funciona
A migração da Heap Analytics ilustra um padrão comum: eles moveram PostgreSQL de AWS RDS para self-managed PostgreSQL em bare metal, economizando mais de $1 milhão anualmente. Bancos de dados relacionais são candidatos ideais para repatriação quando o dataset é grande o suficiente para RDS ser caro, você tem expertise de DBA in-house, e o workload é relativamente estável.
O que NÃO funciona bem em bare metal? Serviços que precisam de escala global instantânea, workloads com variação extrema (Black Friday, lançamentos virais), e aplicações que dependem de serviços gerenciados complexos da AWS sem equivalentes diretos - SageMaker, Lambda em grande escala, serviços de ML/AI.
Se sua aplicação foi arquitetada com serverless-first thinking - Lambda functions, API Gateway, DynamoDB, Step Functions - a migração não é tecnicamente viável sem reescrever componentes fundamentais. O custo de reengenharia pode facilmente exceder qualquer economia projetada.
Empresas de médio porte (50-500 funcionários) lideram repatriações em 2023-2024, indicando que há uma barreira de escala mínima. Você precisa de volume suficiente para justificar o investimento e equipe técnica capaz de assumir responsabilidades operacionais, mas não tanta complexidade que cloud pública seja única opção para gerenciar escala.
O modelo híbrido é frequentemente o mais racional. Mantenha workloads estáveis e previsíveis em bare metal, use cloud para burst capacity, edge computing, disaster recovery, e serviços especializados. Isso é mais complexo de gerenciar do que “tudo AWS” ou “tudo bare metal”, mas pode oferecer o melhor custo-benefício.
Trade-offs Honestos e Quando Cloud Permanece Vencedor
Cloud pública não se tornou dominante por acidente. A conveniência operacional tem valor real. Quando você precisa lançar um ambiente completo de staging em 10 minutos, testar uma nova arquitetura sem comprometer capital, ou escalar temporariamente para 10x a capacidade normal, cloud oferece flexibilidade que hardware físico nunca vai igualar.
Para startups em estágios iniciais, o custo de oportunidade de gerenciar infraestrutura supera economias potenciais. Se seus engenheiros estão debugando hardware failures e gerenciando procurement ao invés de construir produto, você está otimizando a métrica errada. Cloud permite que times pequenos foquem em aplicação, não em infraestrutura.
Empresas que operam globalmente com necessidade de presença em múltiplas regiões geográficas enfrentam complexidade exponencial com bare metal. Estabelecer datacenters ou colos em 5+ países, gerenciar compliance regulatório local, e manter SLAs consistentes requer escala e expertise que poucas empresas possuem. A AWS tem 30+ regiões globais - replicar essa pegada levaria anos e investimento massivo.
Workloads com alta variabilidade são naturalmente inadequados para bare metal. Se seu tráfego varia 5-10x entre horários de pico e vale, você vai pagar por capacidade ociosa na maior parte do tempo em hardware próprio, enquanto poderia scale down dinamicamente em cloud. A 37signals funciona bem com bare metal porque seu tráfego é consistente. Aplicações com padrões sazonais extremos não têm essa sorte.
Repatriação bem-sucedida requer condições específicas: workloads maduros e previsíveis, alto egress ou outros custos cloud que escalam linearmente, expertise técnica in-house, capital disponível para investimento inicial, e horizonte de tempo de 3+ anos para amortização. Se qualquer desses fatores não se aplica, cloud permanece provavelmente a escolha mais racional.
Antes de considerar migração, faça uma análise honesta de onde seus custos cloud estão concentrados. Se é primariamente egress, considere CDNs ou provedores com pricing mais agressivo antes de repatriar tudo. Se é RDS em databases enormes, migrar só o database pode capturar 70% das economias com 20% da complexidade de repatriar toda infraestrutura. Otimizações incrementais frequentemente oferecem melhor ROI que migrações all-in.
A pergunta não é “devemos sair da cloud?”. É “quais workloads específicos têm características que tornam bare metal economicamente vantajoso, considerando todos os custos ocultos e trade-offs operacionais?”. Para algumas empresas em estágios específicos com perfis técnicos específicos, a resposta é clara. Para a maioria, a decisão é mais nuançada do que manchetes sobre economias de milhões de dólares sugerem.