Nvidia lança servidores Rubin com resfriamento 100% líquido
A Nvidia apresentou nesta semana a família de servidores Rubin, sucessores da linha Blackwell, com uma mudança radical de design: resfriamento 100% líquido. Nenhuma ventoinha. O anúncio foi feito durante o Computex 2026 em Taipé, onde Jensen Huang confirmou que os primeiros sistemas Rubin Ultra chegarão ao mercado em Q4 2026, com envio para clientes enterprise e hyperscalers.
A decisão pelo resfriamento total a líquido não é estética: é física e economia de engenharia.
Por que ar não funciona mais em alta densidade
Para entender o salto, é preciso entender o problema. Um servidor com 8 GPUs Nvidia H100 (Hopper, 2022) consumia cerca de 10-12 kW por rack. Um servidor Blackwell equivalente chegou a 35-40 kW por rack. A família Rubin, segundo dados preliminares da Nvidia e análises da SemiAnalysis, deve operar na faixa de 60-80 kW por rack nos configs mais densos.
A física é implacável: ar conduz calor 25 vezes menos eficientemente que água. Para resfriamento a ar funcionar em 80 kW por rack, você precisaria de ventoinhas industriais que sozinhas consumiriam 8-10 kW, gerariam ruído acima de 90 dB a 1 metro, e requereriam espaçamento de aisle de pelo menos 1,5 metro — reduzindo drasticamente a densidade de racks por m².
Liquid cooling resolve a equação: tubos de água conduzem o calor diretamente dos chips para chillers externos, com consumo de energia significativamente menor para o sistema de refrigeração. O PUE (Power Usage Effectiveness — métrica padrão de eficiência de datacenter) de um data center com liquid cooling pode chegar a 1,02-1,05, contra 1,4-1,6 típicos de ar.
A arquitetura do Rubin: o que mudou sob o capô
Além do resfriamento, a família Rubin traz mudanças arquiteturais significativas:
GPU Rubin Ultra R100: fabricada no processo TSMC N3 (3nm), com 80 bilhões de transistores. A Nvidia não divulgou FLOPS oficiais, mas análises de wafer design estimam performance de treinamento ~2,5-3x superior ao H100 em FP8.
NVLink 5.0: bandwidth de 3,6 TB/s entre GPUs no mesmo nó, contra 900 GB/s do NVLink 4 do Blackwell. Crítico para modelos com embedding layers que precisam de comunicação intensiva entre GPUs.
HBM4: primeira GPU de produção a usar HBM4 com 8 TB/s de bandwidth de memória, dobro do HBM3e do H200.
Novo plano de potência: sistema de distribuição de energia redesenhado para suportar 100W por unidade de rack (rack unit), contra os 50W do padrão ATX tradicional.
O custo real da mudança para datacenters
Adotar servidores Rubin não é apenas trocar hardware. É uma reforma de infraestrutura. Os impactos:
Plumbing: instalação de circuitos de água de alta pressão no datacenter. Custo médio de retrofit estimado pela Uptime Institute: US$ 15-25 milhões por data hall de 10.000 m².
Habilidades de manutenção: técnicos de datacenter precisam de treinamento específico para sistemas de liquid cooling — troca de fluído, detecção de micro-vazamentos, manutenção de bombas e chillers. É mão-de-obra diferente da tradicional.
Risco de vazamento: tecnicamente mitigado pelos sistemas modernos de detecção (sensores de umidade por IA, sistemas redundantes), mas é uma preocupação real que não existe com ar.
Isso cria uma barreira de entrada real para cloud providers regionais — empresas como UCloud no Brasil, Nuvem no Chile ou qualquer player de médio porte que não tem capital para refatorar infraestrutura. O acesso aos chips Rubin vai se concentrar ainda mais em AWS, Azure, GCP, e provedores de nicho como CoreWeave.
O mapa do mercado de GPUs em 2026
Para ter contexto do movimento da Nvidia:
| Geração | Ano | TDP típico/rack | Resfriamento |
|---|---|---|---|
| Hopper (H100) | 2022 | 10-12 kW | Ar ou híbrido |
| Blackwell (B200) | 2024 | 35-40 kW | Ar ou híbrido |
| Rubin (R100) | 2026 | 60-80 kW | 100% líquido |
A tendência é clara: cada geração dobra ou triplica o consumo energético. O resfriamento a ar atingiu seu limite prático com o Blackwell. O Rubin oficializa a transição.
Impacto para o Brasil: onde isso chega e quando
A situação do datacenter brasileiro é característica: segundo o IBGE e dados do *Brazilian Data Center Survey 2025*, mais de 80% da capacidade instalada em São Paulo (principal hub) usa resfriamento a ar. Somente os maiores players (Equinix, Ascenty, Scala) têm infraestrutura híbrida ou de liquid cooling parcial.
Isso significa:
1. Inferência de modelos grandes no Brasil vai continuar cara e limitada por pelo menos 24-36 meses, até os principais datacenters completarem retrofits
2. Preço de tokens via APIs de cloud hosted no Brasil (quando disponíveis) tende a ser mais alto que US-East por pelo menos dois anos
3. Estratégia de latência: para empresas brasileiras, o custo de latência de us-east-1 (AWS Virgínia) vs. sa-east-1 (São Paulo) em LLM inference pode valer a pena aceitar — especialmente para tasks batch ou assíncronas
A estratégia pragmática: hibridismo de cloud
Na 10Dobro, a tese é clara há dois anos: rodar onde faz sentido para o caso de uso, não onde a IA foi treinada.
- Tasks síncronas de baixa latência (chatbot em tempo real, autocomplete): modelos hospedados em São Paulo ou via edge (Cloudflare Workers AI)
- Tasks assíncronas de alta qualidade (geração de artigo, análise complexa): frontier models em us-east-1
- Tasks de volume alto e baixa complexidade (extração de dados, categorização): modelos abertos auto-hospedados onde cabe no orçamento
Com Rubin consolidando os frontier models ainda mais em datacenter de alta barreira, esse hibridismo pragmático se torna menos opção e mais necessidade para quem quer controlar custos.
O que acompanhar
- **Q4 2026**: primeiros envios de Rubin para hyperscalers; preços de inferência Rubin via API devem ser anunciados
- **AMD MI400 (codinome "Aqua Ventures")**: concorrente da AMD para liquid cooling, previsto para H1 2027
- **Legislação de eficiência energética em datacenter**: UE e estados americanos como Virginia e Georgia estão discutindo regulação de PUE mínimo — o que favorece liquid cooling
- **Retrofits no Brasil**: Equinix e Ascenty não divulgaram planos públicos de upgrade para liquid cooling em São Paulo, mas a pressão de clientes deve forçar nos próximos 18 meses
Fontes
- Nvidia — apresentação Computex 2026 (investor.nvidia.com)
- SemiAnalysis — *Rubin Architecture Deep Dive: What We Know* (jun. 2026)
- Uptime Institute — *Liquid Cooling Retrofit Cost Guide* (2025)
- IBGE / Agência Nacional de Telecomunicações (Anatel) — dados de infraestrutura de datacenter Brasil (2025)
- Gartner — *Hype Cycle for Data Center Infrastructure, 2025*
- AMD — roadmap MI400 (apresentação investor day, abr. 2026)
- Brazilian Data Center Survey — *Annual Report 2025* (abradata.net.br)
Tem um projeto de IA, audiovisual ou crescimento?
Conversar com a gente →