Nvidia lança servidores Rubin com resfriamento 100% líquido
IA & Engenharia//23 JUN 2026

Nvidia lança servidores Rubin com resfriamento 100% líquido

NvidiaRubindatacenterinfraestruturaeficiência

A Nvidia apresentou nesta semana a família de servidores Rubin, sucessores da linha Blackwell, com uma mudança radical de design: resfriamento 100% líquido. Nenhuma ventoinha. O anúncio foi feito durante o Computex 2026 em Taipé, onde Jensen Huang confirmou que os primeiros sistemas Rubin Ultra chegarão ao mercado em Q4 2026, com envio para clientes enterprise e hyperscalers.

A decisão pelo resfriamento total a líquido não é estética: é física e economia de engenharia.

Por que ar não funciona mais em alta densidade

Para entender o salto, é preciso entender o problema. Um servidor com 8 GPUs Nvidia H100 (Hopper, 2022) consumia cerca de 10-12 kW por rack. Um servidor Blackwell equivalente chegou a 35-40 kW por rack. A família Rubin, segundo dados preliminares da Nvidia e análises da SemiAnalysis, deve operar na faixa de 60-80 kW por rack nos configs mais densos.

A física é implacável: ar conduz calor 25 vezes menos eficientemente que água. Para resfriamento a ar funcionar em 80 kW por rack, você precisaria de ventoinhas industriais que sozinhas consumiriam 8-10 kW, gerariam ruído acima de 90 dB a 1 metro, e requereriam espaçamento de aisle de pelo menos 1,5 metro — reduzindo drasticamente a densidade de racks por m².

Liquid cooling resolve a equação: tubos de água conduzem o calor diretamente dos chips para chillers externos, com consumo de energia significativamente menor para o sistema de refrigeração. O PUE (Power Usage Effectiveness — métrica padrão de eficiência de datacenter) de um data center com liquid cooling pode chegar a 1,02-1,05, contra 1,4-1,6 típicos de ar.

A arquitetura do Rubin: o que mudou sob o capô

Além do resfriamento, a família Rubin traz mudanças arquiteturais significativas:

GPU Rubin Ultra R100: fabricada no processo TSMC N3 (3nm), com 80 bilhões de transistores. A Nvidia não divulgou FLOPS oficiais, mas análises de wafer design estimam performance de treinamento ~2,5-3x superior ao H100 em FP8.

NVLink 5.0: bandwidth de 3,6 TB/s entre GPUs no mesmo nó, contra 900 GB/s do NVLink 4 do Blackwell. Crítico para modelos com embedding layers que precisam de comunicação intensiva entre GPUs.

HBM4: primeira GPU de produção a usar HBM4 com 8 TB/s de bandwidth de memória, dobro do HBM3e do H200.

Novo plano de potência: sistema de distribuição de energia redesenhado para suportar 100W por unidade de rack (rack unit), contra os 50W do padrão ATX tradicional.

O custo real da mudança para datacenters

Adotar servidores Rubin não é apenas trocar hardware. É uma reforma de infraestrutura. Os impactos:

Plumbing: instalação de circuitos de água de alta pressão no datacenter. Custo médio de retrofit estimado pela Uptime Institute: US$ 15-25 milhões por data hall de 10.000 m².

Habilidades de manutenção: técnicos de datacenter precisam de treinamento específico para sistemas de liquid cooling — troca de fluído, detecção de micro-vazamentos, manutenção de bombas e chillers. É mão-de-obra diferente da tradicional.

Risco de vazamento: tecnicamente mitigado pelos sistemas modernos de detecção (sensores de umidade por IA, sistemas redundantes), mas é uma preocupação real que não existe com ar.

Isso cria uma barreira de entrada real para cloud providers regionais — empresas como UCloud no Brasil, Nuvem no Chile ou qualquer player de médio porte que não tem capital para refatorar infraestrutura. O acesso aos chips Rubin vai se concentrar ainda mais em AWS, Azure, GCP, e provedores de nicho como CoreWeave.

O mapa do mercado de GPUs em 2026

Para ter contexto do movimento da Nvidia:

GeraçãoAnoTDP típico/rackResfriamento
Hopper (H100)202210-12 kWAr ou híbrido
Blackwell (B200)202435-40 kWAr ou híbrido
Rubin (R100)202660-80 kW100% líquido

A tendência é clara: cada geração dobra ou triplica o consumo energético. O resfriamento a ar atingiu seu limite prático com o Blackwell. O Rubin oficializa a transição.

Impacto para o Brasil: onde isso chega e quando

A situação do datacenter brasileiro é característica: segundo o IBGE e dados do *Brazilian Data Center Survey 2025*, mais de 80% da capacidade instalada em São Paulo (principal hub) usa resfriamento a ar. Somente os maiores players (Equinix, Ascenty, Scala) têm infraestrutura híbrida ou de liquid cooling parcial.

Isso significa:
1. Inferência de modelos grandes no Brasil vai continuar cara e limitada por pelo menos 24-36 meses, até os principais datacenters completarem retrofits
2. Preço de tokens via APIs de cloud hosted no Brasil (quando disponíveis) tende a ser mais alto que US-East por pelo menos dois anos
3. Estratégia de latência: para empresas brasileiras, o custo de latência de us-east-1 (AWS Virgínia) vs. sa-east-1 (São Paulo) em LLM inference pode valer a pena aceitar — especialmente para tasks batch ou assíncronas

A estratégia pragmática: hibridismo de cloud

Na 10Dobro, a tese é clara há dois anos: rodar onde faz sentido para o caso de uso, não onde a IA foi treinada.

Com Rubin consolidando os frontier models ainda mais em datacenter de alta barreira, esse hibridismo pragmático se torna menos opção e mais necessidade para quem quer controlar custos.

O que acompanhar

Fontes

BH
AI Engineer · Diretor de Fotografia · CEO 10Dobro Prod

Tem um projeto de IA, audiovisual ou crescimento?

Conversar com a gente →