Q4 2026: primeiros envios de Rubin para hyperscalers; preços de inferência Rubin via API devem ser anunciados AMD MI400 (codinome "Aqua Ventures"): concorrente da AMD para liquid cooling, previsto para H1 2027 Legislação de eficiência energética em datacenter: UE e estados americanos como Virginia e Georgia estão discutindo regulação de PUE mínimo — o que favorece liquid cooling Retrofits no Brasil: Equinix e Ascenty não divulgaram planos públicos de upgrade para liquid cooling em São Paulo, mas

Nvidia — apresentação Computex 2026 (investor.nvidia.com) SemiAnalysis — *Rubin Architecture Deep Dive: What We Know* (jun. 2026) Uptime Institute — *Liquid Cooling Retrofit Cost Guide* (2025) IBGE / Agência Nacional de Telecomunicações (Anatel) — dados de infraestrutura de datacenter Brasil (2025) Gartner — *Hype Cycle for Data Center Infrastructure, 2025* AMD — roadmap MI400 (apresentação investor day, abr. 2026) Brazilian Data Center Survey — *Annual Report 2025* (abradata.net.br)

IA & Engenharia//23 JUN 2026

Nvidia lança servidores Rubin com resfriamento 100% líquido

Q: A estratégia pragmática: hibridismo de cloud

Na 10Dobro, a tese é clara há dois anos: rodar onde faz sentido para o caso de uso, não onde a IA foi treinada.

NvidiaRubindatacenterinfraestruturaeficiência

A Nvidia apresentou nesta semana a família de servidores Rubin, sucessores da linha Blackwell, com uma mudança radical de design: resfriamento 100% líquido. Nenhuma ventoinha. O anúncio foi feito durante o Computex 2026 em Taipé, onde Jensen Huang confirmou que os primeiros sistemas Rubin Ultra chegarão ao mercado em Q4 2026, com envio para clientes enterprise e hyperscalers.

A decisão pelo resfriamento total a líquido não é estética: é física e economia de engenharia.

Por que ar não funciona mais em alta densidade

Para entender o salto, é preciso entender o problema. Um servidor com 8 GPUs Nvidia H100 (Hopper, 2022) consumia cerca de 10-12 kW por rack. Um servidor Blackwell equivalente chegou a 35-40 kW por rack. A família Rubin, segundo dados preliminares da Nvidia e análises da SemiAnalysis, deve operar na faixa de 60-80 kW por rack nos configs mais densos.

A física é implacável: ar conduz calor 25 vezes menos eficientemente que água. Para resfriamento a ar funcionar em 80 kW por rack, você precisaria de ventoinhas industriais que sozinhas consumiriam 8-10 kW, gerariam ruído acima de 90 dB a 1 metro, e requereriam espaçamento de aisle de pelo menos 1,5 metro — reduzindo drasticamente a densidade de racks por m².

Liquid cooling resolve a equação: tubos de água conduzem o calor diretamente dos chips para chillers externos, com consumo de energia significativamente menor para o sistema de refrigeração. O PUE (Power Usage Effectiveness — métrica padrão de eficiência de datacenter) de um data center com liquid cooling pode chegar a 1,02-1,05, contra 1,4-1,6 típicos de ar.

A arquitetura do Rubin: o que mudou sob o capô

Além do resfriamento, a família Rubin traz mudanças arquiteturais significativas:

GPU Rubin Ultra R100: fabricada no processo TSMC N3 (3nm), com 80 bilhões de transistores. A Nvidia não divulgou FLOPS oficiais, mas análises de wafer design estimam performance de treinamento ~2,5-3x superior ao H100 em FP8.

NVLink 5.0: bandwidth de 3,6 TB/s entre GPUs no mesmo nó, contra 900 GB/s do NVLink 4 do Blackwell. Crítico para modelos com embedding layers que precisam de comunicação intensiva entre GPUs.

HBM4: primeira GPU de produção a usar HBM4 com 8 TB/s de bandwidth de memória, dobro do HBM3e do H200.

Novo plano de potência: sistema de distribuição de energia redesenhado para suportar 100W por unidade de rack (rack unit), contra os 50W do padrão ATX tradicional.

O custo real da mudança para datacenters

Adotar servidores Rubin não é apenas trocar hardware. É uma reforma de infraestrutura. Os impactos:

Plumbing: instalação de circuitos de água de alta pressão no datacenter. Custo médio de retrofit estimado pela Uptime Institute: US$ 15-25 milhões por data hall de 10.000 m².

Habilidades de manutenção: técnicos de datacenter precisam de treinamento específico para sistemas de liquid cooling — troca de fluído, detecção de micro-vazamentos, manutenção de bombas e chillers. É mão-de-obra diferente da tradicional.

Risco de vazamento: tecnicamente mitigado pelos sistemas modernos de detecção (sensores de umidade por IA, sistemas redundantes), mas é uma preocupação real que não existe com ar.

Isso cria uma barreira de entrada real para cloud providers regionais — empresas como UCloud no Brasil, Nuvem no Chile ou qualquer player de médio porte que não tem capital para refatorar infraestrutura. O acesso aos chips Rubin vai se concentrar ainda mais em AWS, Azure, GCP, e provedores de nicho como CoreWeave.

O mapa do mercado de GPUs em 2026

Para ter contexto do movimento da Nvidia:

Geração	Ano	TDP típico/rack	Resfriamento
Hopper (H100)	2022	10-12 kW	Ar ou híbrido
Blackwell (B200)	2024	35-40 kW	Ar ou híbrido
Rubin (R100)	2026	60-80 kW	100% líquido

A tendência é clara: cada geração dobra ou triplica o consumo energético. O resfriamento a ar atingiu seu limite prático com o Blackwell. O Rubin oficializa a transição.

Impacto para o Brasil: onde isso chega e quando

A situação do datacenter brasileiro é característica: segundo o IBGE e dados do *Brazilian Data Center Survey 2025*, mais de 80% da capacidade instalada em São Paulo (principal hub) usa resfriamento a ar. Somente os maiores players (Equinix, Ascenty, Scala) têm infraestrutura híbrida ou de liquid cooling parcial.

Isso significa:
1. Inferência de modelos grandes no Brasil vai continuar cara e limitada por pelo menos 24-36 meses, até os principais datacenters completarem retrofits
2. Preço de tokens via APIs de cloud hosted no Brasil (quando disponíveis) tende a ser mais alto que US-East por pelo menos dois anos
3. Estratégia de latência: para empresas brasileiras, o custo de latência de us-east-1 (AWS Virgínia) vs. sa-east-1 (São Paulo) em LLM inference pode valer a pena aceitar — especialmente para tasks batch ou assíncronas

A estratégia pragmática: hibridismo de cloud

Na 10Dobro, a tese é clara há dois anos: rodar onde faz sentido para o caso de uso, não onde a IA foi treinada.

Tasks síncronas de baixa latência (chatbot em tempo real, autocomplete): modelos hospedados em São Paulo ou via edge (Cloudflare Workers AI)
Tasks assíncronas de alta qualidade (geração de artigo, análise complexa): frontier models em us-east-1
Tasks de volume alto e baixa complexidade (extração de dados, categorização): modelos abertos auto-hospedados onde cabe no orçamento

Com Rubin consolidando os frontier models ainda mais em datacenter de alta barreira, esse hibridismo pragmático se torna menos opção e mais necessidade para quem quer controlar custos.

O que acompanhar

**Q4 2026**: primeiros envios de Rubin para hyperscalers; preços de inferência Rubin via API devem ser anunciados
**AMD MI400 (codinome "Aqua Ventures")**: concorrente da AMD para liquid cooling, previsto para H1 2027
**Legislação de eficiência energética em datacenter**: UE e estados americanos como Virginia e Georgia estão discutindo regulação de PUE mínimo — o que favorece liquid cooling
**Retrofits no Brasil**: Equinix e Ascenty não divulgaram planos públicos de upgrade para liquid cooling em São Paulo, mas a pressão de clientes deve forçar nos próximos 18 meses

Fontes

Nvidia — apresentação Computex 2026 (investor.nvidia.com)
SemiAnalysis — *Rubin Architecture Deep Dive: What We Know* (jun. 2026)
Uptime Institute — *Liquid Cooling Retrofit Cost Guide* (2025)
IBGE / Agência Nacional de Telecomunicações (Anatel) — dados de infraestrutura de datacenter Brasil (2025)
Gartner — *Hype Cycle for Data Center Infrastructure, 2025*
AMD — roadmap MI400 (apresentação investor day, abr. 2026)
Brazilian Data Center Survey — *Annual Report 2025* (abradata.net.br)

Ben-Hur Real Figueiró

AI Engineer · Diretor de Fotografia · CEO 10Dobro Prod

Tem um projeto de IA, audiovisual ou crescimento?

Conversar com a gente →