O desafio que não se pode ignorar: a Lei de Moore desacelera, a procura por IA explode
A indústria enfrenta uma paradoxo desconfortável: enquanto a velocidade de melhoria do silício desacelera, os modelos de inteligência artificial exigem aumentos de desempenho exponenciais a cada ano. Para um centro de dados de 1 GW que custa 50 mil milhões de dólares, a diferença entre uma arquitetura antiga e uma nova pode significar duplicar diretamente a sua capacidade de geração de receitas.
Jensen Huang, o CEO de um dos líderes tecnológicos mundiais, reconhece abertamente este dilema: os métodos tradicionais de otimização já não conseguem acompanhar o ritmo. Por isso, em vez de trocar apenas 1 ou 2 chips por geração como costumavam fazer, desta vez apostaram num redesenho integral de 6 componentes-chave da plataforma de computação Vera Rubin, que já está em fase de produção em massa.
Vera Rubin: a arquitetura que reescreve as regras do jogo
O verdadeiro protagonista deste ciclo não é uma placa gráfica convencional, mas um ecossistema completo de processamento. Vera Rubin, nomeada em homenagem à astrónoma que descobriu a matéria escura, representa uma mudança de mentalidade: inovar simultaneamente em todos os níveis da plataforma.
Os 6 pilares desta arquitetura são:
Vera CPU fornece a inteligência e coordenação. Equipado com 88 núcleos Olympus personalizados, suporta 176 fios simultâneos graças à tecnologia de multithreading espacial. A largura de banda NVLink C2C de 1.8 TB/s e a memória do sistema de 1.5 TB (tripla em relação à geração anterior) garantem que não haja gargalos nas operações fundamentais. Com 227 mil milhões de transistores, integra a potência de processamento necessária para coordenar operações massivas.
Rubin GPU, o coração computacional, alcança 50 PFLOPS de potência de inferência em precisão reduzida, cinco vezes superior à arquitetura Blackwell. Com 336 mil milhões de transistores, incorpora a terceira geração de motores Transformer que ajustam dinamicamente a precisão conforme as necessidades específicas do modelo.
A placa de rede ConnectX-9 oferece conectividade ultrarrápida com Ethernet de 800 Gb/s baseada em tecnologia PAM4 de 200G. Inclui RDMA programável e acelerador de rota de dados, além de certificações de segurança CNSA e FIPS com seus 23 mil milhões de transistores.
BlueField-4 DPU surge como o processador especializado para armazenamento de IA de nova geração. Com 800 Gb/s de capacidade SmartNIC, combina a CPU Grace de 64 núcleos com ConnectX-9, integrando 126 mil milhões de transistores dedicados a esta função crítica.
O chip comutador NVLink-6 é o orquestrador da rede interna. Pode conectar 18 nós de computação e coordenar até 72 GPUs Rubin funcionando como um único sistema coeso. Com arquitetura NVLink 6, cada GPU atinge 3.6 TB/s de largura de banda all-to-all, permitindo comunicação coletiva ultrarrápida dentro da rede.
Finalmente, o comutador ótico Spectrum-6 gere 512 canais de 200Gbps cada para transferências que superam as velocidades convencionais. Fabricado com tecnologia de silício fotónico integrado através da TSMC COOP, oferece 352 mil milhões de transistores dedicados à interconexão ótica de copackaged.
Números que falam: melhorias de desempenho sem precedentes
O sistema NVL72 resultante desta integração profunda estabelece novos padrões. Em tarefas de inferência com precisão reduzida, alcança 3.6 EFLOPS, quintuplicando a geração anterior. Para treino, chega a 2.5 EFLOPS, um aumento de 3.5 vezes.
A memória disponível triplicou: 54TB de LPDDR5X no sistema principal versus 20.7TB de HBM de alto largura de banda. A largura de banda HBM4 sobe para 1.6 PB/s (2.8 vezes superior), enquanto a largura de banda Scale-Up atinge 260 TB/s, o dobro da geração anterior.
O mais notável: estes saltos de desempenho foram alcançados com apenas 1.7 vezes mais transistores (2.2 biliões no total), demonstrando que a inovação em arquitetura é tão importante quanto a densidade de silício.
Desde o digital ao físico: a próxima fronteira
Embora os números sejam impressionantes, o seu verdadeiro impacto reside nas aplicações. A IA agora exige passar do mundo digital para o físico. Para isso, são necessários três tipos de computação integrada:
A computador de treino construído com arquiteturas como o GB300 que geram os modelos base. A computador de inferência, o “cerebelo” que opera em robôs ou veículos autónomos em tempo real. E o computador de simulação, incluindo plataformas como Omniverse e Cosmos, que fornecem ambientes virtuais onde a IA aprende com retroalimentação física antes de atuar no mundo real.
Alpamayo: condução autónoma que raciocina
Baseado nesta arquitetura de tripla computação, surge o Alpamayo, o primeiro sistema de condução autónoma com capacidades de raciocínio genuíno. Ao contrário de sistemas tradicionais que executam instruções rígidas, o Alpamayo raciocina como um condutor humano. Pode explicar o que fará a seguir e porquê.
O Mercedes CLA equipado com esta tecnologia será lançado oficialmente nos Estados Unidos no primeiro trimestre deste ano, expandindo-se posteriormente para a Europa e Ásia. Este veículo foi classificado pela NCAP como o mais seguro do mundo, graças à arquitetura de “dupla pilha de segurança” que alterna entre o sistema de IA de ponta a ponta e protocolos de segurança tradicionais quando a confiança diminui.
Robótica: além dos humanoides
A estratégia estende-se a robôs humanoides e quadrúpedes, todos equipados com o miniordenador Jetson e treinados no simulador Isaac. A integração também abrange sistemas industriais como ferramentas da Synopsys, Cadence e Siemens.
Jensen Huang brincou durante a apresentação: “O robô mais grande é a própria fábrica. Os robôs serão desenhados em computadores, fabricados em computadores, e até testados e verificados virtualmente em computadores antes de enfrentarem a gravidade real”.
O contexto mais amplo: 10 biliões de dólares em modernização
Na última década, aproximadamente 10 biliões de dólares em infraestrutura de computação global estão a ser completamente modernizados. Mas isto não é apenas uma atualização de hardware. Representa uma mudança de paradigma em como o software é desenvolvido e implementado.
A ascensão de modelos abertos, exemplificada por sistemas como o DeepSeek que surpreendeu o mundo com a sua eficiência de inferência, catalisou uma onda de inovação. Embora estes modelos possam ficar defasados 6 meses em relação aos mais avançados, a cada meio ano surge uma nova geração com capacidades competitivas.
Esta velocidade de iteração mantém startups, gigantes tecnológicos e investigadores em constante movimento. A plataforma de modelos Nemotron de código aberto abrange biomedicina, IA física, agentes inteligentes, robótica e condução autónoma, com múltiplas versões destacando-se em rankings independentes e sendo amplamente adotadas por empresas de toda a escala.
Eficiência que compensa: tokens por watt e dólar
Embora Vera Rubin consuma o dobro de energia que os seus predecessores, o desempenho multiplica-se de forma desproporcional. A métrica crítica é o throughput de tokens gerados por watt e por dólar: um aumento de 10 vezes.
Para um centro de dados de 1 GW, isto significa que o Spectrum-X melhora o throughput em 25%, equivalente a poupar 5 mil milhões de dólares em infraestrutura. “Este sistema de rede é praticamente grátis”, nas palavras do executivo.
Resolving the KV Cache: o maior obstáculo da IA generativa
A verdadeira dor de cabeça da indústria é o “KV Cache”, a memória de trabalho que a IA consome durante conversas longas. À medida que os modelos crescem e as conversas se expandem, a memória HBM disponível esgota-se.
Vera Rubin resolve isto ao implementar processadores BlueField-4 dentro de cada bastidor. Cada nó contém 4 BlueField-4, fornecendo 150TB de memória de contexto distribuída entre as GPUs, com 16TB adicionais por GPU mantendo uma largura de banda de 200Gbps. Assim, milhares de GPUs dispersas em dezenas de bastidores funcionam como uma única memória coerente.
O significado geopolítico desta “bomba nuclear”
A apresentação de Vera Rubin representa algo mais profundo do que inovação técnica. Numa era de ceticismo sobre se a bolha de IA é sustentável, Jensen Huang precisava de demonstrar com factos concretos que capacidades reais a IA habilita: desde condução autónoma segura até robôs industriais, desde síntese de proteínas até sistemas de código aberto que democratizam a tecnologia.
Há anos, a empresa vendia “as pás na febre do ouro”. Agora, participa diretamente na transformação de indústrias físicas, desde automotiva até manufatura. Esta evolução de fornecedor de componentes a orquestrador de ecossistemas marca uma transição fundamental em como a indústria tecnológica se posiciona para a próxima década.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
A revolução da computação massiva: como a "bomba nuclear" de Vera Rubin redefine a carreira da IA
O desafio que não se pode ignorar: a Lei de Moore desacelera, a procura por IA explode
A indústria enfrenta uma paradoxo desconfortável: enquanto a velocidade de melhoria do silício desacelera, os modelos de inteligência artificial exigem aumentos de desempenho exponenciais a cada ano. Para um centro de dados de 1 GW que custa 50 mil milhões de dólares, a diferença entre uma arquitetura antiga e uma nova pode significar duplicar diretamente a sua capacidade de geração de receitas.
Jensen Huang, o CEO de um dos líderes tecnológicos mundiais, reconhece abertamente este dilema: os métodos tradicionais de otimização já não conseguem acompanhar o ritmo. Por isso, em vez de trocar apenas 1 ou 2 chips por geração como costumavam fazer, desta vez apostaram num redesenho integral de 6 componentes-chave da plataforma de computação Vera Rubin, que já está em fase de produção em massa.
Vera Rubin: a arquitetura que reescreve as regras do jogo
O verdadeiro protagonista deste ciclo não é uma placa gráfica convencional, mas um ecossistema completo de processamento. Vera Rubin, nomeada em homenagem à astrónoma que descobriu a matéria escura, representa uma mudança de mentalidade: inovar simultaneamente em todos os níveis da plataforma.
Os 6 pilares desta arquitetura são:
Vera CPU fornece a inteligência e coordenação. Equipado com 88 núcleos Olympus personalizados, suporta 176 fios simultâneos graças à tecnologia de multithreading espacial. A largura de banda NVLink C2C de 1.8 TB/s e a memória do sistema de 1.5 TB (tripla em relação à geração anterior) garantem que não haja gargalos nas operações fundamentais. Com 227 mil milhões de transistores, integra a potência de processamento necessária para coordenar operações massivas.
Rubin GPU, o coração computacional, alcança 50 PFLOPS de potência de inferência em precisão reduzida, cinco vezes superior à arquitetura Blackwell. Com 336 mil milhões de transistores, incorpora a terceira geração de motores Transformer que ajustam dinamicamente a precisão conforme as necessidades específicas do modelo.
A placa de rede ConnectX-9 oferece conectividade ultrarrápida com Ethernet de 800 Gb/s baseada em tecnologia PAM4 de 200G. Inclui RDMA programável e acelerador de rota de dados, além de certificações de segurança CNSA e FIPS com seus 23 mil milhões de transistores.
BlueField-4 DPU surge como o processador especializado para armazenamento de IA de nova geração. Com 800 Gb/s de capacidade SmartNIC, combina a CPU Grace de 64 núcleos com ConnectX-9, integrando 126 mil milhões de transistores dedicados a esta função crítica.
O chip comutador NVLink-6 é o orquestrador da rede interna. Pode conectar 18 nós de computação e coordenar até 72 GPUs Rubin funcionando como um único sistema coeso. Com arquitetura NVLink 6, cada GPU atinge 3.6 TB/s de largura de banda all-to-all, permitindo comunicação coletiva ultrarrápida dentro da rede.
Finalmente, o comutador ótico Spectrum-6 gere 512 canais de 200Gbps cada para transferências que superam as velocidades convencionais. Fabricado com tecnologia de silício fotónico integrado através da TSMC COOP, oferece 352 mil milhões de transistores dedicados à interconexão ótica de copackaged.
Números que falam: melhorias de desempenho sem precedentes
O sistema NVL72 resultante desta integração profunda estabelece novos padrões. Em tarefas de inferência com precisão reduzida, alcança 3.6 EFLOPS, quintuplicando a geração anterior. Para treino, chega a 2.5 EFLOPS, um aumento de 3.5 vezes.
A memória disponível triplicou: 54TB de LPDDR5X no sistema principal versus 20.7TB de HBM de alto largura de banda. A largura de banda HBM4 sobe para 1.6 PB/s (2.8 vezes superior), enquanto a largura de banda Scale-Up atinge 260 TB/s, o dobro da geração anterior.
O mais notável: estes saltos de desempenho foram alcançados com apenas 1.7 vezes mais transistores (2.2 biliões no total), demonstrando que a inovação em arquitetura é tão importante quanto a densidade de silício.
Desde o digital ao físico: a próxima fronteira
Embora os números sejam impressionantes, o seu verdadeiro impacto reside nas aplicações. A IA agora exige passar do mundo digital para o físico. Para isso, são necessários três tipos de computação integrada:
A computador de treino construído com arquiteturas como o GB300 que geram os modelos base. A computador de inferência, o “cerebelo” que opera em robôs ou veículos autónomos em tempo real. E o computador de simulação, incluindo plataformas como Omniverse e Cosmos, que fornecem ambientes virtuais onde a IA aprende com retroalimentação física antes de atuar no mundo real.
Alpamayo: condução autónoma que raciocina
Baseado nesta arquitetura de tripla computação, surge o Alpamayo, o primeiro sistema de condução autónoma com capacidades de raciocínio genuíno. Ao contrário de sistemas tradicionais que executam instruções rígidas, o Alpamayo raciocina como um condutor humano. Pode explicar o que fará a seguir e porquê.
O Mercedes CLA equipado com esta tecnologia será lançado oficialmente nos Estados Unidos no primeiro trimestre deste ano, expandindo-se posteriormente para a Europa e Ásia. Este veículo foi classificado pela NCAP como o mais seguro do mundo, graças à arquitetura de “dupla pilha de segurança” que alterna entre o sistema de IA de ponta a ponta e protocolos de segurança tradicionais quando a confiança diminui.
Robótica: além dos humanoides
A estratégia estende-se a robôs humanoides e quadrúpedes, todos equipados com o miniordenador Jetson e treinados no simulador Isaac. A integração também abrange sistemas industriais como ferramentas da Synopsys, Cadence e Siemens.
Jensen Huang brincou durante a apresentação: “O robô mais grande é a própria fábrica. Os robôs serão desenhados em computadores, fabricados em computadores, e até testados e verificados virtualmente em computadores antes de enfrentarem a gravidade real”.
O contexto mais amplo: 10 biliões de dólares em modernização
Na última década, aproximadamente 10 biliões de dólares em infraestrutura de computação global estão a ser completamente modernizados. Mas isto não é apenas uma atualização de hardware. Representa uma mudança de paradigma em como o software é desenvolvido e implementado.
A ascensão de modelos abertos, exemplificada por sistemas como o DeepSeek que surpreendeu o mundo com a sua eficiência de inferência, catalisou uma onda de inovação. Embora estes modelos possam ficar defasados 6 meses em relação aos mais avançados, a cada meio ano surge uma nova geração com capacidades competitivas.
Esta velocidade de iteração mantém startups, gigantes tecnológicos e investigadores em constante movimento. A plataforma de modelos Nemotron de código aberto abrange biomedicina, IA física, agentes inteligentes, robótica e condução autónoma, com múltiplas versões destacando-se em rankings independentes e sendo amplamente adotadas por empresas de toda a escala.
Eficiência que compensa: tokens por watt e dólar
Embora Vera Rubin consuma o dobro de energia que os seus predecessores, o desempenho multiplica-se de forma desproporcional. A métrica crítica é o throughput de tokens gerados por watt e por dólar: um aumento de 10 vezes.
Para um centro de dados de 1 GW, isto significa que o Spectrum-X melhora o throughput em 25%, equivalente a poupar 5 mil milhões de dólares em infraestrutura. “Este sistema de rede é praticamente grátis”, nas palavras do executivo.
Resolving the KV Cache: o maior obstáculo da IA generativa
A verdadeira dor de cabeça da indústria é o “KV Cache”, a memória de trabalho que a IA consome durante conversas longas. À medida que os modelos crescem e as conversas se expandem, a memória HBM disponível esgota-se.
Vera Rubin resolve isto ao implementar processadores BlueField-4 dentro de cada bastidor. Cada nó contém 4 BlueField-4, fornecendo 150TB de memória de contexto distribuída entre as GPUs, com 16TB adicionais por GPU mantendo uma largura de banda de 200Gbps. Assim, milhares de GPUs dispersas em dezenas de bastidores funcionam como uma única memória coerente.
O significado geopolítico desta “bomba nuclear”
A apresentação de Vera Rubin representa algo mais profundo do que inovação técnica. Numa era de ceticismo sobre se a bolha de IA é sustentável, Jensen Huang precisava de demonstrar com factos concretos que capacidades reais a IA habilita: desde condução autónoma segura até robôs industriais, desde síntese de proteínas até sistemas de código aberto que democratizam a tecnologia.
Há anos, a empresa vendia “as pás na febre do ouro”. Agora, participa diretamente na transformação de indústrias físicas, desde automotiva até manufatura. Esta evolução de fornecedor de componentes a orquestrador de ecossistemas marca uma transição fundamental em como a indústria tecnológica se posiciona para a próxima década.