La "bomba nuclear" de 2,5 toneladas en CES 2026: cómo NVIDIA rediseña el futuro de la IA con Vera Rubin

Al CES 2026, Jensen Huang ha portato sul palco qualcosa di insolito: non una scheda grafica consumer, ma un intero rack server AI da 2,5 tonnellate. Questo gesto simbolico introduce quella che può essere definita la vera “bomba nucleare” dell’evento: la piattaforma di calcolo Vera Rubin, un ecosistema hardware completamente ripensato per accelerare l’addestramento dei modelli AI di nuova generazione.

Sei chip, un’unica visione: l’architettura che sfida il rallentamento di Moore

Vera Rubin rappresenta un cambio di paradigma rispetto al passato NVIDIA. Mentre tradizionalmente ogni generazione di processori vedeva l’evoluzione di soli 1-2 chip, questa volta l’azienda ha riprogettato simultaneamente 6 componenti diversi, tutti già in produzione.

Il motivo è semplice ma profondo: la legge di Moore non basta più. I modelli AI crescono di 10 volte all’anno, ma i miglioramenti tradizionali delle prestazioni non riescono a stare al passo. NVIDIA ha scelto quindi l’innovazione “sincronizzata su ogni livello” della piattaforma.

I sei pilastri della “bomba nucleare” tecnologica:

La CPU Vera integra 88 core Olympus personalizzati, supporta 176 thread tramite la tecnologia multithreading spaziale NVIDIA, e offre una memoria di sistema di 1,5 TB—il triplo rispetto alla generazione Grace precedente. La larghezza di banda NVLink raggiunge 1,8 TB/s.

La GPU Rubin è la vera stella: con una potenza di inferenza NVFP4 di 50 PFLOPS (5 volte superiore a Blackwell), contiene 336 miliardi di transistor e include il terzo motore Transformer che adatta dinamicamente la precisione secondo le esigenze.

La scheda di rete ConnectX-9 supporta Ethernet a 800 Gb/s con RDMA programmabile, mentre il BlueField-4 DPU è stato specificamente progettato per gestire le nuove architetture di storage AI, combinando una CPU Grace a 64 core con 126 miliardi di transistor.

Lo switch NVLink-6 connette fino a 18 nodi di calcolo, permettendo a 72 GPU Rubin di operare come un’unica macchina coerente, con una larghezza di banda all-to-all di 3,6 TB/s per GPU. Infine, lo switch ottico Spectrum-6 utilizza 512 canali a 200Gbps ciascuno, integrando la silicon photonics.

Prestazioni che cambiano il gioco: dal 3,5x al 10x di miglioramento

Nel sistema Vera Rubin NVL72, il salto prestazionale rispetto a Blackwell è drammatico. L’inferenza NVFP4 raggiunge 3,6 EFLOPS (+5x), mentre l’addestramento arriva a 2,5 EFLOPS (+3,5x). La memoria disponibile quasi triplica: 54TB di LPDDR5X e 20,7TB di HBM.

Ma il dato più impressionante riguarda l’efficienza. Nonostante i transistor aumentino solo di 1,7 volte (raggiungendo 220 trilioni), la produttività misurata in token AI per watt-per-dollaro cresce di 10 volte. Per un data center da 50 miliardi di dollari e un gigawatt di potenza, questo significa raddoppiare direttamente la capacità di ricavo.

In termini concreti: per addestrare un modello da 100 trilioni di parametri, Vera Rubin richiede solo 1/4 dei sistemi Blackwell, e il costo per generare un token scende a circa 1/10 del precedente.

Ingegneria rivoluzionaria: dall’assemblaggio alla refrigerazione

La “bomba nucleare” hardware non è solo potenza bruta. L’ingegneria di Vera Rubin risolve problemi pratici che affliggevano i sistemi precedenti. I vecchi nodi supercomputing richiedevano 43 cavi e 2 ore di assemblaggio manuale; i nodi Vera utilizzano zero cavi, solo 6 tubi di refrigerazione a liquido, e si montano in 5 minuti.

Il retro del rack contiene quasi 3,2 km di cavi di rame dedicati: 5.000 cavi formano la spina dorsale NVLink a 400Gbps. Come ha ironicamente osservato Jensen Huang: “Potrebbero pesare diverse centinaia di libbre—devi essere un CEO in gran forma per questo lavoro”.

Il problema della memoria di contesto: la soluzione BlueField-4

L’AI contemporanea affronta un collo di bottiglia critico: la “KV Cache” (memoria di lavoro dell’AI) cresce con dialoghi più lunghi e modelli più grandi. Vera Rubin risolve questo con i processori BlueField-4 integrati nel rack, ciascuno dotato di 150TB di memoria di contesto.

Ogni nodo ha 4 BlueField-4, che distribuiscono memoria alle GPU: ogni GPU riceve 16TB di memoria aggiuntiva oltre ai suoi 1TB nativi, mantenendo una banda di 200Gbps senza compromessi di velocità.

Spectrum-X: la rete progettata per l’AI generativa

Affinché decine di rack e migliaia di GPU lavorino come un’unica memoria distribuita, la rete deve essere “grande, veloce e stabile”. Spectrum-X è la prima piattaforma Ethernet end-to-end al mondo specificamente progettata per l’AI generativa.

L’ultima generazione utilizza il processo COOP di TSMC e la silicon photonics, con 512 canali a 200Gbps ciascuno. Il calcolo di Jensen Huang è persuasivo: migliorando la produttività del 25%, equivale a risparmiare 5 miliardi di dollari su un data center da 50 miliardi di dollari. “Si potrebbe dire che questo sistema di rete è quasi gratuito”, ha sottolineato.

Dalla teoria all’azione: AI fisica, robotica e guida autonoma

Il focus della “bomba nucleare” non è solo hardware. Jensen Huang ha enfatizzato come circa 10 trilioni di dollari di risorse di calcolo accumulati nel decennio stiano subendo una modernizzazione completa, ma non solo hardware—bensì un cambio di paradigma software.

L’architettura dei “tre computer” per l’AI fisica:

Computer di addestramento basati su GPU di classe training come l’architettura GB300. Computer di inferenza, il “cervelletto” che esegue decisioni in tempo reale su robot ed edge device. Computer di simulazione (Omniverse e Cosmos) che generano ambienti virtuali dove l’AI apprende feedback fisici.

Alpamayo: la guida autonoma con capacità di ragionamento

Su questa architettura, NVIDIA ha presentato Alpamayo, il primo sistema di guida autonoma dotato di vera capacità di ragionamento. A differenza dei sistemi tradizionali, Alpamayo è completamente end-to-end e risolve il “problema della coda lunga”—quando affronta situazioni stradali mai incontrate, non esegue solo codice meccanico, ma ragiona come un guidatore umano.

La Mercedes CLA equipaggiata con Alpamayo sarà lanciata negli Stati Uniti nel primo trimestre 2026, seguita da Europa e Asia. Il sistema ha ricevuto la valutazione di NCAP come il veicolo più sicuro al mondo, grazie al “doppio stack di sicurezza” NVIDIA: quando il modello AI ha poca fiducia, il sistema torna immediatamente a una modalità di sicurezza tradizionale.

La strategia robotica: da Boston Dynamics a Disney

NVIDIA ha mostrato come nove grandi aziende AI e hardware stiano tutte espandendo verso la robotica. Ogni robot utilizzerà computer Jetson, verrà addestrato nel simulatore Isaac di Omniverse, e la tecnologia sarà integrata nei sistemi industriali di Synopsys, Cadence, Siemens e altri.

Jensen Huang ha invitato robot umanoidi e quadrupedi di aziende come Boston Dynamics e Agility, sottolineando una prospettiva affascinante: il più grande robot è la fabbrica stessa. La visione è che la progettazione di chip, sistemi e simulazioni di fabbrica saranno tutte accelerate dall’AI fisica.

Perché questa “bomba nucleare” in questo momento?

In un contesto dove cresce lo scetticismo su una presunta “bolla AI”, Jensen Huang ha dato priorità non solo alla potenza bruta di calcolo, ma alle applicazioni concrete. La “bomba nucleare” da 2,5 tonnellate è sia un simbolo che una promessa: dimostrare che l’AI può davvero trasformare sia il mondo digitale che quello fisico.

NVIDIA, che in passato vendeva “pale per cercatori d’oro”, ora entra direttamente nel mercato dove le competizioni sono più agguerrite—AI fisica, robotica, guida autonoma. Come ha suggerito Huang stesso: “Quando la guerra è in corso, si possono continuare a vendere armi”.

Ma la vera innovazione di Vera Rubin non è costruire una “bomba nucleare” hardware più potente—è dimostrare che sincronizzando l’innovazione su ogni livello della piattaforma, i limiti tradizionali possono essere superati.

TOKEN6,18%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)