El desafío que no se puede ignorar: la Ley de Moore se ralentiza, la demanda de IA explota
La industria enfrenta una paradoja incómoda: mientras la velocidad de mejora del silicio se desacelera, los modelos de inteligencia artificial exigen aumentos de rendimiento exponenciales cada año. Para un centro de datos de 1 GW que cuesta 50 mil millones de dólares, la diferencia entre una arquitectura antigua y una nueva puede significar duplicar directamente su capacidad de generación de ingresos.
Jensen Huang, el CEO de uno de los líderes tecnológicos mundiales, reconoce abiertamente este dilema: los métodos tradicionales de optimización ya no pueden seguir el ritmo. Por eso, en lugar de cambiar solo 1 o 2 chips por generación como solían hacer, esta vez apostaron por un rediseño integral de 6 componentes clave de la plataforma de computación Vera Rubin, que ya está en fase de producción masiva.
Vera Rubin: la arquitectura que reescribe las reglas del juego
El verdadero protagonista de este ciclo no es una tarjeta gráfica convencional, sino un ecosistema completo de procesamiento. Vera Rubin, nombrada en honor a la astrónoma que descubrió la materia oscura, representa un cambio de mentalidad: innovar simultáneamente en todos los niveles de la plataforma.
Los 6 pilares de esta arquitectura son:
Vera CPU proporciona la inteligencia y coordinación. Equipada con 88 núcleos Olympus personalizados, soporta 176 hilos simultáneos gracias a la tecnología de multihilo espacial. El ancho de banda NVLink C2C de 1.8 TB/s y la memoria del sistema de 1.5 TB (triple respecto a la generación anterior) garantizan que no haya cuellos de botella en las operaciones fundamentales. Con 227 mil millones de transistores, integra la potencia de procesamiento necesaria para coordinar operaciones masivas.
Rubin GPU, el corazón computacional, alcanza 50 PFLOPS de potencia de inferencia en precisión reducida, cinco veces superior a la arquitectura Blackwell. Con 336 mil millones de transistores, incorpora la tercera generación de motores Transformer que ajustan dinámicamente la precisión según las necesidades específicas del modelo.
La tarjeta de red ConnectX-9 aporta conectividad ultrarrápida con Ethernet de 800 Gb/s basado en tecnología PAM4 de 200G. Incluye RDMA programable y acelerador de ruta de datos, además de certificaciones de seguridad CNSA y FIPS con sus 23 mil millones de transistores.
BlueField-4 DPU emerge como el procesador especializado para almacenamiento de IA de nueva generación. Con 800 Gb/s de capacidad SmartNIC, combina la CPU Grace de 64 núcleos con ConnectX-9, integrando 126 mil millones de transistores dedicados a esta función crítica.
El chip conmutador NVLink-6 es el orquestador de la red interna. Puede conectar 18 nodos de cómputo y coordinar hasta 72 GPUs Rubin funcionando como un único sistema cohesivo. Con arquitectura NVLink 6, cada GPU alcanza 3.6 TB/s de ancho de banda all-to-all, permitiendo comunicación colectiva ultrarrápida dentro de la red.
Finalmente, el conmutador óptico Spectrum-6 maneja 512 canales de 200Gbps cada uno para transferencias que superan las velocidades convencionales. Fabricado con tecnología de silicio fotónico integrado mediante TSMC COOP, ofrece 352 mil millones de transistores dedicados a la interconexión óptica de copackaged.
Números que hablan: mejoras de rendimiento sin precedentes
El sistema NVL72 resultante de esta integración profunda establece nuevos estándares. En tareas de inferencia con precisión reducida, alcanza 3.6 EFLOPS, quintuplicando la generación anterior. Para entrenamiento, llega a 2.5 EFLOPS, un incremento de 3.5 veces.
La memoria disponible se triplicó: 54TB de LPDDR5X en el sistema principal versus 20.7TB de HBM de alto ancho de banda. El ancho de banda HBM4 asciende a 1.6 PB/s (2.8 veces superior), mientras que el ancho de banda Scale-Up alcanza 260 TB/s, el doble de la generación previa.
Lo más notable: estos saltos de rendimiento se lograron con solo 1.7 veces más transistores (2.2 billones en total), demostrando que la innovación en arquitectura es tan importante como la densidad de silicio.
Desde lo digital a lo físico: la próxima frontera
Aunque los números son impresionantes, su verdadero impacto reside en las aplicaciones. La IA requiere ahora pasar del mundo digital al físico. Para esto, se necesitan tres tipos de computación integrada:
La computadora de entrenamiento construida con arquitecturas como GB300 que generan los modelos base. La computadora de inferencia, el “cerebelo” que opera en robots o vehículos autónomos en tiempo real. Y la computadora de simulación, incluyendo plataformas como Omniverse y Cosmos, que proporcionan ambientes virtuales donde la IA aprende retroalimentación física antes de operar en el mundo real.
Alpamayo: conducción autónoma que razona
Basada en esta arquitectura de triple computadora, surge Alpamayo, el primer sistema de conducción autónoma con capacidades de razonamiento genuino. A diferencia de sistemas tradicionales que ejecutan instrucciones rígidas, Alpamayo razona como un conductor humano. Puede explicar qué hará a continuación y por qué lo decide.
El Mercedes CLA equipado con esta tecnología se lanzará oficialmente en Estados Unidos en el primer trimestre de este año, expandiéndose posteriormente a Europa y Asia. Este vehículo fue calificado por NCAP como el más seguro del mundo, gracias a la arquitectura de “doble pila de seguridad” que alterna entre el sistema de IA de extremo a extremo y protocolos de seguridad tradicionales cuando la confianza disminuye.
Robótica: más allá de los humanoides
La estrategia se extiende a robots humanoides y cuadrúpedos, todos equipados con el miniordenador Jetson y entrenados en el simulador Isaac. La integración también alcanza sistemas industriales como herramientas de Synopsys, Cadence y Siemens.
Jensen Huang bromeó durante la presentación: “El robot más grande es la fábrica misma. Los robots serán diseñados en computadoras, fabricados en computadoras, e incluso probados y verificados virtualmente en computadoras antes de enfrentarse a la gravedad real”.
El contexto más amplio: 10 billones de dólares en modernización
En la última década, aproximadamente 10 billones de dólares en infraestructura de cómputo global están siendo completamente modernizados. Pero esto no es solo una actualización de hardware. Representa un cambio de paradigma en cómo el software se desarrolla y despliega.
La ascensión de modelos abiertos, ejemplificada por sistemas como DeepSeek que sorprendió al mundo con su eficiencia de inferencia, ha catalizado una ola de innovación. Aunque estos modelos pueden rezagarse 6 meses respecto a los más avanzados, cada medio año emerge una nueva generación con capacidades competitivas.
Esta velocidad de iteración mantiene a startups, gigantes tecnológicos e investigadores en constante movimiento. La plataforma de modelos Nemotron de código abierto abarca biomedicina, IA física, agentes inteligentes, robótica y conducción autónoma, con múltiples versiones destacando en rankings independientes y siendo ampliamente adoptadas por empresas de toda escala.
Eficiencia que compensa: tokens por vatio y dólar
Aunque Vera Rubin consume el doble de energía que sus predecesores, el rendimiento se multiplica de manera desproporcionada. La métrica crítica es el throughput de tokens generados por vatio y por dólar: un aumento de 10 veces.
Para un centro de datos de 1 GW, esto significa que Spectrum-X mejora el throughput en un 25%, equivalente a ahorrar 5 mil millones de dólares en infraestructura. “Este sistema de red es prácticamente gratis”, en palabras del ejecutivo.
Resolviendo el KV Cache: el mayor obstáculo de la IA generativa
El verdadero dolor de cabeza de la industria es el “KV Cache”, la memoria de trabajo que la IA consume durante conversaciones largas. Conforme los modelos crecen y las conversaciones se expanden, la memoria HBM disponible se agota.
Vera Rubin resuelve esto desplegando procesadores BlueField-4 dentro de cada bastidor. Cada nodo contiene 4 BlueField-4, proporcionando 150TB de memoria de contexto distribuida entre las GPUs, con 16TB adicionales por GPU manteniendo un ancho de banda de 200Gbps. Así, miles de GPUs dispersas en decenas de bastidores funcionan como una única memoria coherente.
El significado geopolítico de esta “bomba nuclear”
La presentación de Vera Rubin representa algo más profundo que innovación técnica. En una era de escepticismo sobre si la burbuja de IA es sostenible, Jensen Huang necesitaba demostrar con hechos concretos qué capacidades reales habilita la IA: desde conducción autónoma segura hasta robots industriales, desde síntesis de proteínas hasta sistemas de código abierto que democratizan la tecnología.
Hace años, la compañía vendía “las palas en la fiebre del oro”. Ahora, participa directamente en la transformación de industrias físicas, desde automoción hasta manufactura. Esta evolución de proveedor de componentes a orquestador de ecosistemas marca una transición fundamental en cómo la industria tecnológica se posiciona para la próxima década.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
La revolución de la computación masiva: cómo la "bomba nuclear" de Vera Rubin redefine la carrera de la IA
El desafío que no se puede ignorar: la Ley de Moore se ralentiza, la demanda de IA explota
La industria enfrenta una paradoja incómoda: mientras la velocidad de mejora del silicio se desacelera, los modelos de inteligencia artificial exigen aumentos de rendimiento exponenciales cada año. Para un centro de datos de 1 GW que cuesta 50 mil millones de dólares, la diferencia entre una arquitectura antigua y una nueva puede significar duplicar directamente su capacidad de generación de ingresos.
Jensen Huang, el CEO de uno de los líderes tecnológicos mundiales, reconoce abiertamente este dilema: los métodos tradicionales de optimización ya no pueden seguir el ritmo. Por eso, en lugar de cambiar solo 1 o 2 chips por generación como solían hacer, esta vez apostaron por un rediseño integral de 6 componentes clave de la plataforma de computación Vera Rubin, que ya está en fase de producción masiva.
Vera Rubin: la arquitectura que reescribe las reglas del juego
El verdadero protagonista de este ciclo no es una tarjeta gráfica convencional, sino un ecosistema completo de procesamiento. Vera Rubin, nombrada en honor a la astrónoma que descubrió la materia oscura, representa un cambio de mentalidad: innovar simultáneamente en todos los niveles de la plataforma.
Los 6 pilares de esta arquitectura son:
Vera CPU proporciona la inteligencia y coordinación. Equipada con 88 núcleos Olympus personalizados, soporta 176 hilos simultáneos gracias a la tecnología de multihilo espacial. El ancho de banda NVLink C2C de 1.8 TB/s y la memoria del sistema de 1.5 TB (triple respecto a la generación anterior) garantizan que no haya cuellos de botella en las operaciones fundamentales. Con 227 mil millones de transistores, integra la potencia de procesamiento necesaria para coordinar operaciones masivas.
Rubin GPU, el corazón computacional, alcanza 50 PFLOPS de potencia de inferencia en precisión reducida, cinco veces superior a la arquitectura Blackwell. Con 336 mil millones de transistores, incorpora la tercera generación de motores Transformer que ajustan dinámicamente la precisión según las necesidades específicas del modelo.
La tarjeta de red ConnectX-9 aporta conectividad ultrarrápida con Ethernet de 800 Gb/s basado en tecnología PAM4 de 200G. Incluye RDMA programable y acelerador de ruta de datos, además de certificaciones de seguridad CNSA y FIPS con sus 23 mil millones de transistores.
BlueField-4 DPU emerge como el procesador especializado para almacenamiento de IA de nueva generación. Con 800 Gb/s de capacidad SmartNIC, combina la CPU Grace de 64 núcleos con ConnectX-9, integrando 126 mil millones de transistores dedicados a esta función crítica.
El chip conmutador NVLink-6 es el orquestador de la red interna. Puede conectar 18 nodos de cómputo y coordinar hasta 72 GPUs Rubin funcionando como un único sistema cohesivo. Con arquitectura NVLink 6, cada GPU alcanza 3.6 TB/s de ancho de banda all-to-all, permitiendo comunicación colectiva ultrarrápida dentro de la red.
Finalmente, el conmutador óptico Spectrum-6 maneja 512 canales de 200Gbps cada uno para transferencias que superan las velocidades convencionales. Fabricado con tecnología de silicio fotónico integrado mediante TSMC COOP, ofrece 352 mil millones de transistores dedicados a la interconexión óptica de copackaged.
Números que hablan: mejoras de rendimiento sin precedentes
El sistema NVL72 resultante de esta integración profunda establece nuevos estándares. En tareas de inferencia con precisión reducida, alcanza 3.6 EFLOPS, quintuplicando la generación anterior. Para entrenamiento, llega a 2.5 EFLOPS, un incremento de 3.5 veces.
La memoria disponible se triplicó: 54TB de LPDDR5X en el sistema principal versus 20.7TB de HBM de alto ancho de banda. El ancho de banda HBM4 asciende a 1.6 PB/s (2.8 veces superior), mientras que el ancho de banda Scale-Up alcanza 260 TB/s, el doble de la generación previa.
Lo más notable: estos saltos de rendimiento se lograron con solo 1.7 veces más transistores (2.2 billones en total), demostrando que la innovación en arquitectura es tan importante como la densidad de silicio.
Desde lo digital a lo físico: la próxima frontera
Aunque los números son impresionantes, su verdadero impacto reside en las aplicaciones. La IA requiere ahora pasar del mundo digital al físico. Para esto, se necesitan tres tipos de computación integrada:
La computadora de entrenamiento construida con arquitecturas como GB300 que generan los modelos base. La computadora de inferencia, el “cerebelo” que opera en robots o vehículos autónomos en tiempo real. Y la computadora de simulación, incluyendo plataformas como Omniverse y Cosmos, que proporcionan ambientes virtuales donde la IA aprende retroalimentación física antes de operar en el mundo real.
Alpamayo: conducción autónoma que razona
Basada en esta arquitectura de triple computadora, surge Alpamayo, el primer sistema de conducción autónoma con capacidades de razonamiento genuino. A diferencia de sistemas tradicionales que ejecutan instrucciones rígidas, Alpamayo razona como un conductor humano. Puede explicar qué hará a continuación y por qué lo decide.
El Mercedes CLA equipado con esta tecnología se lanzará oficialmente en Estados Unidos en el primer trimestre de este año, expandiéndose posteriormente a Europa y Asia. Este vehículo fue calificado por NCAP como el más seguro del mundo, gracias a la arquitectura de “doble pila de seguridad” que alterna entre el sistema de IA de extremo a extremo y protocolos de seguridad tradicionales cuando la confianza disminuye.
Robótica: más allá de los humanoides
La estrategia se extiende a robots humanoides y cuadrúpedos, todos equipados con el miniordenador Jetson y entrenados en el simulador Isaac. La integración también alcanza sistemas industriales como herramientas de Synopsys, Cadence y Siemens.
Jensen Huang bromeó durante la presentación: “El robot más grande es la fábrica misma. Los robots serán diseñados en computadoras, fabricados en computadoras, e incluso probados y verificados virtualmente en computadoras antes de enfrentarse a la gravedad real”.
El contexto más amplio: 10 billones de dólares en modernización
En la última década, aproximadamente 10 billones de dólares en infraestructura de cómputo global están siendo completamente modernizados. Pero esto no es solo una actualización de hardware. Representa un cambio de paradigma en cómo el software se desarrolla y despliega.
La ascensión de modelos abiertos, ejemplificada por sistemas como DeepSeek que sorprendió al mundo con su eficiencia de inferencia, ha catalizado una ola de innovación. Aunque estos modelos pueden rezagarse 6 meses respecto a los más avanzados, cada medio año emerge una nueva generación con capacidades competitivas.
Esta velocidad de iteración mantiene a startups, gigantes tecnológicos e investigadores en constante movimiento. La plataforma de modelos Nemotron de código abierto abarca biomedicina, IA física, agentes inteligentes, robótica y conducción autónoma, con múltiples versiones destacando en rankings independientes y siendo ampliamente adoptadas por empresas de toda escala.
Eficiencia que compensa: tokens por vatio y dólar
Aunque Vera Rubin consume el doble de energía que sus predecesores, el rendimiento se multiplica de manera desproporcionada. La métrica crítica es el throughput de tokens generados por vatio y por dólar: un aumento de 10 veces.
Para un centro de datos de 1 GW, esto significa que Spectrum-X mejora el throughput en un 25%, equivalente a ahorrar 5 mil millones de dólares en infraestructura. “Este sistema de red es prácticamente gratis”, en palabras del ejecutivo.
Resolviendo el KV Cache: el mayor obstáculo de la IA generativa
El verdadero dolor de cabeza de la industria es el “KV Cache”, la memoria de trabajo que la IA consume durante conversaciones largas. Conforme los modelos crecen y las conversaciones se expanden, la memoria HBM disponible se agota.
Vera Rubin resuelve esto desplegando procesadores BlueField-4 dentro de cada bastidor. Cada nodo contiene 4 BlueField-4, proporcionando 150TB de memoria de contexto distribuida entre las GPUs, con 16TB adicionales por GPU manteniendo un ancho de banda de 200Gbps. Así, miles de GPUs dispersas en decenas de bastidores funcionan como una única memoria coherente.
El significado geopolítico de esta “bomba nuclear”
La presentación de Vera Rubin representa algo más profundo que innovación técnica. En una era de escepticismo sobre si la burbuja de IA es sostenible, Jensen Huang necesitaba demostrar con hechos concretos qué capacidades reales habilita la IA: desde conducción autónoma segura hasta robots industriales, desde síntesis de proteínas hasta sistemas de código abierto que democratizan la tecnología.
Hace años, la compañía vendía “las palas en la fiebre del oro”. Ahora, participa directamente en la transformación de industrias físicas, desde automoción hasta manufactura. Esta evolución de proveedor de componentes a orquestador de ecosistemas marca una transición fundamental en cómo la industria tecnológica se posiciona para la próxima década.