"Ядерная бомба" весом 2,5 тонны на CES 2026: как NVIDIA переосмысливает будущее ИИ с Vera Rubin

2026-01-12 08:43:50

На CES 2026 Дженсен Хуанг вышел на сцену с чем-то необычным: не потребительской видеокартой, а целым серверным стэком AI весом 2,5 тонны. Этот символический жест вводит то, что можно назвать настоящей “ядерной бомбой” мероприятия: платформу вычислений Vera Rubin, полностью переосмысленную аппаратную экосистему для ускорения обучения моделей AI нового поколения.

Шесть чипов, одна концепция: архитектура, которая бросает вызов закону Мура

Vera Rubin представляет собой смену парадигмы по сравнению с прошлым NVIDIA. В то время как традиционно каждое поколение процессоров включало развитие всего 1-2 чипов, на этот раз компания одновременно переработала 6 различных компонентов, все уже в производстве.

Причина проста, но глубока: закон Мура больше не достаточен. Модели AI растут в 10 раз в год, но традиционные улучшения производительности не успевают за этим ростом. Поэтому NVIDIA выбрала инновацию “синхронизированную на каждом уровне” платформы.

Шесть столпов технологической “ядерной бомбы”:

CPU Vera включает 88 индивидуальных ядер Olympus, поддерживает 176 потоков благодаря технологии NVIDIA multithreading, и предлагает системную память объемом 1,5 ТБ — в три раза больше, чем у предыдущего поколения Grace. Пропускная способность NVLink достигает 1,8 ТБ/с.

GPU Rubin — настоящая звезда: с инференсной мощностью NVFP4 в 50 PFLOPS ( в 5 раз превосходит Blackwell), содержит 336 миллиардов транзисторов и включает третий движок Transformer, который динамически адаптирует точность в зависимости от требований.

Сетевая карта ConnectX-9 поддерживает Ethernet на 800 Гбит/с с программируемым RDMA, а BlueField-4 DPU специально разработан для обработки новых архитектур хранения AI, объединяя CPU Grace с 64 ядрами и 126 миллиардами транзисторов.

Коммутатор NVLink-6 соединяет до 18 вычислительных узлов, позволяя 72 GPU Rubin работать как единая согласованная машина, с пропускной способностью 3,6 ТБ/с на GPU. В конце концов, оптический коммутатор Spectrum-6 использует 512 каналов по 200 Гбит/с каждый, интегрируя фотонику на кристалле.

Производительность, меняющая правила игры: улучшение от 3,5x до 10x

В системе Vera Rubin NVL72 скачок производительности по сравнению с Blackwell впечатляющий. Инференс NVFP4 достигает 3,6 EFLOPS (+5x), а обучение — 2,5 EFLOPS (+3,5x). Доступная память почти утроилась: 54 ТБ LPDDR5X и 20,7 ТБ HBM.

Но самое впечатляющее — это эффективность. Несмотря на увеличение транзисторов всего в 1,7 раза (достигая 220 триллионов), производительность в токенах AI на ватт и доллар растет в 10 раз. Для дата-центра стоимостью 50 миллиардов долларов и мощностью в один гигаватт это означает прямое удвоение доходности.

Конкретно: для обучения модели из 100 триллионов параметров Vera Rubin требует всего 1/4 систем Blackwell, а стоимость генерации одного токена снижается примерно в 10 раз по сравнению с предыдущими системами.

Революционная инженерия: от сборки до охлаждения

“Ядерная бомба” аппаратного обеспечения — это не только мощь. Инженерия Vera Rubin решает практические проблемы, которые мешали предыдущим системам. Старые узлы суперкомпьютеров требовали 43 кабеля и 2 часа ручной сборки; узлы Vera используют ноль кабелей, всего 6 жидкостных трубок охлаждения, и собираются за 5 минут.

На задней панели стойки расположено почти 3,2 км медных кабелей: 5000 кабелей формируют NVLink-спину на 400 Гбит/с. Как иронично заметил Дженсен Хуанг: “Они могут весить несколько сотен фунтов — нужно быть очень в форме, чтобы справиться с этим”.

Проблема контекстной памяти: решение BlueField-4

Современный AI сталкивается с критической узкой точкой: “KV Cache” (рабочая память AI) растет с увеличением длины диалогов и размеров моделей. Vera Rubin решает это с помощью процессоров BlueField-4, встроенных в стойку, каждый из которых имеет 150 ТБ памяти для контекста.

Каждый узел оснащен 4 BlueField-4, которые распределяют память GPU: каждая GPU получает дополнительно 16 ТБ памяти сверх своих 1 ТБ, сохраняя пропускную способность 200 Гбит/с без компромиссов по скорости.

Spectrum-X: сеть, предназначенная для генеративного AI

Чтобы десятки стоек и тысячи GPU работали как единая распределенная память, сеть должна быть “большой, быстрой и стабильной”. Spectrum-X — первая в мире платформа Ethernet end-to-end, специально разработанная для генеративного AI.

Последнее поколение использует технологию COOP от TSMC и фотонику на кристалле, с 512 каналами по 200 Гбит/с каждый. Мнение Дженсена Хуанга убедительно: повышая производительность на 25%, это эквивалентно экономии 5 миллиардов долларов на дата-центре за 50 миллиардов. “Можно сказать, что эта сетевая система почти бесплатна”, — подчеркнул он.

От теории к практике: физический AI, робототехника и автономное вождение

Фокус “ядерной бомбы” — не только аппаратное обеспечение. Дженсен Хуанг подчеркнул, что около 10 триллионов долларов ресурсов вычислений, накопленных за десятилетие, проходят полную модернизацию, и речь идет не только о железе — происходит смена парадигмы программного обеспечения.

Архитектура “трех компьютеров” для физического AI:

Обучающие компьютеры на базе GPU, такие как архитектура GB300. Инференсные компьютеры — “мозг”, который принимает решения в реальном времени для роботов и устройств на краю сети. Компьютеры моделирования (Omniverse и Cosmos) создают виртуальные среды, где AI учится через физическую обратную связь.

Alpamayo: автономное вождение с возможностью рассуждения

На этой архитектуре NVIDIA представила Alpamayo — первую систему автономного вождения с настоящими возможностями рассуждения. В отличие от традиционных систем, Alpamayo полностью end-to-end и решает “проблему длинного хвоста” — при столкновениях с незнакомыми ситуациями он не просто выполняет механический код, а рассуждает как человек-водитель.

Модель Mercedes CLA с Alpamayo будет запущена в США в первом квартале 2026 года, затем — в Европе и Азии. Система получила рейтинг NCAP как самый безопасный автомобиль в мире благодаря “двойному стеку безопасности” NVIDIA: когда модель AI не уверена, система немедленно переключается в традиционный режим безопасности.

Робототехническая стратегия: от Boston Dynamics до Disney

NVIDIA показала, что девять крупных компаний в области AI и аппаратного обеспечения расширяют свои проекты в робототехнике. Каждый робот будет использовать компьютеры Jetson, обучаться в симуляторе Isaac из Omniverse, а технологии интегрируются в промышленные системы от Synopsys, Cadence, Siemens и других.

Дженсен Хуанг пригласил на сцену гуманоидных и квадрупедальных роботов компаний Boston Dynamics и Agility, подчеркнув захватывающую перспективу: самый большой робот — это сама фабрика. Визия заключается в том, что проектирование чипов, систем и фабричных симуляций будет ускорено благодаря физическому AI.

Почему именно сейчас эта “ядерная бомба”?

В условиях растущего скептицизма относительно предполагаемой “пузырь AI” Дженсен Хуанг сделал акцент не только на вычислительной мощности, но и на конкретных приложениях. “Ядерная бомба” весом 2,5 тонны — это и символ, и обещание: показать, что AI действительно может преобразовать как цифровой, так и физический мир.

NVIDIA, которая раньше продавала “лопаты для золотодобытчиков”, теперь напрямую входит на рынок, где конкуренция наиболее жесткая — физический AI, робототехника, автономное вождение. Как сам Хуанг отметил: “Когда идет война, можно продолжать продавать оружие”.

Но настоящая инновация Vera Rubin — не в создании более мощной “ядерной бомбы” в виде аппаратного обеспечения, а в демонстрации того, что синхронизируя инновации на каждом уровне платформы, можно преодолеть традиционные ограничения.

TOKEN-0,63%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .