"Ядерна бомба" вагою 2,5 тонни на CES 2026: як NVIDIA переосмислює майбутнє AI з Вєрою Рубін

На CES 2026 Дженсен Хуанг виніс на сцену щось незвичайне: не споживчу відеокарту, а цілий серверний стелаж AI вагою 2,5 тонни. Цей символічний жест вводить у концепцію справжню “ядерну бомбу” заходу: платформу обчислень Vera Rubin, цілісну екосистему апаратного забезпечення, повністю переосмислену для прискорення навчання моделей AI нового покоління.

Шість чипів, одне бачення: архітектура, що кидає виклик сповільненню Moore

Vera Rubin є змінювачем парадигми у порівнянні з минулим NVIDIA. У той час як традиційно кожне покоління процесорів передбачало еволюцію лише 1-2 чипів, цього разу компанія одночасно перепроектувала 6 різних компонентів, усі вже у виробництві.

Причина проста, але глибока: закон Мура більше не достатній. Моделі AI зростають у 10 разів щороку, але традиційні покращення продуктивності не встигають за цим. Тому NVIDIA обрала інновацію “синхронізовану на кожному рівні” платформи.

Шість стовпів технологічної “ядерної бомби”:

Vera CPU інтегрує 88 кастомних ядер Olympus, підтримує 176 потоків за допомогою технології багатопоточності NVIDIA, і має системну пам’ять обсягом 1,5 ТБ — у три рази більше за попереднє покоління Grace. Пропускна здатність NVLink досягає 1,8 ТБ/с.

GPU Rubin — справжня зірка: з інференційною потужністю NVFP4 у 50 PFLOPS ( у 5 разів перевищує Blackwell), містить 336 мільярдів транзисторів і включає третій трансформерний двигун, що динамічно налаштовує точність відповідно до потреб.

Мережева карта ConnectX-9 підтримує Ethernet на 800 Гбіт/с з програмованим RDMA, тоді як BlueField-4 DPU спеціально розроблений для управління новими архітектурами AI-стореджу, поєднуючи CPU Grace з 64 ядрами і 126 мільярдами транзисторів.

Комутатор NVLink-6 з’єднує до 18 обчислювальних вузлів, дозволяючи 72 GPU Rubin працювати як єдина узгоджена машина, з пропускною здатністю 3,6 ТБ/с на GPU. Нарешті, оптичний комутатор Spectrum-6 використовує 512 каналів по 200 Гбіт/с кожен, інтегруючи фотоніку на кремнії.

Результати, що змінюють гру: покращення від 3,5x до 10x

У системі Vera Rubin NVL72 різкий приріст продуктивності порівняно з Blackwell є драматичним. Інференція NVFP4 досягає 3,6 EFLOPS (+5x), а навчання — 2,5 EFLOPS (+3,5x). Доступна пам’ять майже утричі більша: 54 ТБ LPDDR5X і 20,7 ТБ HBM.

Але найвражаючіше — це ефективність. Незважаючи на те, що транзистори зросли лише у 1,7 разу (досягли 220 трильйонів), продуктивність у токенах AI на ват/долар зросла у 10 разів. Для дата-центру вартістю 50 мільярдів доларів і потужністю у один гігават це означає подвоєння безпосереднього прибутку.

Конкретно: для навчання моделі з 100 трильйонами параметрів Vera Rubin вимагає лише 1/4 систем Blackwell, а вартість генерації одного токена зменшується приблизно у 10 разів.

Революційна інженерія: від збірки до охолодження

“Атомна бомба” апаратного забезпечення — це не лише потужність. Інженерія Vera Rubin вирішує практичні проблеми, що турбували попередні системи. Старі вузли суперкомп’ютерів вимагали 43 кабелі і 2 години ручної збірки; вузли Vera використовують нуль кабелів, лише 6 рідинних трубок для охолодження і збираються за 5 хвилин.

Задня частина стелажа містить майже 3,2 км мідних кабелів: 5000 кабелів формують NVLink-спинну мережу на 400 Гбіт/с. Як іронічно зауважив Дженсен Хуанг: “Вони можуть важити кілька сотень фунтів — потрібно бути дуже у формі, щоб цим займатися”.

Проблема контекстної пам’яті: рішення BlueField-4

Сучасний AI стикається з критичним вузьким місцем: “KV Cache” (пам’ять робочого стола AI) зростає із довшими діалогами і більшими моделями. Vera Rubin вирішує це за допомогою процесорів BlueField-4, інтегрованих у стелаж, кожен з яких має 150 ТБ контекстної пам’яті.

Кожен вузол має 4 BlueField-4, що розподіляють пам’ять GPU: кожна GPU отримує додаткові 16 ТБ пам’яті понад свої 1 ТБ, зберігаючи пропускну здатність у 200 Гбіт/с без компромісів у швидкості.

Spectrum-X: мережа, створена для генеративного AI

Щоб десятки стелажів і тисячі GPU працювали як єдина розподілена пам’ять, мережа має бути “великою, швидкою і стабільною”. Spectrum-X — перша у світі платформа Ethernet end-to-end, спеціально розроблена для генеративного AI.

Останнє покоління використовує процес COOP від TSMC і фотоніку на кремнії, з 512 каналами по 200 Гбіт/с кожен. Переконливий висновок Хуанга: підвищуючи продуктивність на 25%, це еквівалентно економії 5 мільярдів доларів на дата-центрі вартістю 50 мільярдів. “Можна сказати, що ця мережа майже безкоштовна”, — підкреслив він.

Від теорії до дії: фізичний AI, робототехніка і автономне керування

Фокус “ядерної бомби” — не лише апаратне забезпечення. Дженсен Хуанг наголосив, що близько 10 трильйонів доларів обчислювальних ресурсів, накопичених за десятиліття, проходять повну модернізацію, але не лише апаратного забезпечення — а й зміну парадигми у програмному забезпеченні.

Архітектура “трьох комп’ютерів” для фізичного AI:

Навчальні комп’ютери на базі GPU, наприклад архітектура GB300. Інференційні комп’ютери — “мозковий центр”, що приймає рішення в реальному часі для роботів і пристроїв на краю. Комп’ютери симуляції (Omniverse і Cosmos), що створюють віртуальні середовища, де AI навчається фізичним зворотним зв’язкам.

Alpamayo: автономне керування з можливістю розуміння

На цій архітектурі NVIDIA представила Alpamayo — першу систему автономного керування з справжньою здатністю до розуміння. На відміну від традиційних систем, Alpamayo цілком end-to-end і вирішує “проблему довгої хвости” — коли стикається з новими дорожніми ситуаціями, він не просто виконує механічний код, а розмірковує, як людський водій.

Мерседес CLA з Alpamayo буде запущений у США у першому кварталі 2026 року, з подальшим виходом в Європу та Азію. Система отримала оцінку NCAP як найбезпечніший у світі автомобіль завдяки “подвоєній системі безпеки” NVIDIA: коли модель AI має низьку довіру, система миттєво повертається до традиційного режиму безпеки.

Робототехнічна стратегія: від Boston Dynamics до Disney

NVIDIA показала, що дев’ять великих компаній у сфері AI і апаратного забезпечення розширюються у напрямку робототехніки. Кожен робот використовуватиме комп’ютер Jetson, навчатиметься у симуляторі Isaac з Omniverse, а технології інтегруватимуться у промислові системи від Synopsys, Cadence, Siemens та інших.

Дженсен Хуанг запросив роботів-людиноподібних і квадроподів від Boston Dynamics і Agility, підкреслюючи захоплюючу перспективу: найбільший робот — сама фабрика. Візія полягає в тому, що проектування чипів, систем і фабричних симуляцій усі прискорюватимуться за допомогою фізичного AI.

Чому саме зараз ця “ядерна бомба”?

У контексті зростаючого скепсису щодо нібито “бульбашки AI”, Дженсен Хуанг зробив акцент не лише на обчислювальній потужності, а й на конкретних застосуваннях. “Ядерна бомба” вагою 2,5 тонни — це і символ, і обіцянка: довести, що AI справді може трансформувати і цифровий, і фізичний світ.

NVIDIA, яка раніше продавала “лопати для шукачів золота”, тепер безпосередньо входить на ринок, де конкуренція найжорсткіша — фізичний AI, робототехніка, автономне керування. Як сам Хуанг підказав: “Коли йде війна, можна й далі продавати зброю”.

Але справжня інновація Vera Rubin полягає не у створенні більш потужної “ядерної бомби” апаратного забезпечення — а у демонстрації того, що синхронізуючи інновації на кожному рівні платформи, можна подолати традиційні обмеження.

TOKEN7,9%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити