Революция массовых вычислений: как "ядерная бомба" Веры Рубин переопределяет развитие ИИ

Невыносимый вызов: Закон Мура замедляется, спрос на ИИ взрывается

Индустрия сталкивается с неловкой парадоксальной ситуацией: в то время как скорость улучшения характеристик кремния замедляется, модели искусственного интеллекта требуют экспоненциальных увеличений производительности каждый год. Для дата-центра мощностью 1 ГВт стоимостью 50 миллиардов долларов разница между старой и новой архитектурой может означать прямое удвоение его доходной способности.

Дженсен Хуанг, генеральный директор одного из мировых технологических лидеров, открыто признает этот дилемму: традиционные методы оптимизации уже не могут идти в ногу. Поэтому вместо замены всего 1 или 2 чипов за поколение, как делали раньше, в этот раз они сделали ставку на комплексный редизайн 6 ключевых компонентов платформы Vera Rubin, которая уже находится в стадии массового производства.

Vera Rubin: архитектура, которая переписывает правила игры

Истинным героем этого цикла является не обычная видеокарта, а целая экосистема обработки данных. Vera Rubin, названная в честь астронома, открывшего тёмную материю, представляет собой смену мышления: одновременное внедрение инноваций на всех уровнях платформы.

6 столпов этой архитектуры:

Vera CPU обеспечивает интеллект и координацию. Оснащена 88 индивидуальными ядрами Olympus, поддерживает 176 потоков благодаря технологии мульти-поточности. Пропускная способность NVLink C2C 1.8 ТБ/с и системная память объемом 1.5 ТБ (в три раза больше по сравнению с предыдущим поколением) гарантируют отсутствие узких мест в основных операциях. С 227 миллиардами транзисторов она объединяет необходимую вычислительную мощность для координации масштабных операций.

Rubin GPU, вычислительное сердце, достигает 50 PFLOPS мощности инференса в сниженной точности, в пять раз превосходя архитектуру Blackwell. С 336 миллиардами транзисторов, включает третье поколение трансформеров, которые динамически регулируют точность в зависимости от конкретных требований модели.

Сетевая карта ConnectX-9 обеспечивает сверхскорную связь с Ethernet 800 Гбит/с на базе технологии PAM4 200G. Включает программируемый RDMA и ускоритель маршрутизации данных, а также сертификации безопасности CNSA и FIPS с 23 миллиардами транзисторов.

BlueField-4 DPU выступает как процессор для хранения данных нового поколения ИИ. Обеспечивает 800 Гбит/с пропускной способности SmartNIC, объединяя CPU Grace с 64 ядрами и ConnectX-9, с 126 миллиардами транзисторов, выделенных под эту критическую функцию.

NVLink-6 — это оркестратор внутренней сети. Может соединять 18 вычислительных узлов и координировать до 72 GPU Rubin, функционирующих как единая связная система. Архитектура NVLink 6 обеспечивает каждому GPU пропускную способность 3.6 ТБ/с all-to-all, что позволяет сверхбыструю коллективную коммуникацию внутри сети.

Наконец, оптический коммутатор Spectrum-6 управляет 512 каналами по 200 Гбит/с каждый для передачи данных, превышающих обычные скорости. Изготовлен с использованием интегрированной фотонной кремниевой технологии TSMC COOP, содержит 352 миллиарда транзисторов, выделенных под оптическую межсоединительную систему в пакете.

Цифры говорят сами за себя: беспрецедентные улучшения производительности

Результирующая система NVL72, основанная на глубокой интеграции, устанавливает новые стандарты. В задачах инференса с пониженной точностью достигает 3.6 EFLOPS, в пять раз превышая предыдущее поколение. Для обучения — 2.5 EFLOPS, что в 3.5 раза больше.

Доступная память утроилась: 54 ТБ LPDDR5X в основной системе против 20.7 ТБ HBM с высокой пропускной способностью. Пропускная способность HBM4 достигает 1.6 ПБ/с (в 2.8 раза больше), а пропускная способность Scale-Up — 260 ТБ/с, вдвое больше предыдущего поколения.

Самое важное: эти скачки производительности достигнуты всего лишь при 1.7-кратном увеличении количества транзисторов (всего 2.2 триллиона), что доказывает, что архитектурные инновации так же важны, как и плотность кремния.

От цифрового к физическому: следующая граница

Хотя цифры впечатляют, их истинное влияние заключается в приложениях. ИИ теперь должен перейти от цифрового мира к физическому. Для этого необходимы три типа интегрированных вычислений:

Обучающая машина на архитектурах вроде GB300, создающих базовые модели. Машина инференса — “мозг”, работающий в роботах или автономных транспортных средствах в реальном времени. И машина моделирования, включающая платформы Omniverse и Cosmos, предоставляющие виртуальные среды, где ИИ учится физической обратной связи перед выходом в реальный мир.

Alpamayo: автономное вождение с рассуждениями

На базе этой архитектуры тройной вычислительной системы появился Alpamayo — первая система автономного вождения с возможностями настоящего рассуждения. В отличие от традиционных систем, выполняющих жесткие инструкции, Alpamayo рассуждает как человек-водитель. Он может объяснить, что сделает дальше и почему.

Мерседес CLA с этой технологией будет официально запущен в США в первом квартале этого года, затем расширится в Европу и Азию. Этот автомобиль признан NCAP самым безопасным в мире благодаря архитектуре “двойной системы безопасности”, которая чередует систему ИИ от одного конца до другого и традиционные протоколы безопасности при снижении доверия.

Робототехника: за пределами гуманоидов

Стратегия распространяется на гуманоидных и четвероногих роботов, все оснащены мини-компьютером Jetson и обучаются в симуляторе Isaac. Интеграция также охватывает промышленные системы, такие как инструменты Synopsys, Cadence и Siemens.

Дженсен Хуанг пошутил во время презентации: “Самый большой робот — это сама фабрика. Роботы будут проектироваться на компьютерах, производиться на компьютерах и даже тестироваться и проверяться виртуально на компьютерах, прежде чем столкнуться с реальной гравитацией”.

Более широкий контекст: 10 триллионов долларов на модернизацию

За последние десять лет примерно 10 триллионов долларов инфраструктуры глобальных вычислений полностью модернизируются. Но это не просто обновление аппаратного обеспечения. Это смена парадигмы в разработке и развертывании программного обеспечения.

Рост открытых моделей, таких как DeepSeek, удивившая мир своей эффективностью инференса, стал катализатором волны инноваций. Хотя эти модели могут отставать на 6 месяцев от самых передовых, каждые полгода появляется новое поколение с конкурентоспособными возможностями.

Эта скорость итераций держит стартапы, технологические гиганты и исследователей в постоянном движении. Платформа открытых моделей Nemotron охватывает биомедицину, физический ИИ, интеллектуальных агентов, робототехнику и автономное вождение, с множеством версий, которые занимают ведущие позиции в независимых рейтингах и широко используются компаниями разного масштаба.

Эффективность, которая окупается: токены за ватт и доллар

Хотя Vera Rubin потребляет вдвое больше энергии, чем её предшественники, производительность растет пропорционально. Ключевая метрика — пропускная способность токенов, генерируемых за ватт и за доллар: рост в 10 раз.

Для дата-центра мощностью 1 ГВт это означает, что Spectrum-X увеличивает пропускную способность на 25%, что эквивалентно экономии 5 миллиардов долларов на инфраструктуре. “Эта сетевая система практически бесплатна”, — говорит исполнительный директор.

Решение KV Cache: главный барьер генеративного ИИ

Настоящая головная боль индустрии — это “KV Cache”, рабочая память, которую ИИ использует при длинных диалогах. По мере роста моделей и расширения диалогов доступная память HBM исчерпывается.

Vera Rubin решает это, размещая процессоры BlueField-4 внутри каждого стойки. Каждый узел содержит 4 BlueField-4, обеспечивая 150 ТБ распределенной памяти контекста между GPU, с дополнительными 16 ТБ на GPU при пропускной способности 200 Гбит/с. Таким образом, тысячи GPU, разбросанные по десяткам стоек, работают как единая согласованная память.

Геополитический смысл этой “ядерной бомбы”

Презентация Vera Rubin — это нечто большее, чем технические инновации. В эпоху скептицизма относительно устойчивости пузыря ИИ, Дженсен Хуанг должен был продемонстрировать конкретными фактами, какие реальные возможности открывает ИИ: от безопасного автономного вождения до промышленных роботов, от синтеза белков до систем с открытым исходным кодом, демократизирующих технологию.

Годы назад компания продавала “лопаты на золотой лихорадке”. Сейчас она напрямую участвует в трансформации физических индустрий, от автомобилестроения до производства. Эта эволюция от поставщика компонентов к оркестратору экосистем знаменует собой фундаментальный переход в том, как технологическая индустрия позиционируется на ближайшее десятилетие.

LA3,09%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить