Революция массовых вычислений: как "ядерная бомба" Веры Рубин переопределяет развитие ИИ

2026-01-12 08:48:32

Невыносимый вызов: Закон Мура замедляется, спрос на ИИ взрывается

Индустрия сталкивается с неловкой парадоксальной ситуацией: в то время как скорость улучшения характеристик кремния замедляется, модели искусственного интеллекта требуют экспоненциальных увеличений производительности каждый год. Для дата-центра мощностью 1 ГВт стоимостью 50 миллиардов долларов разница между старой и новой архитектурой может означать прямое удвоение его доходной способности.

Дженсен Хуанг, генеральный директор одного из мировых технологических лидеров, открыто признает этот дилемму: традиционные методы оптимизации уже не могут идти в ногу. Поэтому вместо замены всего 1 или 2 чипов за поколение, как делали раньше, в этот раз они сделали ставку на комплексный редизайн 6 ключевых компонентов платформы Vera Rubin, которая уже находится в стадии массового производства.

Vera Rubin: архитектура, которая переписывает правила игры

Истинным героем этого цикла является не обычная видеокарта, а целая экосистема обработки данных. Vera Rubin, названная в честь астронома, открывшего тёмную материю, представляет собой смену мышления: одновременное внедрение инноваций на всех уровнях платформы.

6 столпов этой архитектуры:

Vera CPU обеспечивает интеллект и координацию. Оснащена 88 индивидуальными ядрами Olympus, поддерживает 176 потоков благодаря технологии мульти-поточности. Пропускная способность NVLink C2C 1.8 ТБ/с и системная память объемом 1.5 ТБ (в три раза больше по сравнению с предыдущим поколением) гарантируют отсутствие узких мест в основных операциях. С 227 миллиардами транзисторов она объединяет необходимую вычислительную мощность для координации масштабных операций.

Rubin GPU, вычислительное сердце, достигает 50 PFLOPS мощности инференса в сниженной точности, в пять раз превосходя архитектуру Blackwell. С 336 миллиардами транзисторов, включает третье поколение трансформеров, которые динамически регулируют точность в зависимости от конкретных требований модели.

Сетевая карта ConnectX-9 обеспечивает сверхскорную связь с Ethernet 800 Гбит/с на базе технологии PAM4 200G. Включает программируемый RDMA и ускоритель маршрутизации данных, а также сертификации безопасности CNSA и FIPS с 23 миллиардами транзисторов.

BlueField-4 DPU выступает как процессор для хранения данных нового поколения ИИ. Обеспечивает 800 Гбит/с пропускной способности SmartNIC, объединяя CPU Grace с 64 ядрами и ConnectX-9, с 126 миллиардами транзисторов, выделенных под эту критическую функцию.

NVLink-6 — это оркестратор внутренней сети. Может соединять 18 вычислительных узлов и координировать до 72 GPU Rubin, функционирующих как единая связная система. Архитектура NVLink 6 обеспечивает каждому GPU пропускную способность 3.6 ТБ/с all-to-all, что позволяет сверхбыструю коллективную коммуникацию внутри сети.

Наконец, оптический коммутатор Spectrum-6 управляет 512 каналами по 200 Гбит/с каждый для передачи данных, превышающих обычные скорости. Изготовлен с использованием интегрированной фотонной кремниевой технологии TSMC COOP, содержит 352 миллиарда транзисторов, выделенных под оптическую межсоединительную систему в пакете.

Цифры говорят сами за себя: беспрецедентные улучшения производительности

Результирующая система NVL72, основанная на глубокой интеграции, устанавливает новые стандарты. В задачах инференса с пониженной точностью достигает 3.6 EFLOPS, в пять раз превышая предыдущее поколение. Для обучения — 2.5 EFLOPS, что в 3.5 раза больше.

Доступная память утроилась: 54 ТБ LPDDR5X в основной системе против 20.7 ТБ HBM с высокой пропускной способностью. Пропускная способность HBM4 достигает 1.6 ПБ/с (в 2.8 раза больше), а пропускная способность Scale-Up — 260 ТБ/с, вдвое больше предыдущего поколения.

Самое важное: эти скачки производительности достигнуты всего лишь при 1.7-кратном увеличении количества транзисторов (всего 2.2 триллиона), что доказывает, что архитектурные инновации так же важны, как и плотность кремния.

От цифрового к физическому: следующая граница

Хотя цифры впечатляют, их истинное влияние заключается в приложениях. ИИ теперь должен перейти от цифрового мира к физическому. Для этого необходимы три типа интегрированных вычислений:

Обучающая машина на архитектурах вроде GB300, создающих базовые модели. Машина инференса — “мозг”, работающий в роботах или автономных транспортных средствах в реальном времени. И машина моделирования, включающая платформы Omniverse и Cosmos, предоставляющие виртуальные среды, где ИИ учится физической обратной связи перед выходом в реальный мир.

Alpamayo: автономное вождение с рассуждениями

На базе этой архитектуры тройной вычислительной системы появился Alpamayo — первая система автономного вождения с возможностями настоящего рассуждения. В отличие от традиционных систем, выполняющих жесткие инструкции, Alpamayo рассуждает как человек-водитель. Он может объяснить, что сделает дальше и почему.

Мерседес CLA с этой технологией будет официально запущен в США в первом квартале этого года, затем расширится в Европу и Азию. Этот автомобиль признан NCAP самым безопасным в мире благодаря архитектуре “двойной системы безопасности”, которая чередует систему ИИ от одного конца до другого и традиционные протоколы безопасности при снижении доверия.

Робототехника: за пределами гуманоидов

Стратегия распространяется на гуманоидных и четвероногих роботов, все оснащены мини-компьютером Jetson и обучаются в симуляторе Isaac. Интеграция также охватывает промышленные системы, такие как инструменты Synopsys, Cadence и Siemens.

Дженсен Хуанг пошутил во время презентации: “Самый большой робот — это сама фабрика. Роботы будут проектироваться на компьютерах, производиться на компьютерах и даже тестироваться и проверяться виртуально на компьютерах, прежде чем столкнуться с реальной гравитацией”.

Более широкий контекст: 10 триллионов долларов на модернизацию

За последние десять лет примерно 10 триллионов долларов инфраструктуры глобальных вычислений полностью модернизируются. Но это не просто обновление аппаратного обеспечения. Это смена парадигмы в разработке и развертывании программного обеспечения.

Рост открытых моделей, таких как DeepSeek, удивившая мир своей эффективностью инференса, стал катализатором волны инноваций. Хотя эти модели могут отставать на 6 месяцев от самых передовых, каждые полгода появляется новое поколение с конкурентоспособными возможностями.

Эта скорость итераций держит стартапы, технологические гиганты и исследователей в постоянном движении. Платформа открытых моделей Nemotron охватывает биомедицину, физический ИИ, интеллектуальных агентов, робототехнику и автономное вождение, с множеством версий, которые занимают ведущие позиции в независимых рейтингах и широко используются компаниями разного масштаба.

Эффективность, которая окупается: токены за ватт и доллар

Хотя Vera Rubin потребляет вдвое больше энергии, чем её предшественники, производительность растет пропорционально. Ключевая метрика — пропускная способность токенов, генерируемых за ватт и за доллар: рост в 10 раз.

Для дата-центра мощностью 1 ГВт это означает, что Spectrum-X увеличивает пропускную способность на 25%, что эквивалентно экономии 5 миллиардов долларов на инфраструктуре. “Эта сетевая система практически бесплатна”, — говорит исполнительный директор.

Решение KV Cache: главный барьер генеративного ИИ

Настоящая головная боль индустрии — это “KV Cache”, рабочая память, которую ИИ использует при длинных диалогах. По мере роста моделей и расширения диалогов доступная память HBM исчерпывается.

Vera Rubin решает это, размещая процессоры BlueField-4 внутри каждого стойки. Каждый узел содержит 4 BlueField-4, обеспечивая 150 ТБ распределенной памяти контекста между GPU, с дополнительными 16 ТБ на GPU при пропускной способности 200 Гбит/с. Таким образом, тысячи GPU, разбросанные по десяткам стоек, работают как единая согласованная память.

Геополитический смысл этой “ядерной бомбы”

Презентация Vera Rubin — это нечто большее, чем технические инновации. В эпоху скептицизма относительно устойчивости пузыря ИИ, Дженсен Хуанг должен был продемонстрировать конкретными фактами, какие реальные возможности открывает ИИ: от безопасного автономного вождения до промышленных роботов, от синтеза белков до систем с открытым исходным кодом, демократизирующих технологию.

Годы назад компания продавала “лопаты на золотой лихорадке”. Сейчас она напрямую участвует в трансформации физических индустрий, от автомобилестроения до производства. Эта эволюция от поставщика компонентов к оркестратору экосистем знаменует собой фундаментальный переход в том, как технологическая индустрия позиционируется на ближайшее десятилетие.

LA3,09%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

0/400

Нет комментариев

Популярные темы
Подробнее
#
GateProofOfReservesReport
28.65K Популярность
#
MyFavouriteChineseMemecoin
29.15K Популярность
#
CPIDataAhead
27.04K Популярность
#
SOLPriceAnalysis
18.13K Популярность
#
GateSquareCreatorNewYearIncentives
107.16K Популярность

Горячее на Gate Fun
Подробнее

1
超级大格局
超级大格局
РК:$3.66KДержатели:1
0.00%
2
格局一手
格局一手
РК:$3.66KДержатели:1
0.00%
3
马上发财
马上发财
РК:$3.72KДержатели:2
0.09%
4
格局币
格局币
РК:$4.5KДержатели:2
3.82%
5
AIE
AI Employee
РК:$3.66KДержатели:1
0.00%

Закрепить

Карта сайта

Революция массовых вычислений: как "ядерная бомба" Веры Рубин переопределяет развитие ИИ

Невыносимый вызов: Закон Мура замедляется, спрос на ИИ взрывается

Vera Rubin: архитектура, которая переписывает правила игры

Цифры говорят сами за себя: беспрецедентные улучшения производительности

От цифрового к физическому: следующая граница

Alpamayo: автономное вождение с рассуждениями

Робототехника: за пределами гуманоидов

Более широкий контекст: 10 триллионов долларов на модернизацию

Эффективность, которая окупается: токены за ватт и доллар

Решение KV Cache: главный барьер генеративного ИИ

Геополитический смысл этой “ядерной бомбы”

Популярные темы

GateProofOfReservesReport

MyFavouriteChineseMemecoin

CPIDataAhead

SOLPriceAnalysis

GateSquareCreatorNewYearIncentives

Горячее на Gate Fun

超级大格局

超级大格局

格局一手

格局一手

马上发财

马上发财

格局币

格局币

AIE

AI Employee

Закрепить