2026年CES上的“核弹”2.5吨:NVIDIA如何用Vera Rubin重新塑造AI的未来

在CES 2026上,黄仁勋带来了一件不同寻常的东西:不是一块面向消费者的显卡,而是一整套2.5吨的AI机架服务器。这一象征性举动引出了本次活动的真正“核弹”——Vera Rubin计算平台,一个为加速新一代AI模型训练而全新设计的硬件生态系统。

六芯片,一体愿景:挑战摩尔定律的架构

Vera Rubin代表了与以往NVIDIA的范式转变。传统上,每一代处理器只会演进1-2个芯片,而这次公司同时重新设计了6个不同的组件,全部已进入生产。

原因简单而深远:摩尔定律已不再足够。AI模型每年增长10倍,但传统性能提升难以跟上。于是,NVIDIA选择了“每个层面同步创新”的平台策略。

“核弹”技术的六大支柱:

Vera的CPU集成了88个定制的Olympus核心,支持176个线程,采用NVIDIA的空间多线程技术,系统内存达1.5TB——是上一代Grace的三倍。NVLink带宽达到1.8TB/s。

Rubin GPU是核心明星:其NVFP4推理性能达50 PFLOPS,功耗比Blackwell高出5倍,包含3360亿晶体管,并配备第三个Transformer引擎,能根据需求动态调整精度。

ConnectX-9网络卡支持800 Gb/s以太网和可编程RDMA,BlueField-4 DPU专为存储AI架构设计,结合了64核Grace CPU和1260亿晶体管。

NVLink-6交换机最多连接18个计算节点,使72个Rubin GPU如一台统一的机器协同工作,所有GPU间带宽达3.6TB/s。最后,Spectrum-6光交换机采用512个200Gbps通道,集成硅光子技术。

改变游戏规则的性能:提升3.5倍到10倍

在Vera Rubin NVL72系统中,相较Blackwell的性能飞跃令人震撼。NVFP4推理达3.6 EFLOPS,训练达2.5 EFLOPS,提升了3.5倍。可用内存几乎三倍:54TB LPDDR5X和20.7TB HBM。

但最令人印象深刻的是效率:晶体管仅增加1.7倍(达220万亿晶体管),AI每瓦特每美元的Token生产率提升了10倍。对于一个价值500亿美元、功率为1GW的数据中心来说,这意味着直接翻倍的盈利能力。

具体而言:训练一个参数量达100万亿的模型,Vera Rubin只需Blackwell系统的四分之一,生成一个Token的成本也降至之前的十分之一。

革命性工程:从组装到冷却

这场“核弹”硬件不仅仅是力量的展现。Vera Rubin的工程解决了以往系统的实际难题。旧的超级计算节点需要43根电缆和2小时的手工组装;而Vera节点无需电缆,仅用6根液冷管,5分钟即可组装完成。

机架背部布满了近3.2公里的铜线:5000根铜缆组成了400Gbps的NVLink骨干网。正如黄仁勋幽默所说:“它们可能重达数百磅——你得是个身材健壮的CEO才能搞定。”

记忆瓶颈问题:BlueField-4的解决方案

当代AI面临的关键瓶颈是“KV缓存”——AI的工作内存随着对话变长和模型变大而增长。Vera Rubin通过集成在机架中的BlueField-4处理器解决了这个问题,每个节点配备4个BlueField-4,为GPU提供150TB的上下文存储。

每个节点有4个BlueField-4,向GPU分配内存:每个GPU除了原生的1TB外,还额外获得16TB的存储,保持200Gbps的带宽,速度毫不妥协。

Spectrum-X:为生成式AI设计的网络

为了让数十个机架和数千GPU像一个分布式存储一样协同工作,网络必须“庞大、快速且稳定”。Spectrum-X是全球首个专为生成式AI设计的端到端以太网平台。

采用TSMC的COOP工艺和硅光子技术,拥有512个200Gbps通道。黄仁勋的论断令人信服:生产率提升25%,相当于在一个价值500亿美元的数据中心节省了50亿美元。“可以说,这个网络系统几乎是免费的,”他强调。

从理论到实践:实体AI、机器人与自动驾驶

“核弹”的焦点不仅在硬件。黄仁勋强调,过去十年积累的约10万亿美元计算资源正经历全面现代化,但不仅仅是硬件,更是软件范式的变革。

“三台电脑”架构的实体AI:

基于训练GPU的训练机,如GB300架构。执行实时决策的推理机,即“脑”,用于机器人和边缘设备。模拟计算机——Omniverse和Cosmos——生成虚拟环境,让AI学习物理反馈。

Alpamayo:具备推理能力的自动驾驶

在此架构基础上,NVIDIA推出了Alpamayo,这是首个具备真正推理能力的自动驾驶系统。不同于传统系统,Alpamayo是端到端的,解决“长尾问题”——面对未遇到的道路情况时,不仅仅执行机械代码,而是像人类司机一样推理。

搭载Alpamayo的梅赛德斯CLA将在2026年第一季度在美国上市,随后进入欧洲和亚洲。该系统获得NCAP评为全球最安全车辆,得益于NVIDIA的“双重安全堆栈”:当AI模型信心不足时,系统会立即切换到传统安全模式。

机器人战略:从Boston Dynamics到迪士尼

NVIDIA展示了九家大型AI和硬件公司都在向机器人领域扩展。每个机器人都将使用Jetson计算机,在Omniverse的Isaac模拟器中训练,技术还将集成到Synopsys、Cadence、Siemens等工业系统中。

黄仁勋邀请了Boston Dynamics和Agility等公司的 humanoid 和四足机器人,展望一个令人着迷的未来:最大的机器人其实是工厂本身。其愿景是,芯片设计、系统和工厂模拟都将由实体AI加速。

为什么此刻要推出这“核弹”?

在对所谓“AI泡沫”持怀疑态度的背景下,黄仁勋不仅强调算力,更关注实际应用。这台重达2.5吨的“核弹”既是象征,也是承诺:证明AI真正能改变数字世界和实体世界。

曾经只卖“淘金者的铲子”的NVIDIA,如今直入竞争最激烈的市场——实体AI、机器人、自动驾驶。正如黄仁勋所言:“战争进行时,武器还能继续卖。”

但Vera Rubin的真正创新不在于制造更强大的“核弹”硬件,而在于通过在平台的每个层面同步创新,突破传统的限制。

TOKEN-8.19%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)