Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
2026年CES上的“核弹”2.5吨:NVIDIA如何用Vera Rubin重新塑造AI的未来
在CES 2026上,黄仁勋带来了一件不同寻常的东西:不是一块面向消费者的显卡,而是一整套2.5吨的AI机架服务器。这一象征性举动引出了本次活动的真正“核弹”——Vera Rubin计算平台,一个为加速新一代AI模型训练而全新设计的硬件生态系统。
六芯片,一体愿景:挑战摩尔定律的架构
Vera Rubin代表了与以往NVIDIA的范式转变。传统上,每一代处理器只会演进1-2个芯片,而这次公司同时重新设计了6个不同的组件,全部已进入生产。
原因简单而深远:摩尔定律已不再足够。AI模型每年增长10倍,但传统性能提升难以跟上。于是,NVIDIA选择了“每个层面同步创新”的平台策略。
“核弹”技术的六大支柱:
Vera的CPU集成了88个定制的Olympus核心,支持176个线程,采用NVIDIA的空间多线程技术,系统内存达1.5TB——是上一代Grace的三倍。NVLink带宽达到1.8TB/s。
Rubin GPU是核心明星:其NVFP4推理性能达50 PFLOPS,功耗比Blackwell高出5倍,包含3360亿晶体管,并配备第三个Transformer引擎,能根据需求动态调整精度。
ConnectX-9网络卡支持800 Gb/s以太网和可编程RDMA,BlueField-4 DPU专为存储AI架构设计,结合了64核Grace CPU和1260亿晶体管。
NVLink-6交换机最多连接18个计算节点,使72个Rubin GPU如一台统一的机器协同工作,所有GPU间带宽达3.6TB/s。最后,Spectrum-6光交换机采用512个200Gbps通道,集成硅光子技术。
改变游戏规则的性能:提升3.5倍到10倍
在Vera Rubin NVL72系统中,相较Blackwell的性能飞跃令人震撼。NVFP4推理达3.6 EFLOPS,训练达2.5 EFLOPS,提升了3.5倍。可用内存几乎三倍:54TB LPDDR5X和20.7TB HBM。
但最令人印象深刻的是效率:晶体管仅增加1.7倍(达220万亿晶体管),AI每瓦特每美元的Token生产率提升了10倍。对于一个价值500亿美元、功率为1GW的数据中心来说,这意味着直接翻倍的盈利能力。
具体而言:训练一个参数量达100万亿的模型,Vera Rubin只需Blackwell系统的四分之一,生成一个Token的成本也降至之前的十分之一。
革命性工程:从组装到冷却
这场“核弹”硬件不仅仅是力量的展现。Vera Rubin的工程解决了以往系统的实际难题。旧的超级计算节点需要43根电缆和2小时的手工组装;而Vera节点无需电缆,仅用6根液冷管,5分钟即可组装完成。
机架背部布满了近3.2公里的铜线:5000根铜缆组成了400Gbps的NVLink骨干网。正如黄仁勋幽默所说:“它们可能重达数百磅——你得是个身材健壮的CEO才能搞定。”
记忆瓶颈问题:BlueField-4的解决方案
当代AI面临的关键瓶颈是“KV缓存”——AI的工作内存随着对话变长和模型变大而增长。Vera Rubin通过集成在机架中的BlueField-4处理器解决了这个问题,每个节点配备4个BlueField-4,为GPU提供150TB的上下文存储。
每个节点有4个BlueField-4,向GPU分配内存:每个GPU除了原生的1TB外,还额外获得16TB的存储,保持200Gbps的带宽,速度毫不妥协。
Spectrum-X:为生成式AI设计的网络
为了让数十个机架和数千GPU像一个分布式存储一样协同工作,网络必须“庞大、快速且稳定”。Spectrum-X是全球首个专为生成式AI设计的端到端以太网平台。
采用TSMC的COOP工艺和硅光子技术,拥有512个200Gbps通道。黄仁勋的论断令人信服:生产率提升25%,相当于在一个价值500亿美元的数据中心节省了50亿美元。“可以说,这个网络系统几乎是免费的,”他强调。
从理论到实践:实体AI、机器人与自动驾驶
“核弹”的焦点不仅在硬件。黄仁勋强调,过去十年积累的约10万亿美元计算资源正经历全面现代化,但不仅仅是硬件,更是软件范式的变革。
“三台电脑”架构的实体AI:
基于训练GPU的训练机,如GB300架构。执行实时决策的推理机,即“脑”,用于机器人和边缘设备。模拟计算机——Omniverse和Cosmos——生成虚拟环境,让AI学习物理反馈。
Alpamayo:具备推理能力的自动驾驶
在此架构基础上,NVIDIA推出了Alpamayo,这是首个具备真正推理能力的自动驾驶系统。不同于传统系统,Alpamayo是端到端的,解决“长尾问题”——面对未遇到的道路情况时,不仅仅执行机械代码,而是像人类司机一样推理。
搭载Alpamayo的梅赛德斯CLA将在2026年第一季度在美国上市,随后进入欧洲和亚洲。该系统获得NCAP评为全球最安全车辆,得益于NVIDIA的“双重安全堆栈”:当AI模型信心不足时,系统会立即切换到传统安全模式。
机器人战略:从Boston Dynamics到迪士尼
NVIDIA展示了九家大型AI和硬件公司都在向机器人领域扩展。每个机器人都将使用Jetson计算机,在Omniverse的Isaac模拟器中训练,技术还将集成到Synopsys、Cadence、Siemens等工业系统中。
黄仁勋邀请了Boston Dynamics和Agility等公司的 humanoid 和四足机器人,展望一个令人着迷的未来:最大的机器人其实是工厂本身。其愿景是,芯片设计、系统和工厂模拟都将由实体AI加速。
为什么此刻要推出这“核弹”?
在对所谓“AI泡沫”持怀疑态度的背景下,黄仁勋不仅强调算力,更关注实际应用。这台重达2.5吨的“核弹”既是象征,也是承诺:证明AI真正能改变数字世界和实体世界。
曾经只卖“淘金者的铲子”的NVIDIA,如今直入竞争最激烈的市场——实体AI、机器人、自动驾驶。正如黄仁勋所言:“战争进行时,武器还能继续卖。”
但Vera Rubin的真正创新不在于制造更强大的“核弹”硬件,而在于通过在平台的每个层面同步创新,突破传统的限制。