Gate Booster 第 4 期:發帖瓜分 1,500 $USDT
🔹 發布 TradFi 黃金福袋原創內容,可得 15 $USDT,名額有限先到先得
🔹 本期支持 X、YouTube 發布原創內容
🔹 無需複雜操作,流程清晰透明
🔹 流程:申請成為 Booster → 領取任務 → 發布原創內容 → 回鏈登記 → 等待審核及發獎
📅 任務截止時間:03月20日16:00(UTC+8)
立即領取任務:https://www.gate.com/booster/10028?pid=allPort&ch=KTag1BmC
更多詳情:https://www.gate.com/announcements/article/50203
2026年CES上的“核彈”2.5噸:NVIDIA如何用Vera Rubin重新塑造AI的未來
在CES 2026,黃仁勳帶來了不同尋常的展示:不是一張消費者用的顯示卡,而是一整個2.5噸的AI機架伺服器。這個象徵性的舉動引入了可以被稱為活動真正「核彈」的內容:Vera Rubin計算平台,一個完全重新設計的硬體生態系統,旨在加速新一代AI模型的訓練。
六顆晶片,一個願景:挑戰摩爾定律的架構
Vera Rubin代表著對NVIDIA過去的範式轉變。傳統上,每一代處理器的演進僅涉及1-2顆晶片,但這次公司同時重新設計了6個不同的元件,且全部已進入量產。
原因很簡單但深遠:摩爾定律已不再足夠。AI模型每年成長10倍,但傳統的性能提升已跟不上。黃仁勳因此選擇了「每層同步創新」的平台策略。
「核彈」技術的六大支柱:
Vera的CPU整合88個定制的Olympus核心,支援176個NVIDIA空間多線程技術的線程,並提供1.5TB的系統記憶體——是前一代Grace的三倍。NVLink的帶寬達到1.8TB/s。
Rubin GPU是亮點:其NVFP4推理能力達50 PFLOPS,較Blackwell高出(5倍,擁有3360億晶體管,並包含第三個Transformer引擎,能根據需求動態調整精度。
ConnectX-9網路卡支援800 Gb/s以太網與可程式化RDMA,而BlueField-4 DPU專為處理新型AI存儲架構而設,結合了64核Grace CPU與1260億晶體管。
NVLink-6交換器可連接多達18個計算節點,使72個Rubin GPU能作為一台一致的機器運作,每GPU的全帶寬達3.6TB/s。最後,Spectrum-6光纖交換器使用512個200Gbps通道,整合了矽光子技術。
改變遊戲規則的性能:提升3.5倍到10倍
在Vera Rubin NVL72系統中,與Blackwell相比,性能提升驚人。NVFP4推理達3.6 EFLOPS,)+5x(,而訓練則達2.5 EFLOPS,)+3.5x(。可用記憶體幾乎三倍:54TB LPDDR5X與20.7TB HBM。
但最令人印象深刻的是效率:晶體管數量僅增加1.7倍,達到220兆晶體,AI代幣每瓦每美元的產出提升了10倍。對於一個50億美元的資料中心和1千兆瓦的電力,這直接意味著收益能力的翻倍。
具體來說:訓練一個100兆參數的模型,Vera Rubin只需Blackwell系統的1/4,產生一個代幣的成本約為之前的1/10。
革命性工程:從組裝到冷卻
這個「核彈」硬體不僅是純粹的性能。Vera Rubin的工程解決了過去系統的實際問題。舊的超級電腦節點需要43條電纜和2小時的手動組裝;而Vera節點則不需電纜,只用6條液冷管,5分鐘即可組裝完成。
機架背面有近3.2公里的銅線:5,000條電纜構成了400Gbps的NVLink骨幹。黃仁勳幽默地說:「它們可能重達數百磅——你得是個身材健碩的CEO才能搞定這工作。」
記憶體瓶頸問題:BlueField-4的解決方案
當代AI面臨一個關鍵瓶頸:「KV快取」)AI的工作記憶體(隨著對話長度與模型規模增加而擴展。Vera Rubin利用整合在機架中的BlueField-4處理器來解決,每個BlueField-4配備150TB的上下文記憶體。
每個節點配備4個BlueField-4,將記憶體分配給GPU:每個GPU除了原生的1TB外,還額外獲得16TB的記憶體,並保持200Gbps的帶寬,毫不妥協速度。
Spectrum-X:為生成式AI設計的網路
為了讓數十個機架與數千GPU如同一個分散式記憶體般協作,網路必須「大、快且穩定」。Spectrum-X是全球首個專為生成式AI設計的端到端以太網平台。
最新一代採用TSMC的COOP製程與矽光子技術,擁有512個200Gbps通道。黃仁勳的計算令人信服:提升25%的生產力,等於在一個50億美元的資料中心節省了50億美元。「可以說,這個網路系統幾乎是免費的」,他強調。
從理論到實踐:實體AI、機器人與自動駕駛
這個「核彈」不僅是硬體。黃仁勳強調,過去十年累積的約10兆美元計算資源正進行全面升級,但不僅是硬體,更是軟體範式的轉變。
「三台電腦」架構的AI物理:
基於訓練用GPU的訓練電腦,如GB300架構。推理用電腦,即「大腦」,在機器人與邊緣裝置上進行即時決策。模擬電腦)Omniverse與Cosmos(,生成虛擬環境,讓AI學習物理反饋。
Alpamayo:具備推理能力的自動駕駛
在此架構上,NVIDIA推出了Alpamayo,首款具備真正推理能力的自動駕駛系統。與傳統系統不同,Alpamayo是完全端到端的,解決「長尾問題」——面對未曾遇過的路況時,不僅執行機械式程式碼,而是像人類司機一樣推理。
搭載Alpamayo的梅賽德斯CLA將於2026年第一季在美國推出,之後進入歐洲與亞洲。該系統獲得NCAP評價為全球最安全車輛,得益於NVIDIA的「雙層安全堆疊」:當AI模型信心不足時,系統會立即切換到傳統安全模式。
機器人策略:從波士頓動力到迪士尼
黃仁勳展示了九家大型AI與硬體公司都在擴展到機器人領域。每個機器人都將使用Jetson電腦,在Omniverse的Isaac模擬器中訓練,並將技術整合到Synopsys、Cadence、Siemens等的工業系統中。
他邀請波士頓動力與Agility的仿人與四足機器人,展現一個迷人的願景:最大的機器人是工廠本身。設計晶片、系統與工廠模擬的工作都將由AI物理加速。
為何此時推出這個「核彈」?
在對AI泡沫的懷疑日增的背景下,黃仁勳不僅強調純粹的計算能力,更聚焦於具體應用。這個重達2.5噸的「核彈」既是象徵,也是承諾:證明AI真的能改變數位與實體世界。
過去曾賣「淘金者的鐵鏟」的NVIDIA,現在直入競爭激烈的市場——實體AI、機器人、自動駕駛。正如黃仁勳自己所說:「戰爭進行時,武器就可以繼續賣。」
但Vera Rubin的真正創新不在於打造更強大的「核彈」硬體——而在於證明,通過在平台每一層同步創新,傳統的限制是可以被突破的。