Tantangan yang Tidak Bisa Diabaikan: Hukum Moore Melambat, Permintaan AI Melonjak
Industri menghadapi paradoks yang tidak nyaman: sementara kecepatan peningkatan silikon melambat, model kecerdasan buatan menuntut peningkatan performa eksponensial setiap tahun. Untuk pusat data 1 GW yang berbiaya 50 miliar dolar, perbedaan antara arsitektur lama dan baru bisa berarti menggandakan langsung kapasitas penghasilannya.
Jensen Huang, CEO dari salah satu pemimpin teknologi dunia, secara terbuka mengakui dilema ini: metode optimisasi tradisional tidak lagi mampu mengikuti irama. Oleh karena itu, alih-alih mengganti hanya 1 atau 2 chip per generasi seperti sebelumnya, kali ini mereka berinvestasi dalam redesain menyeluruh dari 6 komponen kunci platform komputasi Vera Rubin, yang sudah dalam fase produksi massal.
Vera Rubin: arsitektur yang Menulis Ulang Aturan Permainan
Protagonis utama dari siklus ini bukanlah kartu grafis konvensional, melainkan ekosistem pemrosesan lengkap. Vera Rubin, dinamai sesuai astronom yang menemukan materi gelap, mewakili perubahan pola pikir: berinovasi secara simultan di semua tingkatan platform.
6 pilar arsitektur ini adalah:
Vera CPU menyediakan kecerdasan dan koordinasi. Dilengkapi dengan 88 inti Olympus yang dikustomisasi, mendukung 176 thread secara simultan berkat teknologi multithread ruang angkasa. Bandwidth NVLink C2C sebesar 1.8 TB/s dan memori sistem 1.5 TB (tripel dibandingkan generasi sebelumnya) memastikan tidak ada bottleneck dalam operasi dasar. Dengan 227 miliar transistor, mengintegrasikan kekuatan pemrosesan yang diperlukan untuk mengkoordinasikan operasi masif.
Rubin GPU, inti komputasi, mencapai 50 PFLOPS kekuatan inferensi dalam presisi rendah, lima kali lebih tinggi dari arsitektur Blackwell. Dengan 336 miliar transistor, mengandung generasi ketiga mesin Transformer yang menyesuaikan presisi secara dinamis sesuai kebutuhan model.
Kartu jaringan ConnectX-9 memberikan konektivitas super cepat dengan Ethernet 800 Gb/s berbasis teknologi PAM4 200G. Termasuk RDMA yang dapat diprogram dan akselerator jalur data, serta sertifikasi keamanan CNSA dan FIPS dengan 23 miliar transistor.
BlueField-4 DPU muncul sebagai prosesor khusus untuk penyimpanan AI generasi baru. Dengan kapasitas SmartNIC 800 Gb/s, menggabungkan CPU Grace 64 inti dengan ConnectX-9, mengandung 126 miliar transistor yang didedikasikan untuk fungsi kritis ini.
Chip switch NVLink-6 adalah pengatur jaringan internal. Dapat menghubungkan 18 node komputasi dan mengkoordinasikan hingga 72 GPU Rubin yang berfungsi sebagai satu sistem kohesif. Dengan arsitektur NVLink 6, setiap GPU mencapai bandwidth 3.6 TB/s all-to-all, memungkinkan komunikasi kolektif super cepat di dalam jaringan.
Akhirnya, switch optik Spectrum-6 mengelola 512 saluran masing-masing 200Gbps untuk transfer yang melebihi kecepatan konvensional. Dibuat dengan teknologi silikon fotonik terintegrasi melalui TSMC COOP, menawarkan 352 miliar transistor yang didedikasikan untuk interkoneksi optik copackaged.
Angka yang Berbicara: Peningkatan Performa Tanpa Tanding
Sistem NVL72 hasil dari integrasi mendalam ini menetapkan standar baru. Dalam tugas inferensi dengan presisi rendah, mencapai 3.6 EFLOPS, lima kali lipat dari generasi sebelumnya. Untuk pelatihan, mencapai 2.5 EFLOPS, peningkatan 3.5 kali.
Memori yang tersedia tiga kali lipat: 54TB LPDDR5X di sistem utama versus 20.7TB HBM bandwidth tinggi. Bandwidth HBM4 mencapai 1.6 PB/s (2.8 kali lebih tinggi), sementara bandwidth Scale-Up mencapai 260 TB/s, dua kali lipat dari generasi sebelumnya.
Yang paling mencolok: lonjakan performa ini dicapai dengan hanya 1.7 kali lebih banyak transistor (2.2 triliun secara total), menunjukkan bahwa inovasi arsitektur sama pentingnya dengan kepadatan silikon.
Dari Digital ke Fisik: Perbatasan Berikutnya
Meskipun angka-angka ini mengesankan, dampak sebenarnya terletak pada aplikasi. AI kini harus beralih dari dunia digital ke fisik. Untuk ini, diperlukan tiga jenis komputasi terintegrasi:
Komputer pelatihan yang dibangun dengan arsitektur seperti GB300 yang menghasilkan model dasar. Komputer inferensi, “otak kecil” yang beroperasi di robot atau kendaraan otonom secara waktu nyata. Dan komputer simulasi, termasuk platform seperti Omniverse dan Cosmos, yang menyediakan lingkungan virtual di mana AI belajar dari umpan balik fisik sebelum beroperasi di dunia nyata.
Alpamayo: Kendaraan Otonom yang Berpikir
Berdasarkan arsitektur tiga komputer ini, muncul Alpamayo, sistem kendaraan otonom pertama dengan kemampuan penalaran asli. Berbeda dari sistem tradisional yang menjalankan instruksi kaku, Alpamayo berpikir seperti pengemudi manusia. Dapat menjelaskan apa yang akan dilakukan selanjutnya dan mengapa memutuskan demikian.
Mercedes CLA yang dilengkapi teknologi ini akan resmi diluncurkan di Amerika Serikat pada kuartal pertama tahun ini, kemudian diperluas ke Eropa dan Asia. Kendaraan ini dinilai NCAP sebagai yang paling aman di dunia, berkat arsitektur “ganda keamanan” yang bergantian antara sistem AI ujung ke ujung dan protokol keamanan tradisional saat kepercayaan menurun.
Robotika: Lebih dari Sekadar Humanoid
Strategi ini meluas ke robot humanoid dan berkaki empat, semuanya dilengkapi dengan mini komputer Jetson dan dilatih di simulator Isaac. Integrasi juga mencakup sistem industri seperti alat dari Synopsys, Cadence, dan Siemens.
Jensen Huang bercanda saat presentasi: “Robot terbesar adalah pabrik itu sendiri. Robot akan dirancang di komputer, diproduksi di komputer, bahkan diuji dan diverifikasi secara virtual di komputer sebelum menghadapi gravitasi nyata.”
Konteks Lebih Luas: 10 Triliun Dolar untuk Modernisasi
Dalam dekade terakhir, sekitar 10 triliun dolar infrastruktur komputasi global sedang sepenuhnya dimodernisasi. Tapi ini bukan sekadar pembaruan perangkat keras. Ini adalah perubahan paradigma dalam pengembangan dan penerapan perangkat lunak.
Naiknya model terbuka, seperti sistem DeepSeek yang mengejutkan dunia dengan efisiensi inferensinya, telah memicu gelombang inovasi. Meskipun model ini tertinggal 6 bulan dari yang paling canggih, setiap setengah tahun muncul generasi baru dengan kemampuan kompetitif.
Kecepatan iterasi ini menjaga startup, raksasa teknologi, dan peneliti tetap bergerak. Platform model Nemotron open-source mencakup biomedis, AI fisik, agen cerdas, robotika, dan kendaraan otonom, dengan berbagai versi yang menonjol di peringkat independen dan banyak diadopsi perusahaan dari berbagai skala.
Efisiensi yang Mengimbangi: Token per Watt dan Dolar
Meskipun Vera Rubin mengonsumsi dua kali lipat energi dibanding pendahulunya, performanya meningkat secara tidak proporsional. Metode kritisnya adalah throughput token yang dihasilkan per watt dan per dolar: meningkat 10 kali lipat.
Untuk pusat data 1 GW, ini berarti Spectrum-X meningkatkan throughput sebesar 25%, setara menghemat 5 miliar dolar dalam infrastruktur. “Sistem jaringan ini hampir gratis,” kata eksekutif tersebut.
Mengatasi KV Cache: Hambatan Terbesar AI Generatif
Masalah utama industri adalah “KV Cache”, memori kerja yang dikonsumsi AI selama percakapan panjang. Seiring model berkembang dan percakapan meluas, memori HBM yang tersedia habis.
Vera Rubin mengatasi ini dengan menempatkan prosesor BlueField-4 di setiap rak. Setiap node berisi 4 BlueField-4, menyediakan 150TB memori konteks terdistribusi di antara GPU, dengan 16TB tambahan per GPU menjaga bandwidth 200Gbps. Dengan demikian, ribuan GPU tersebar di puluhan rak berfungsi sebagai satu memori koheren tunggal.
Makna Geopolitik dari “Bom Nuklir” Ini
Presentasi Vera Rubin mewakili sesuatu yang lebih dalam daripada inovasi teknis. Di era skeptisisme tentang keberlanjutan gelembung AI, Jensen Huang perlu membuktikan secara nyata kemampuan nyata yang diaktifkan AI: dari kendaraan otonom aman hingga robot industri, dari sintesis protein hingga sistem sumber terbuka yang mendemokratisasi teknologi.
Dulunya, perusahaan menjual “sekop di demam emas”. Sekarang, mereka secara langsung terlibat dalam transformasi industri fisik, dari otomotif hingga manufaktur. Evolusi dari penyedia komponen menjadi pengatur ekosistem menandai transisi fundamental dalam bagaimana industri teknologi memposisikan diri untuk dekade berikutnya.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Revolusi komputasi massal: bagaimana "bom nuklir" Vera Rubin mendefinisikan kembali perkembangan AI
Tantangan yang Tidak Bisa Diabaikan: Hukum Moore Melambat, Permintaan AI Melonjak
Industri menghadapi paradoks yang tidak nyaman: sementara kecepatan peningkatan silikon melambat, model kecerdasan buatan menuntut peningkatan performa eksponensial setiap tahun. Untuk pusat data 1 GW yang berbiaya 50 miliar dolar, perbedaan antara arsitektur lama dan baru bisa berarti menggandakan langsung kapasitas penghasilannya.
Jensen Huang, CEO dari salah satu pemimpin teknologi dunia, secara terbuka mengakui dilema ini: metode optimisasi tradisional tidak lagi mampu mengikuti irama. Oleh karena itu, alih-alih mengganti hanya 1 atau 2 chip per generasi seperti sebelumnya, kali ini mereka berinvestasi dalam redesain menyeluruh dari 6 komponen kunci platform komputasi Vera Rubin, yang sudah dalam fase produksi massal.
Vera Rubin: arsitektur yang Menulis Ulang Aturan Permainan
Protagonis utama dari siklus ini bukanlah kartu grafis konvensional, melainkan ekosistem pemrosesan lengkap. Vera Rubin, dinamai sesuai astronom yang menemukan materi gelap, mewakili perubahan pola pikir: berinovasi secara simultan di semua tingkatan platform.
6 pilar arsitektur ini adalah:
Vera CPU menyediakan kecerdasan dan koordinasi. Dilengkapi dengan 88 inti Olympus yang dikustomisasi, mendukung 176 thread secara simultan berkat teknologi multithread ruang angkasa. Bandwidth NVLink C2C sebesar 1.8 TB/s dan memori sistem 1.5 TB (tripel dibandingkan generasi sebelumnya) memastikan tidak ada bottleneck dalam operasi dasar. Dengan 227 miliar transistor, mengintegrasikan kekuatan pemrosesan yang diperlukan untuk mengkoordinasikan operasi masif.
Rubin GPU, inti komputasi, mencapai 50 PFLOPS kekuatan inferensi dalam presisi rendah, lima kali lebih tinggi dari arsitektur Blackwell. Dengan 336 miliar transistor, mengandung generasi ketiga mesin Transformer yang menyesuaikan presisi secara dinamis sesuai kebutuhan model.
Kartu jaringan ConnectX-9 memberikan konektivitas super cepat dengan Ethernet 800 Gb/s berbasis teknologi PAM4 200G. Termasuk RDMA yang dapat diprogram dan akselerator jalur data, serta sertifikasi keamanan CNSA dan FIPS dengan 23 miliar transistor.
BlueField-4 DPU muncul sebagai prosesor khusus untuk penyimpanan AI generasi baru. Dengan kapasitas SmartNIC 800 Gb/s, menggabungkan CPU Grace 64 inti dengan ConnectX-9, mengandung 126 miliar transistor yang didedikasikan untuk fungsi kritis ini.
Chip switch NVLink-6 adalah pengatur jaringan internal. Dapat menghubungkan 18 node komputasi dan mengkoordinasikan hingga 72 GPU Rubin yang berfungsi sebagai satu sistem kohesif. Dengan arsitektur NVLink 6, setiap GPU mencapai bandwidth 3.6 TB/s all-to-all, memungkinkan komunikasi kolektif super cepat di dalam jaringan.
Akhirnya, switch optik Spectrum-6 mengelola 512 saluran masing-masing 200Gbps untuk transfer yang melebihi kecepatan konvensional. Dibuat dengan teknologi silikon fotonik terintegrasi melalui TSMC COOP, menawarkan 352 miliar transistor yang didedikasikan untuk interkoneksi optik copackaged.
Angka yang Berbicara: Peningkatan Performa Tanpa Tanding
Sistem NVL72 hasil dari integrasi mendalam ini menetapkan standar baru. Dalam tugas inferensi dengan presisi rendah, mencapai 3.6 EFLOPS, lima kali lipat dari generasi sebelumnya. Untuk pelatihan, mencapai 2.5 EFLOPS, peningkatan 3.5 kali.
Memori yang tersedia tiga kali lipat: 54TB LPDDR5X di sistem utama versus 20.7TB HBM bandwidth tinggi. Bandwidth HBM4 mencapai 1.6 PB/s (2.8 kali lebih tinggi), sementara bandwidth Scale-Up mencapai 260 TB/s, dua kali lipat dari generasi sebelumnya.
Yang paling mencolok: lonjakan performa ini dicapai dengan hanya 1.7 kali lebih banyak transistor (2.2 triliun secara total), menunjukkan bahwa inovasi arsitektur sama pentingnya dengan kepadatan silikon.
Dari Digital ke Fisik: Perbatasan Berikutnya
Meskipun angka-angka ini mengesankan, dampak sebenarnya terletak pada aplikasi. AI kini harus beralih dari dunia digital ke fisik. Untuk ini, diperlukan tiga jenis komputasi terintegrasi:
Komputer pelatihan yang dibangun dengan arsitektur seperti GB300 yang menghasilkan model dasar. Komputer inferensi, “otak kecil” yang beroperasi di robot atau kendaraan otonom secara waktu nyata. Dan komputer simulasi, termasuk platform seperti Omniverse dan Cosmos, yang menyediakan lingkungan virtual di mana AI belajar dari umpan balik fisik sebelum beroperasi di dunia nyata.
Alpamayo: Kendaraan Otonom yang Berpikir
Berdasarkan arsitektur tiga komputer ini, muncul Alpamayo, sistem kendaraan otonom pertama dengan kemampuan penalaran asli. Berbeda dari sistem tradisional yang menjalankan instruksi kaku, Alpamayo berpikir seperti pengemudi manusia. Dapat menjelaskan apa yang akan dilakukan selanjutnya dan mengapa memutuskan demikian.
Mercedes CLA yang dilengkapi teknologi ini akan resmi diluncurkan di Amerika Serikat pada kuartal pertama tahun ini, kemudian diperluas ke Eropa dan Asia. Kendaraan ini dinilai NCAP sebagai yang paling aman di dunia, berkat arsitektur “ganda keamanan” yang bergantian antara sistem AI ujung ke ujung dan protokol keamanan tradisional saat kepercayaan menurun.
Robotika: Lebih dari Sekadar Humanoid
Strategi ini meluas ke robot humanoid dan berkaki empat, semuanya dilengkapi dengan mini komputer Jetson dan dilatih di simulator Isaac. Integrasi juga mencakup sistem industri seperti alat dari Synopsys, Cadence, dan Siemens.
Jensen Huang bercanda saat presentasi: “Robot terbesar adalah pabrik itu sendiri. Robot akan dirancang di komputer, diproduksi di komputer, bahkan diuji dan diverifikasi secara virtual di komputer sebelum menghadapi gravitasi nyata.”
Konteks Lebih Luas: 10 Triliun Dolar untuk Modernisasi
Dalam dekade terakhir, sekitar 10 triliun dolar infrastruktur komputasi global sedang sepenuhnya dimodernisasi. Tapi ini bukan sekadar pembaruan perangkat keras. Ini adalah perubahan paradigma dalam pengembangan dan penerapan perangkat lunak.
Naiknya model terbuka, seperti sistem DeepSeek yang mengejutkan dunia dengan efisiensi inferensinya, telah memicu gelombang inovasi. Meskipun model ini tertinggal 6 bulan dari yang paling canggih, setiap setengah tahun muncul generasi baru dengan kemampuan kompetitif.
Kecepatan iterasi ini menjaga startup, raksasa teknologi, dan peneliti tetap bergerak. Platform model Nemotron open-source mencakup biomedis, AI fisik, agen cerdas, robotika, dan kendaraan otonom, dengan berbagai versi yang menonjol di peringkat independen dan banyak diadopsi perusahaan dari berbagai skala.
Efisiensi yang Mengimbangi: Token per Watt dan Dolar
Meskipun Vera Rubin mengonsumsi dua kali lipat energi dibanding pendahulunya, performanya meningkat secara tidak proporsional. Metode kritisnya adalah throughput token yang dihasilkan per watt dan per dolar: meningkat 10 kali lipat.
Untuk pusat data 1 GW, ini berarti Spectrum-X meningkatkan throughput sebesar 25%, setara menghemat 5 miliar dolar dalam infrastruktur. “Sistem jaringan ini hampir gratis,” kata eksekutif tersebut.
Mengatasi KV Cache: Hambatan Terbesar AI Generatif
Masalah utama industri adalah “KV Cache”, memori kerja yang dikonsumsi AI selama percakapan panjang. Seiring model berkembang dan percakapan meluas, memori HBM yang tersedia habis.
Vera Rubin mengatasi ini dengan menempatkan prosesor BlueField-4 di setiap rak. Setiap node berisi 4 BlueField-4, menyediakan 150TB memori konteks terdistribusi di antara GPU, dengan 16TB tambahan per GPU menjaga bandwidth 200Gbps. Dengan demikian, ribuan GPU tersebar di puluhan rak berfungsi sebagai satu memori koheren tunggal.
Makna Geopolitik dari “Bom Nuklir” Ini
Presentasi Vera Rubin mewakili sesuatu yang lebih dalam daripada inovasi teknis. Di era skeptisisme tentang keberlanjutan gelembung AI, Jensen Huang perlu membuktikan secara nyata kemampuan nyata yang diaktifkan AI: dari kendaraan otonom aman hingga robot industri, dari sintesis protein hingga sistem sumber terbuka yang mendemokratisasi teknologi.
Dulunya, perusahaan menjual “sekop di demam emas”. Sekarang, mereka secara langsung terlibat dalam transformasi industri fisik, dari otomotif hingga manufaktur. Evolusi dari penyedia komponen menjadi pengatur ekosistem menandai transisi fundamental dalam bagaimana industri teknologi memposisikan diri untuk dekade berikutnya.