Hal-hal terpenting hari ini adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah manusia versi AI.

Huang Renxun belum naik panggung, informasi bocoran yang sudah tersebar cukup untuk menulis satu buku.

Malam ini saya rangkum tiga poin utama, ayo teman-teman, ikuti saya.

1)Biaya daya komputasi AI langsung dipangkas setengah

Generasi sebelumnya Blackwell sudah sangat hebat, kan. Segera akan diumumkan chip generasi baru Vera Rubin yang akan diproduksi massal.

Apa hebatnya Vera Rubin? Sederhana saja, dua kata: murah.

Menjalankan model AI yang sama, jumlah chip dipangkas hingga seperempat, biaya inferensi turun sembilan kali lipat. Turun sembilan kali lipat, teman-teman. AWS, Microsoft, Google, tiga penyedia cloud terbesar langsung menjadi yang pertama mengadopsi.

2)Groq yang dibeli seharga 20 miliar dolar tahun lalu, hari ini menyerahkan hasil

Sebelumnya Huang Renxun mengatakan di rapat kinerja, Groq akan diintegrasikan sebagai arsitektur ekstensi ke dalam sistem Nvidia, seperti saat mereka membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU Nvidia ditempatkan di pusat data yang sama, GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dua jenis chip ini bekerja sama, mengurangi latensi dalam skenario Agen secara langsung.

AI Agen melakukan pekerjaan manusia, satu tugas bisa bolak-balik puluhan kali, setiap kali harus menguras daya inferensi, dan pengguna menunggu di sana, pengalaman yang lambat bisa membuat sistem crash.

Inferensi dilakukan dalam dua langkah, pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu kata.

GPU ahli dalam langkah pertama, tetapi kecepatan dan kestabilan mengeluarkan kata di langkah kedua, LPU Groq lebih unggul.

200 miliar, mahal tidak?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agen, setiap Agen memanggil model ribuan kali setiap hari.

3)NemoClaw, versi Nvidia dari OpenClaw, diluncurkan

Yaitu sebuah platform open-source, perusahaan bisa langsung menginstal untuk men-deploy karyawan AI menggantikan manusia menjalankan proses, mengelola data, mengatur proyek. Dikatakan sudah dalam pembicaraan dengan Salesforce dan Adobe.

Hal menariknya adalah, NemoClaw tidak mengharuskan penggunaan chip Nvidia. Coba perhatikan logikanya. Menjual chip hanya mendapatkan keuntungan dari perangkat keras, menetapkan aturan agar bisa mendapatkan keuntungan dari seluruh rantai. Huang Renxun sangat paham soal ini.

4)Huang Renxun mengatakan akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar adalah arsitektur generasi berikutnya, Feynman, yang akan muncul pertama kali, diproduksi massal tahun 2028, dengan proses 1.6nm TSMC yang paling canggih.

Selain itu, ada rumor kurang populer yang saya rasa cukup menarik.

Nvidia akan merilis prosesor laptop, dua model, fokus pada gaming. Penjual kartu grafis akan bersaing merebut pasar CPU juga.

Malam ini saya merasa Huang Renxun akan menjadi seorang tokoh besar di masa depan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan