Wenxiu AI, LLM sumber terbuka 'Kimi-K2.6' dipublikasikan… Perbandingan langsung dengan GPT-5.4

robot
Pembuatan abstrak sedang berlangsung

Perusahaan startup kecerdasan buatan asal Tiongkok, Moonshot AI, telah merilis model bahasa besar (LLM) open-source terbaru bernama “Kimi-K2.6”. Perusahaan menyatakan bahwa model ini unggul atau hanya sedikit tertinggal dari GPT-5.4 dan Claude Opus 4.6 dalam sebagian besar pengujian standar kecerdasan buatan utama.

Kimi-K2.6 adalah karya terbaru dari seri “Kimi” milik Moonshot AI. Model ini dirancang tidak hanya untuk memproses teks, tetapi juga mampu menangani input multimedia seperti gambar. Moonshot AI secara khusus menekankan efisiensi dan kemampuan pelaksanaan tugas nyata. Ini berarti tidak hanya meningkatkan kualitas jawaban, tetapi juga mengoptimalkan struktur sehingga dapat memanfaatkan sumber daya komputasi yang sama untuk menjalankan tugas yang lebih kompleks.

Struktur yang meningkatkan performa dengan sumber daya lebih sedikit adalah kunci

Kimi-K2.6 menggunakan fungsi aktivasi yang disebut “Swiglu”. Ini adalah struktur yang dapat meningkatkan efisiensi pemanfaatan perangkat keras dibandingkan metode tradisional dan dapat menyederhanakan proses pelatihan model sebagian. Metode ini juga telah diterapkan pada berbagai model open-source seperti seri Llama dari Meta Platforms.

Model ini mengandung 384 jaringan “ahli” di dalamnya. Namun, tidak semua jaringan ini akan aktif setiap kali pengguna mengajukan pertanyaan. Saat menghasilkan respons, hanya delapan ahli yang dipilih secara selektif yang akan dipanggil. Pendekatan “campuran ahli” ini hanya mengaktifkan bagian yang diperlukan, membantu mengurangi beban komputasi dan infrastruktur.

Selain itu, model ini juga dilengkapi dengan teknologi “perhatian potensial multi-kepala”. Ini adalah mekanisme perhatian yang lebih efisien dalam menyeleksi informasi penting dari petunjuk. Karena data dikompresi menjadi bentuk matematis yang lebih ringan untuk diproses, kebutuhan perangkat kerasnya lebih rendah dibanding struktur perhatian biasa.

Kemampuan pemahaman gambar dan kolaborasi agen juga diperkuat

Kimi-K2.6 juga dilengkapi dengan encoder visual berukuran 4 miliar parameter. Perangkat ini mengubah gambar menjadi bentuk “embed” yang mudah dipahami model. Berkat ini, Kimi-K2.6 tidak hanya mampu memproses input kalimat, tetapi juga dapat bekerja dengan sketsa atau materi visual.

Menurut Moonshot AI, model ini dapat menghasilkan situs web lengkap hanya dengan instruksi pengguna sederhana dan sketsa antarmuka. Untuk tugas yang lebih kompleks dan memakan waktu, hingga 300 agen cerdas dapat bekerja secara bersamaan. Dijelaskan bahwa metode ini melibatkan agen-agen yang memecah tugas menjadi langkah-langkah kecil secara paralel, sehingga meningkatkan kecepatan dibandingkan eksekusi secara berurutan.

Selain itu, melalui fitur “kerja sama kelompok”, pengguna dapat merancang alur kerja yang melibatkan manusia dan agen cerdas bekerja sama. Moonshot AI menjelaskan bahwa ini memungkinkan distribusi tugas dalam proyek kepada pekerja manusia dan agen AI. Perusahaan menambahkan bahwa performa mereka dalam tugas pemrograman tingkat tinggi seperti pengembangan Rust juga meningkat dibanding pendahulunya.

Mengklaim unggul dalam evaluasi tingkat tinggi HLE-Full dibanding GPT-5.4

Moonshot AI menyatakan bahwa mereka telah membandingkan Kimi-K2.6 dengan GPT-5.4 dan Claude Opus 4.6 dalam lebih dari 20 pengujian standar utama. Menurut klaim perusahaan, model baru ini unggul dalam banyak pengujian tersebut, atau selisihnya hanya beberapa poin persentase.

Terutama dalam salah satu evaluasi paling ketat, “HLE-Full”, Kimi-K2.6 meraih skor 54. Standar pengujian ini terdiri dari lebih dari 2.500 pertanyaan tingkat doktor dari lebih 100 bidang akademik. Moonshot AI menyebutkan bahwa dalam pengujian yang sama, Claude Opus 4.6 mendapatkan 53 poin, dan GPT-5.4 memperoleh 52,1 poin.

Peluncuran ini menunjukkan bahwa kompetisi AI open-source semakin ketat. Meskipun model-model tertutup tetap mendominasi pasar, semakin banyaknya model open-source seperti Kimi-K2.6 yang menekankan efisiensi dan otomatisasi tugas, membuat pilihan bagi perusahaan dan pengembang menjadi semakin beragam.

Catatan TP AI Artikel ini didasarkan pada ringkasan yang dihasilkan oleh model bahasa TokenPost.ai. Isi utama mungkin telah dipersingkat atau berbeda dari fakta.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan