Венсю AI, відкритий LLM ‘Kimi-K2.6’ опубліковано… порівняння з GPT-5.4 у прямому ефірі

robot
Генерація анотацій у процесі

Китайська стартап-компанія з штучного інтелекту Moonshot AI оприлюднила останню відкриту модель великого мовлення (LLM) «Kimi-K2.6». Компанія заявила, що ця модель перевершує або має незначний відрив від GPT-5.4 та Claude Opus 4.6 у основних тестах штучного інтелекту.

Kimi-K2.6 є найновішою роботою серії «Kimi» від Moonshot AI. Ця модель розроблена для обробки не лише тексту, а й мультимедійних даних, таких як зображення. Moonshot AI особливо підкреслює її фокус на ефективності та здатності виконувати реальні завдання. Це означає не лише покращення якості відповідей, а й оптимізацію структури для використання тих самих обчислювальних ресурсів для виконання більш складних завдань.

Структура, що підвищує продуктивність за менших ресурсів, є ключовою

Kimi-K2.6 використовує активуючу функцію, названу «Swiglu». Це структура, яка порівняно з традиційними методами підвищує ефективність використання апаратного забезпечення і частково спрощує процес тренування моделі. Цей підхід також застосовувався у відкритих моделях, таких як серія Llama від Meta Platforms.

У моделі внутрішньо розгорнуто 384 «експерти» мережі. Однак не всі ці мережі активуються щоразу при введенні користувачем запиту. Під час генерації відповіді активуються лише 8 експертів за вибором. Такий «гібрид експертів» активує лише необхідні частини, що сприяє зменшенню обчислювальних навантажень і інфраструктурних витрат.

Крім того, використовується технологія «багатоголовної потенційної уваги». Це механізм уваги, який більш ефективно відбирає важливу інформацію з підказок. Оскільки він стискає дані у легкі математичні вирази для обробки, його апаратні вимоги нижчі порівняно з звичайною структурою уваги.

Покращено функції розуміння зображень та співпраці агентів

Kimi-K2.6 також обладнано візуальним кодером з 4 мільярдами параметрів. Цей пристрій перетворює зображення у «вбудовану» форму, зрозумілу моделі. Завдяки цьому Kimi-K2.6 може обробляти не лише речення, а й працювати з ескізами або візуальними матеріалами.

За словами Moonshot AI, ця модель може створювати повноцінний сайт лише за допомогою простих інструкцій користувача та ескізів інтерфейсу. Для більш складних і тривалих завдань одночасно залучаються до 300 агентів для спільної роботи. Це означає, що кожен агент розбиває завдання на дрібні підкроки для паралельної обробки, що дозволяє швидше виконувати роботу порівняно з послідовним підходом.

Крім того, за допомогою функції «групової співпраці» можна створювати процеси, де люди та агенти працюють разом. Moonshot AI пояснює, що це дозволяє розподіляти робочі завдання між людськими працівниками та штучними агентами. Компанія додала, що у порівнянні з попередніми моделями, її продуктивність у складних програмних завданнях, таких як розробка на Rust, також покращилася.

Заявляє про перевагу над GPT-5.4 у складних оцінках HLE-Full

Moonshot AI повідомила, що порівнювала Kimi-K2.6 із GPT-5.4 та Claude Opus 4.6 у понад 20 основних тестах. За їхніми словами, нова модель у багатьох тестах випереджає ці дві провідні моделі або розрив у результатах зменшується до кількох відсоткових пунктів.

Особливо у найжорсткішому з відомих тестів «HLE-Full» Kimi-K2.6 набрала 54 бали. Цей тест складається з понад 2500 питань з понад 100 академічних галузей. Moonshot AI стверджує, що у тому ж тесті Claude Opus 4.6 отримав 53 бали, а GPT-5.4 — 52,1.

Цей реліз демонструє, що конкуренція у відкритому штучному інтелекті стає все більш напруженою. Хоча закриті провідні моделі все ще домінують на ринку, з появою відкритих моделей, таких як Kimi-K2.6, що одночасно наголошують на ефективності та автоматизації завдань, вибір для компаній і розробників стає ширшим.

TP AI Зауваження: Цей текст створений на основі мовної моделі TokenPost.ai. Основний зміст може бути опущений або не відповідати фактам.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити