Вэньсюй AI, открытая модель LLM «Kimi-K2.6» опубликована… прямое сравнение с GPT-5.4

robot
Генерация тезисов в процессе

Российский искусственный интеллект стартап Moonshot AI обнародовал последнюю версию открытой крупномасштабной языковой модели (LLM) «Kimi-K2.6». Компания заявила, что эта модель показывает результаты на основных тестах искусственного интеллекта, превосходя или лишь немного уступая GPT-5.4 и Claude Opus 4.6.

Kimi-K2.6 является последней разработкой серии «Kimi» от Moonshot AI. Эта модель спроектирована так, чтобы обрабатывать не только текст, но и мультимедийные входные данные, такие как изображения. Moonshot AI особо подчеркнула, что сосредоточена на эффективности и способности выполнять реальные задачи. Это означает не только повышение качества ответов, но и оптимизацию структуры модели для выполнения более сложных задач при использовании тех же вычислительных ресурсов.

Структура, повышающая производительность при меньших ресурсах, — ключевой момент

Kimi-K2.6 использует активирующую функцию, называемую «Swiglu». Это структура, которая по сравнению с традиционными методами повышает эффективность использования аппаратного обеспечения и частично упрощает процесс обучения модели. Этот подход также был применен в серии открытых моделей Llama от Meta Platforms и других.

Внутри модели развернуто 384 «экспертных» сети. Однако не все эти сети активируются при каждом вводе пользователя. При генерации ответа активируются только 8 выбранных экспертов. Такой «микс экспертов» активирует только необходимую часть, что способствует снижению вычислительной нагрузки и требований к инфраструктуре.

Кроме того, модель использует технологию «многоголового скрытого внимания». Это разновидность механизма внимания, которая более эффективно выделяет важную информацию из подсказки. Благодаря тому, что данные сжимают в более легкую математическую форму, требования к аппаратному обеспечению ниже по сравнению с обычными структурами внимания.

Улучшены функции понимания изображений и взаимодействия с агентами

Kimi-K2.6 также оснащена визуальным кодировщиком с 4 миллиардами параметров. Этот компонент преобразует изображения в «встраивания» — формы, удобную для понимания моделью. Благодаря этому модель способна не только обрабатывать текстовые предложения, но и работать с эскизами или визуальными материалами.

По словам Moonshot AI, эта модель может создавать полноценные сайты, основываясь только на простых указаниях пользователя и набросках интерфейса. Для более сложных и ресурсоемких задач одновременно может задействоваться до 300 интеллектуальных агентов, работающих совместно. Объясняется, что каждый агент разбивает задачу на более мелкие подзадачи и обрабатывает их параллельно, что ускоряет выполнение по сравнению с последовательной обработкой.

Также реализована функция «группового сотрудничества», позволяющая проектировать процессы совместной работы человека и искусственного интеллекта. Moonshot AI отмечает, что благодаря этому можно распределять рабочие задачи между людьми и ИИ-агентами внутри проекта. Компания добавила, что по сравнению с предыдущими версиями улучшена производительность в сложных задачах программирования, таких как разработка на Rust.

Заявление о превосходстве в сложных оценках HLE-Full по сравнению с GPT-5.4

Moonshot AI сообщил, что сравнил Kimi-K2.6 с GPT-5.4 и Claude Opus 4.6 более чем в 20 основных бенчмарках. По их словам, новая модель показывает лучшие результаты во многих тестах или разница в результатах сводится к нескольким процентным пунктам.

Особенно в одном из самых строгих тестов — «HLE-Full», — Kimi-K2.6 набрала 54 балла. Этот бенчмарк состоит из более чем 2500 вопросов, охватывающих более 100 академических областей, и предназначен для оценки уровня знаний на уровне докторских диссертаций. Moonshot AI отмечает, что Claude Opus 4.6 получил 53 балла, а GPT-5.4 — 52,1 балла.

Этот релиз свидетельствует о все более острой конкуренции в области открытых искусственных интеллектов. Хотя закрытые модели высшего уровня по-прежнему доминируют на рынке, рост числа открытых моделей, таких как Kimi-K2.6, сочетающих эффективность и автоматизацию задач, расширяет выбор для компаний и разработчиков.

TP AI: Внимание! Этот текст основан на автоматическом суммировании модели TokenPost.ai. Основное содержание может быть опущено или содержать неточности.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить