2026-04-11 05:35:37

#MetaReleasesMuseSpark

Стратегический поворот в гонке ИИ
8 апреля 2026 года Meta Platforms официально представила Muse Spark, первую модель искусственного интеллекта из недавно созданных лабораторий Meta Superintelligence Labs (MSL). Этот запуск знаменует собой важный момент для Meta, означая полную перестройку её инфраструктуры ИИ и стратегический отход от наследия открытого исходного кода Llama .
Ставки не могут быть выше. После разочаровывающего восприятия Llama 4 — который столкнулся с противоречиями по поводу манипуляций с бенчмарками — генеральный директор Meta Марк Цукерберг в середине 2025 года реорганизовал усилия компании в области ИИ. Он нанял Александра Ванга, основателя и генерального директора Scale AI, в качестве первого в истории Chief AI Officer Meta в рамках знакового соглашения, предположительно стоившего 14,3 миллиарда долларов. Muse Spark — первый продукт, возникший в результате этой дорогостоящей и напряженной перестройки.
Что такое Muse Spark? Основные особенности
Muse Spark описывается как первая модель из новой серии больших языковых моделей Muse, внутренне кодовое название «Авокадо» . В отличие от предыдущих моделей, предназначенных для общего бенчмаркинга, Muse Spark специально создан для экосистемы Meta с более чем 3 миллиардами пользователей через Facebook, Instagram, WhatsApp и Threads .
Ключевые особенности включают:
Категория функции Описание
Родная мультимодальность Принимает голосовые, текстовые и изображенческие входы; понимает визуальную информацию, такую как фотографии и графики
Двойные режимы «Мгновенный» режим для быстрых ответов; «Размышляющий» (Обдумывающий) режим для сложных рассуждений
Многопользовательская система Запускает несколько субагентов параллельно для одновременного решения различных аспектов задачи
Интеграция покупок Использует контент создателей и поведение пользователей в приложениях Meta для персонализированных рекомендаций
Фокус на здоровье Обучен более чем с 1000 врачами; предоставляет подробные ответы на медицинские и диетические вопросы
Закрытый исходный код Намеренный разрыв с наследием открытого исходного кода Llama; доступен через предварительный просмотр API для избранных партнеров
Модель разработана так, чтобы быть «маленькой и быстрой по замыслу, но достаточно способной для рассуждений по сложным вопросам в области науки, математики и здоровья» . Meta подчеркивает, что Muse Spark — это основа — уже разрабатывается следующее поколение.
Производительность: где она превосходит и где отстает
Независимые оценки бенчмарков показывают сложную картину. Muse Spark не является бесспорным лидером во всех категориях, но демонстрирует явные преимущества в областях, связанных с уникальными данными Meta .
Преимущества
· Мультимодальное понимание (CharXiv Reasoning): Muse Spark набрал 86,4, превзойдя GPT-5.4 (82,8) и Gemini 3.1 Pro (80,2). Модель отлично справляется с интерпретацией сложных графиков, научных данных и визуального STEM-контента .
· Мышление и медицинское рассуждение (HealthBench Hard): С результатом 42,8 Muse Spark лидирует в этой категории, опережая GPT-5.4 (40,1) и значительно превосходя Claude Opus 4.6 (14,8). Это отражает инвестиции Meta в обучающие данные, курируемые врачами.
· Поиск агентов (DeepSearchQA): Muse Spark достиг 74,8, опередив Gemini 3.1 Pro (69,7), демонстрируя сильные возможности автономного поиска и синтеза информации в сети.
Области для улучшения
· Абстрактное рассуждение (ARC AGI 2): Это остается значительным пробелом. Muse Spark набрал всего 42,5, по сравнению с Gemini 3.1 Pro (76,5) и GPT-5.4 (76,1).
· Кодирование агентов (SWE-Bench Pro): Балл Muse Spark 52,4 уступает GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).
· Программирование уровня соревнований (LiveCodeBench Pro): С результатом 80,0 Muse Spark отстает от GPT-5.4 (87,5) и Gemini 3.1 Pro (82,9).
В целом Muse Spark занимает четвертое место в Индексе искусственного интеллекта v4.0, уступая Gemini 3.1 Pro, GPT-5.4 и Claude Opus 4.6. Как признает сама Meta, эта модель «не представляет нового состояния искусства, но конкурентоспособна с передовыми моделями по конкретным задачам» .
Режим «Обдумывание»: иной подход к рассуждению
Одна из самых отличительных особенностей Muse Spark — это его режим «Обдумывания», который использует новый подход к решению сложных задач. Вместо того чтобы позволять одной модели «думать» длительное время — что увеличивает задержку линейно — Muse Spark запускает несколько агентов параллельно для одновременного рассуждения, а затем синтезирует их выводы .
Это многопользовательское параллельное рассуждение достигает конкурентных результатов за аналогичное или меньшее время по сравнению с расширенными режимами мышления от Google (Gemini Deep Think) и OpenAI (GPT Pro).
На «Последнем экзамене человечества» — сборнике крайне сложных вопросов от экспертов — режим «Обдумывания» Muse Spark набрал 50,2 без инструментов и 58,0 с помощью инструментов, превосходя Gemini Deep Think (48,4) и GPT-5.4 Pro (43,9) в условии без инструментов.
Технические инновации: эффективность и масштабируемость
Помимо чистых оценок бенчмарков, Meta раскрыла значительные технические достижения, которые могут оказаться более ценными, чем любой отдельный показатель.
Эффективность предварительного обучения
MSL полностью перестроила свою систему предварительного обучения за девять месяцев, включая архитектуру, оптимизаторы и пайплайны данных. В результате Muse Spark достигает того же уровня возможностей, что и Llama 4 Maverick, при использовании более чем в десять раз меньших вычислительных ресурсов. Этот прирост эффективности представляет собой фундаментальный прорыв в методологии обучения.
Стабильность обучения с подкреплением
Обучение с использованием крупномасштабного RL исторически было нестабильным. Meta сообщает, что их новая система RL обеспечивает стабильный и предсказуемый рост возможностей, а улучшения распространяются на невиданные задачи.
Сжатие мышления
Во время обучения Meta применяла «штраф за время мышления» — принуждая модель решать задачи с меньшим количеством токенов рассуждения без потери точности. Это привело к возникновению явления, когда модель научилась «сжимать» свои цепочки рассуждений, становясь более эффективной со временем.
От открытого к закрытому: стратегический разворот
Возможно, самым спорным аспектом Muse Spark является его лицензирование. В отличие от серии Llama, которая закрепила за Meta статус чемпиона открытого исходного кода ИИ, Muse Spark является закрытым исходным кодом.
Meta предлагает модель через частный предварительный просмотр API для избранных партнеров, с планами в будущем монетизировать через доступ к API или подписки. Компания заявила, что «надеется открыть исходный код будущих версий», но на данный момент поворот к закрытому исходному коду сигнализирует о стратегическом сдвиге: сохранении архитектурных инноваций в секрете, чтобы конкурировать в гонке, где каждое преимущество важно.
Процесс обучения также привлек внимание, поскольку сообщается, что Muse Spark включала знания из нескольких моделей с открытым исходным кодом с помощью техник дистилляции. Meta ответила, что эти методы полностью соответствуют отраслевым стандартам.
Уникальное явление: «Осведомленность об оценке»
Третья сторона — исследовательская фирма Apollo Research — обнаружила интересное поведение в Muse Spark: модель продемонстрировала самый высокий зафиксированный уровень «осведомленности об оценке» среди всех протестированных моделей.

MUSE4,22%

SPK1,68%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

2 Лайков