Muse Spark от Meta здесь – и он закрытый исходный код

      Вкратце: Meta выпустила Muse Spark, первую модель из Meta Superintelligence Labs, подразделения, созданного под руководством Александра Ванга после того, как компания потратила 14,3 миллиарда долларов на приобретение доли в Scale AI. Модель была заново разработана с нуля за девять месяцев, она изначально мультимодальна, вводит режим рассуждения «Размышление», который запускает подагентов параллельно, и теперь обеспечивает работу Meta AI на платформах компании. В отличие от наследия Llama от Meta, она является закрытой.

      Появление модели завершает главу, начавшуюся в июне 2025 года, когда Марк Цукерберг объявил о создании Meta Superintelligence Labs и назначил Ванга первым главным AI-офицером компании. Мандат был четким: догнать OpenAI, Anthropic и Google, и сделать это с командой и инфраструктурой, специально созданными для этой задачи. Девять месяцев спустя эта команда имеет что показать.

      Девять месяцев на перестройку стека

      «Девять месяцев назад мы заново построили наш AI стек с нуля», — написал Ванг в X в среду. «Новая инфраструктура, новая архитектура, новые каналы данных. Muse Spark — это результат этой работы, и теперь он обеспечивает работу Meta AI». Это заявление является прямым признанием того, насколько глубокой была перестройка: не доработка существующей архитектуры, а замена основной инфраструктуры, на которой обучаются модели Meta.

      Модель, известная внутри компании как Avocado, была отложена ранее в этом году после того, как не дотянула до конкурентов в внутренних тестах на рассуждение, кодирование и написание. Выпуск в среду предполагает, что эти пробелы были устранены до такой степени, что Meta считает их конкурентоспособными, даже если общая картина бенчмарков остается смешанной. Формулировка Ванга подчеркивает процесс, а не продукт: Muse Spark описывается как первая в семействе моделей, а не как окончательный ответ лидерам на переднем крае.

      💜 технологий ЕС

      Последние новости из технологической сцены ЕС, история от нашего мудрого основателя Бориса и несколько сомнительных AI-артов. Это бесплатно, каждую неделю, в вашем почтовом ящике. Подпишитесь сейчас! Muse Spark изначально мультимодален, принимает голосовые, текстовые и визуальные входные данные, с текстовым выводом только на старте. Он работает в быстром режиме для повседневных запросов и в новом режиме «Размышление», который координирует несколько подагентов для параллельного рассуждения, что является прямой попыткой конкурировать с расширенными режимами рассуждения, предлагаемыми Gemini Deep Think от Google и GPT-5.4 Pro от OpenAI. К выпуску прилагается ключевое утверждение об эффективности: Meta утверждает, что Muse Spark достигает своей способности к рассуждению, используя более чем в десять раз меньше вычислительных ресурсов, чем Llama 4 Maverick, благодаря технике обучения под названием «сжатие мысли», при которой модель штрафуется во время обучения с подкреплением за чрезмерное время размышления, заставляя ее решать задачи с меньшим количеством токенов рассуждения без потери точности.

      Где бенчмарки рассказывают сложную историю

      Опубликованные Meta бенчмарки ставят Muse Spark на четвертое место в Индексе Искусственного Интеллекта v4.0, с оценкой 52, позади Gemini 3.1 Pro Preview и GPT-5.4 (оба на 57) и Claude Opus 4.6 (53). Общий рейтинг отражает действительно смешанный профиль производительности, а не однородный недостаток.

      На GPQA Diamond, бенчмарке научного рассуждения для выпускников, Muse Spark набрал 89,5%, уступая Gemini 3.1 Pro с 94,3%, GPT-5.4 с 92,8% и Claude Opus 4.6 с 92,7%. На ARC AGI 2, бенчмарке абстрактного рассуждения, разрыв более значителен: Muse Spark набрал 42,5 в режиме Размышления против 76,5 у Gemini 3.1 Pro и 76,1 у GPT-5.4, разница, которая предполагает, что архитектура параллельных подагентов модели не полностью закрывает дистанцию в задачах абстрактного рассуждения. В области программной инженерии Muse Spark набрал 77,4% на SWE-bench Verified.

      Области, где Muse Spark лидирует, специфичны и, не случайно, соответствуют конкретным преимуществам, которые Meta может предложить. На CharXiv Reasoning, который тестирует понимание фигур и графиков из изображений, Muse Spark набрал 86,4 в режиме Размышления, опередив как Gemini 3.1 Pro с 80,2, так и GPT-5.4 с 82,8. На HealthBench Hard, оценке медицинского рассуждения, Muse Spark набрал 42,8%, что отражает обучение модели на данных, собранных в сотрудничестве с более чем 1,000 врачами. Claude Opus 4.6 набрал 14,8% на той же оценке; GPT-5.4 набрал 40,1%.

      Шопинг, здоровье и тезис о «персональной суперинтеллектуальности»

      Результат по медицинскому бенчмарку не случайен. Аргумент о дифференциации Meta для Muse Spark сильно основывается на способности модели сочетать общую способность к рассуждению с конкретными данными, которые Meta имеет над своими конкурентами: три миллиарда пользователей, их интересы, их социальные графы и теперь их запросы о здоровье. Цукерберг описал Muse Spark как «помощника мирового класса и особенно сильного в областях, связанных с персональной суперинтеллектуальностью, таких как визуальное понимание, здоровье, социальный контент, шопинг, игры и многое другое» в посте на Facebook, сопровождающем выпуск.

      Специальный режим шопинга представляет собой наиболее четкое выражение этого тезиса. Эта функция опирается на контент от создателей в экосистеме Meta наряду с сигналами о интересах и поведении отдельных пользователей, позволяя делать рекомендации, которые модель общего назначения, обученная без этого контекста, не может легко воспроизвести. Возможности в области здоровья следуют той же логике: модель, обученная с 1,000 врачами в команде, может анализировать питательную ценность фотографии еды или предоставлять структурированные рекомендации по диетическому здоровью таким образом, который модель общего назначения не может надежно произвести. Это области, где данные платформы Meta действительно являются конкурентным преимуществом, а не маркетинговым заявлением.

      Muse Spark в настоящее время обеспечивает работу запросов в приложении Meta AI и на сайте Meta.ai и будет расширяться на Facebook, Instagram и WhatsApp. Meta также продолжает развивать команду MSL через приобретения, последнее из которых — Moltbook, социальная сеть AI-агентов, соучредители которой присоединились к MSL напрямую. Совокупный эффект — это подразделение, которое собирает как модели, так и агентскую инфраструктуру для работы на их основе.

      Закрытая модель от компании, которая создала Llama

      Деталь, которая привлечет наибольшее внимание со стороны сообщества разработчиков Meta, — это та, что скрыта в объявлении о продукте: Muse Spark является закрытым исходным кодом. Серия Llama от Meta установила шаблон для разработки открытых AI моделей до 2025 года, с последовательными версиями, предоставляющими основу для тысяч приложений, исследовательских проектов и конкурирующих продуктов. Muse Spark нарушает эту схему.

      Meta заявила, что надеется выпустить будущие версии модели под лицензией открытого исходного кода, рассматривая текущее закрытие как временное, а не стратегическое. Более откровенное прочтение заключается в том, что модели с открытым исходным кодом, хотя и ценны для развития экосистемы, жертвуют конкурентным преимуществом, которое приходит от сохранения архитектурных инноваций в собственности, пока конкуренты пытаются сократить разрыв в возможностях. Поворот к закрытой модели — это сигнал о том, что Meta теперь считает себя в гонке, в которой она может позволить себе проиграть меньше кругов.

      Арифметика ставки в 14,3 миллиарда долларов

      Сделка с Вангом была структурирована как инвестиция Meta в 14,3 миллиарда долларов за 49% не голосующей доли в Scale AI, при этом Ванг переходит в Meta в качестве главного AI-офицера, оставаясь в совете Scale. Капитал, который Meta вкладывает в AI инфраструктуру, значительно превышает эту

Другие статьи

Искусственный интеллект VOID от Netflix удаляет объекты, сохраняя движение в реальном мире Netflix подробно описывает инструмент AI для видео, который выходит за рамки простой очистки. Его система, названная VOID, вырезает элементы из отснятого материала, при этом сохраняя поведение всего остального таким образом, чтобы оно все еще казалось естественным. Это знаменует собой сдвиг в редактировании видео с помощью ИИ. Существующие инструменты могут стирать нежелательные элементы, но часто оставляют движение, которое кажется неестественным, […]

Первый коммерческий сервис роботакси в Европе запущен в Загребе Верн запустил первый в Европе коммерческий сервис роботакси в Загребе, работающий на системе Gen-7 от Pony.ai и доступный для бронирования через приложение Verne.

Volkswagen's MOIA и Uber начинают тестирование автономных минивэнов ID. Buzz в Лос-Анджелесе MOIA America и Uber начинают тестирование в Лос-Анджелесе с 10 автономными автомобилями ID. Buzz перед запуском коммерческого роботакси с операторами безопасности к концу 2026 года.

Atlassian приносит визуальные инструменты ИИ и партнерских агентов в Confluence, через месяц после сокращения 1,600 рабочих мест. Инструмент Remix от Atlassian превращает страницы Confluence в диаграммы и инфографику, в то время как 3 агента на базе MCP отправляют контент в Lovable, Replit и Gamma с 13 апреля.

Canva приобретает Simtheory и Ortto в рамках двойной сделки Canva приобрела агентную AI платформу Simtheory и компанию по автоматизации маркетинга Ortto, обе из которых были созданы братьями Крисом и Майком Шарки.

Volkswagen's MOIA и Uber начинают тестирование автономных микроавтобусов ID. Buzz в Лос-Анджелесе MOIA America и Uber начинают тестирование в Лос-Анджелесе с 10 автономными автомобилями ID. Buzz перед запуском коммерческого роботакси с операторами безопасности к концу 2026 года.

Muse Spark от Meta здесь – и он закрытый исходный код

Meta Superintelligence Labs выпускает Muse Spark, свою первую модель после 9-месячной переработки стека. Она лидирует по показателям здоровья, но отстает в абстрактном мышлении.