Microsoft запускает три внутренних ИИ-модели в прямом противостоянии OpenAI

Microsoft запускает три внутренних ИИ-модели в прямом противостоянии OpenAI

      Шесть месяцев спустя после пересмотра контракта, который когда-то запрещал ему самостоятельно заниматься передовыми ИИ, Microsoft выпустила три внутренних модели, которые напрямую бросают вызов партнеру, в развитие которого она вложила 13 миллиардов долларов. MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2 теперь доступны в Microsoft Foundry, и на них нигде не указано имя OpenAI.

      Модели являются первым публично выпущенным результатом команды MAI Superintelligence, которую Мустафа Сулейман, генеральный директор Microsoft AI, сформировал в ноябре 2025 года с заявленной миссией преследовать то, что компания называет «гуманистическим суперинтеллектом». В мартовской внутренней записке, впервые опубликованной Business Insider, Сулейман написал, что намерен сосредоточить всю свою энергию на суперинтеллекте и предоставить модели мирового класса для Microsoft в течение следующих пяти лет. Эта амбиция теперь имеет свои первые ощутимые доказательства.

      MAI-Transcribe-1 является, на бумаге, самой немедленно разрушительной из трех. Модель распознавания речи в текст заявляет о самом низком уровне ошибок слов в 25 языках по стандарту FLEURS, в среднем 3,8 процента, и Microsoft утверждает, что она превосходит Whisper-large-v3 от OpenAI на всех 25 языках, Gemini 3.1 Flash от Google на 22 из 25 и Scribe v2 от ElevenLabs на 15 из 25. Она работает в 2,5 раза быстрее, чем предыдущая служба транскрипции Azure Fast от Microsoft, и стоит 0,36 доллара за час аудио. Возможно, самое показательное — это команда, которая ее создала: всего 10 человек.

      MAI-Voice-1 завершает аудиопетлю. Модель преобразования текста в речь генерирует 60 секунд естественно звучащего аудио менее чем за одну секунду на одном GPU и поддерживает создание пользовательских голосов из нескольких секунд образца аудио. В сочетании с MAI-Transcribe-1 и большой языковой моделью по выбору клиента она формирует полный голосовой конвейер, который полностью работает на инфраструктуре Microsoft без какой-либо зависимости от технологий OpenAI.

      MAI-Image-2, самая старая из трех, уже дебютировала на третьем месте в таблице лидеров Arena.ai по преобразованию текста в изображение в марте, уступая только Gemini 3.1 Flash от Google и GPT Image 1.5 от OpenAI. Модель была разработана в сотрудничестве с фотографами, дизайнерами и визуальными рассказчиками, и WPP, одна из крупнейших маркетинговых групп в мире, является одним из первых корпоративных партнеров, которые строят с ней в масштабах.

      Стратегический контекст имеет большее значение, чем показатели. До пересмотра в сентябре 2025 года первоначальное партнерское соглашение Microsoft с OpenAI контрактуально запрещало компании самостоятельно заниматься разработкой общего ИИ. Пересмотренное меморандум о взаимопонимании изменил эту калькуляцию кардинально. Microsoft сохранила права на лицензирование всего, что создаёт OpenAI до 2032 года, получила 250 миллиардов долларов новых обязательств по бизнесу Azure в облаке и, что особенно важно, выиграла свободу для создания конкурирующих моделей. Сулейман прямо признал этот поворот: пересмотр контракта, сказал он, позволил Microsoft самостоятельно заниматься своим собственным суперинтеллектом.

      Сроки были выбраны намеренно. Джейкоб Андреу, ранее старший вице-президент в Snap, занял пост исполнительного вице-президента Copilot 17 марта, освободив Сулеймана от повседневных продуктовых обязанностей. Модели MAI появились всего через две недели. Microsoft также наняла Али Фархаді, бывшего генерального директора Института Аллена по ИИ, в команду Сулеймана по суперинтеллекту в марте, что является сигналом о том, что амбиции выходят далеко за пределы транскрипции и генерации изображений.

      Для OpenAI это развитие создает неловкую динамику. Microsoft остается ее крупнейшим инвестором и основным поставщиком облачной инфраструктуры, и две компании продолжают делить платформу в Foundry, которая размещает как модели OpenAI, так и Microsoft. Но собственное стремление OpenAI к коммерческой монетизации ускоряется параллельно, и отношения начинают напоминать две компании, которые вращаются вокруг одного и того же рынка с перекрывающимися продуктами, а не партнерство с четким разделением труда. Привлечение 110 миллиардов долларов OpenAI в феврале, поддержанное SoftBank, Nvidia и Amazon, оценило компанию независимо от Microsoft на уровне, который делает первоначальную рамку партнерства все более анахроничной.

      Широкий рынок моделей ИИ фрагментируется по аналогичным линиям. Привлечение 30 миллиардов долларов Anthropic при оценке в 380 миллиардов долларов установило его как надежную третью силу в корпоративном ИИ с доходом на уровне 14 миллиардов долларов. Google продолжает быстро развивать Gemini. Эра, когда OpenAI была единственной игрой в городе для передовых возможностей ИИ, а Microsoft была довольна тем, что является ее эксклюзивным каналом распределения, окончательно закончилась.

      Microsoft Foundry, платформа, ранее известная как Azure AI Foundry, а до этого Azure AI Studio (второй ребрендинг за двенадцать месяцев), теперь обслуживает разработчиков более чем 80 000 предприятий, включая 80 процентов компаний из списка Fortune 500. Это преимущество в распределении делает семейство моделей MAI стратегически значимым: Microsoft не нужно обыгрывать OpenAI по каждому показателю, чтобы перенаправить корпоративные расходы на внутренние модели. Ей нужно быть достаточно конкурентоспособной, чтобы клиенты выбирали интегрированный вариант вместо альтернативы от третьих лиц, динамика, которую прошедший год консолидации в индустрии ИИ сделала все более правдоподобной.

      Сулейман сказал, что потребуется еще год или два, прежде чем команда суперинтеллекта создаст модели языка класса фронтира. То, что появилось на этой неделе, — это основа: мультимодальный инструментальный набор, который дает Microsoft собственный голос, уши и глаза независимо от OpenAI. Партнерство на 13 миллиардов долларов не заканчивается. Но предпосылка, на которой оно было построено, что Microsoft нуждается в OpenAI, чтобы конкурировать в ИИ, тихо разрушается с каждым выпуском модели.

Другие статьи

Генератор музыки ElevenLabs AI превращает ваши идеи в 3-минутные песни. Генератор музыки ElevenLabs AI превращает ваши идеи в 3-минутные песни. Сразу после запуска музыкального ИИ от Google, ElevenLabs представляет ElevenMusic — приложение для iOS, которое превращает текст в песню и подчеркивает явное стремление компании выйти далеко за пределы клонирования голоса. Надеетесь, что ИИ сможет исправить вашу личную жизнь? История этого актера говорит об обратном. Надеетесь, что ИИ сможет исправить вашу личную жизнь? История этого актера говорит об обратном. Актер и писатель Рик Самаддер позволил ИИ написать его профиль для знакомств, сообщения и подсказки для разговоров, только чтобы обнаружить, что уверенность чат-бота быстро распадается в реальных свиданиях. Tesla обошла BYD по продажам электромобилей в первом квартале 2026 года, но на фоне увеличения запасов и спада в Европе победа омрачена. Tesla обошла BYD по продажам электромобилей в первом квартале 2026 года, но на фоне увеличения запасов и спада в Европе победа омрачена. Tesla поставила 358,023 электромобиля в первом квартале 2026 года, обогнав BYD с 310,389, но не оправдала ожиданий Уолл-стрит, произвела 50,000 избыточных автомобилей и увидела резкое падение регистраций в Европе. ИИ выполняет грязную работу для страховых компаний, и ситуация ухудшается. ИИ выполняет грязную работу для страховых компаний, и ситуация ухудшается. ИИ теперь решает, будет ли одобрена ваша страховая претензия, и уровень отказов быстро растет. Вот что происходит и почему мнение вашего врача может больше не иметь значения. Microsoft запускает три внутренних ИИ-модели в прямом вызове OpenAI Microsoft запускает три внутренних ИИ-модели в прямом вызове OpenAI Microsoft выпустила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2 через Foundry, созданные командой суперразума Мустафы Сулеймана. Модели напрямую конкурируют с OpenAI. YouTube впервые будет транслировать Coachella в 4K, и также будет трансляция с камеры Pixel. YouTube впервые будет транслировать Coachella в 4K, и также будет трансляция с камеры Pixel. YouTube будет транслировать весь Coachella 2026 бесплатно, начиная с 10 апреля, с семью одновременно работающими сценами, 4K-трансляциями впервые, вертикальной лентой, снятой на Pixel, и Multiview для просмотра четырех сцен одновременно.

Microsoft запускает три внутренних ИИ-модели в прямом противостоянии OpenAI

Microsoft выпустила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2 через Foundry, созданные командой суперразума Мустафы Сулеймана. Модели напрямую конкурируют с OpenAI.