Microsoft lanza tres modelos de IA internos en un desafío directo a OpenAI

Microsoft lanza tres modelos de IA internos en un desafío directo a OpenAI

      Seis meses después de renegociar el contrato que una vez le prohibió perseguir de manera independiente la IA de frontera, Microsoft ha lanzado tres modelos internos que desafían directamente al socio que gastó 13 mil millones de dólares cultivando. MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2 ya están disponibles en Microsoft Foundry, y no llevan el nombre de OpenAI en ninguna parte de la etiqueta.

      Los modelos son la primera salida públicamente liberada del equipo de Superinteligencia MAI que Mustafa Suleyman, CEO de Microsoft AI, formó en noviembre de 2025 con la misión declarada de perseguir lo que la compañía llama "superinteligencia humanista". En un memorando interno de marzo, reportado por primera vez por Business Insider, Suleyman escribió que tenía la intención de concentrar toda su energía en la superinteligencia y entregar modelos de clase mundial para Microsoft en los próximos cinco años. Esa ambición ahora tiene su primera evidencia tangible.

      MAI-Transcribe-1 es, sobre el papel, el más inmediatamente disruptivo de los tres. El modelo de conversión de voz a texto afirma tener la tasa de error de palabras más baja en 25 idiomas en el benchmark FLEURS, promediando un 3.8 por ciento, y Microsoft dice que supera a Whisper-large-v3 de OpenAI en los 25 idiomas, a Gemini 3.1 Flash de Google en 22 de 25, y a Scribe v2 de ElevenLabs en 15 de 25. Funciona 2.5 veces más rápido que el servicio de transcripción Azure Fast anterior de Microsoft y tiene un precio de $0.36 por hora de audio. Quizás lo más revelador es el equipo que lo construyó: solo 10 personas.

      MAI-Voice-1 completa el ciclo de audio. El modelo de texto a voz genera 60 segundos de audio con sonido natural en menos de un segundo en una sola GPU y soporta la creación de voces personalizadas a partir de unos pocos segundos de audio de muestra. Combinado con MAI-Transcribe-1 y un modelo de lenguaje grande de la elección del cliente, forma un pipeline de voz completo que funciona completamente en la infraestructura de Microsoft sin ninguna dependencia de la tecnología de OpenAI.

      MAI-Image-2, el más antiguo de los tres, ya había debutado en el número tres en la tabla de clasificación de texto a imagen de Arena.ai en marzo, colocándose solo detrás de Gemini 3.1 Flash de Google y GPT Image 1.5 de OpenAI. El modelo fue desarrollado en colaboración con fotógrafos, diseñadores y narradores visuales, y WPP, uno de los grupos de marketing más grandes del mundo, está entre los primeros socios empresariales que lo están construyendo a gran escala.

      El contexto estratégico importa más que los benchmarks. Hasta la renegociación de septiembre de 2025, el acuerdo de asociación original de Microsoft con OpenAI impedía contractualmente a la compañía perseguir de manera independiente el desarrollo de IA general. El memorando de entendimiento revisado cambió ese cálculo fundamentalmente. Microsoft retuvo los derechos de licencia sobre todo lo que OpenAI construya hasta 2032, obtuvo $250 mil millones en nuevos compromisos de negocio en la nube de Azure, y crucialmente ganó la libertad de construir modelos competidores. Suleyman reconoció el cambio directamente: la renegociación del contrato, dijo, permitió a Microsoft perseguir de manera independiente su propia superinteligencia.

      El momento es deliberado. Jacob Andreou, anteriormente vicepresidente senior en Snap, asumió como vicepresidente ejecutivo de Copilot el 17 de marzo, liberando a Suleyman de las responsabilidades diarias del producto. Los modelos MAI llegaron apenas dos semanas después. Microsoft también contrató a Ali Farhadi, el ex CEO del Instituto Allen para IA, para el equipo de superinteligencia de Suleyman en marzo, una señal de reclutamiento de que las ambiciones se extienden mucho más allá de la transcripción y la generación de imágenes.

      Para OpenAI, el desarrollo crea una dinámica incómoda. Microsoft sigue siendo su mayor inversor único y su principal proveedor de infraestructura en la nube, y las dos compañías continúan compartiendo una plataforma en Foundry, que alberga tanto modelos de OpenAI como de Microsoft. Pero el propio impulso de OpenAI hacia la monetización comercial está acelerándose en paralelo, y la relación comienza a parecerse a dos compañías orbitando el mismo mercado con productos superpuestos en lugar de una asociación con una clara división del trabajo. La recaudación de $110 mil millones de OpenAI en febrero, respaldada por SoftBank, Nvidia y Amazon, valoró a la compañía independientemente de Microsoft a un nivel que hace que el marco de la asociación original sea cada vez más anacrónico.

      El mercado más amplio de modelos de IA se está fragmentando en líneas similares. La recaudación de $30 mil millones de Anthropic a una valoración de $380 mil millones la estableció como una tercera fuerza creíble en la IA empresarial, con ingresos anuales de $14 mil millones. Google continúa iterando rápidamente sobre Gemini. La era en la que OpenAI era el único juego en la ciudad para capacidades de IA de frontera, y Microsoft estaba contento de ser su canal de distribución exclusivo, ha terminado de manera definitiva.

      Microsoft Foundry, la plataforma anteriormente conocida como Azure AI Foundry y antes de eso Azure AI Studio (el segundo cambio de marca en doce meses), ahora sirve a desarrolladores en más de 80,000 empresas, incluyendo el 80 por ciento de las compañías Fortune 500. Esa ventaja de distribución es lo que hace que la familia de modelos MAI sea estratégicamente significativa: Microsoft no necesita superar a OpenAI en cada benchmark para cambiar el gasto empresarial hacia modelos internos. Necesita ser lo suficientemente competitiva como para que los clientes elijan la opción integrada sobre la alternativa de terceros, una dinámica que el año pasado de consolidación en la industria de IA ha hecho cada vez más plausible.

      Suleyman ha dicho que tomará otro año o dos antes de que el equipo de superinteligencia produzca modelos de lenguaje de clase frontera. Lo que llegó esta semana es la base: un kit de herramientas multimodal que le da a Microsoft su propia voz, oídos y ojos independientes de OpenAI. La asociación de $13 mil millones no está terminando. Pero la premisa sobre la que se construyó, que Microsoft necesitaba a OpenAI para competir en IA, se está desmantelando silenciosamente un lanzamiento de modelo a la vez.

Otros artículos

¿Esperando que la IA pueda arreglar tu vida amorosa? La historia de este actor dice lo contrario. ¿Esperando que la IA pueda arreglar tu vida amorosa? La historia de este actor dice lo contrario. El actor y escritor Rhik Samadder dejó que la IA escribiera su perfil de citas, mensajes y sugerencias de conversación, solo para descubrir que la confianza del chatbot se desmorona rápidamente en las citas del mundo real. Por solo $3, el palo mágico de Google salvará tu PC envejecida. Por solo $3, el palo mágico de Google salvará tu PC envejecida. Google y Back Market han lanzado un kit USB de ChromeOS Flex por $3 para rescatar PCs con Windows 10 envejecidos. Incluye el sistema operativo gratuito, guías y tutoriales en video, y es una solución mucho más económica que comprar una nueva laptop. Incluso los astronautas en camino a la luna enfrentan problemas de Outlook. Incluso los astronautas en camino a la luna enfrentan problemas de Outlook. Los astronautas en Artemis II se encontraron con un fallo familiar de Outlook en pleno vuelo, lo que obligó al control de la misión a intervenir y solucionar el problema. El error muestra cómo incluso las misiones en el espacio profundo aún dependen de software cotidiano. Por solo $3, el palo mágico de Google salvará tu PC envejecida. Por solo $3, el palo mágico de Google salvará tu PC envejecida. Google y Back Market han lanzado un kit USB ChromeOS Flex de $3 para rescatar PCs con Windows 10 envejecidos. Incluye el sistema operativo gratuito, guías y tutoriales en video, y es una solución mucho más económica que comprar una nueva laptop. El generador de música AI de ElevenLabs convierte tus ideas en canciones de 3 minutos. El generador de música AI de ElevenLabs convierte tus ideas en canciones de 3 minutos. A raíz del lanzamiento de la IA musical de Google, ElevenLabs lanza ElevenMusic, una aplicación de iOS de texto a canción que señala la clara ambición de la empresa de ir mucho más allá de la clonación de voz. La IA está haciendo el trabajo sucio para las compañías de seguros, y está empeorando. La IA está haciendo el trabajo sucio para las compañías de seguros, y está empeorando. La IA ahora está decidiendo si tu reclamación de seguro es aprobada, y las tasas de denegación están aumentando rápidamente. Esto es lo que está sucediendo y por qué la opinión de tu médico podría no importar más.

Microsoft lanza tres modelos de IA internos en un desafío directo a OpenAI

Microsoft lanzó MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2 a través de Foundry, construidos por el equipo de superinteligencia de Mustafa Suleyman. Los modelos compiten directamente con OpenAI.