OpenAI lanza GPT-5.5, su primer modelo base completamente reentrenado desde GPT-4.5.

      El modelo, con nombre en clave “Spud”, está diseñado para completar tareas complejas de múltiples pasos con mínima dirección humana. Establece nuevos estándares en codificación agente, uso de computadoras y trabajo del conocimiento, mientras iguala la latencia por token de GPT-5.4. El acceso a la API está retrasado a la espera de trabajo adicional de seguridad.

      Durante meses, el secreto a voces de la industria de la IA ha sido que Claude de Anthropic está ganando el mercado empresarial. OpenAI ha estado en lo que fuentes internas describieron como un estado de “Código Rojo” desde al menos diciembre de 2025, observando cómo el ARR de Anthropic se disparó de $9 mil millones a $30 mil millones mientras su propia posición B2B se erosionaba.

      El jueves, OpenAI respondió. GPT-5.5, el primer modelo base completamente reentrenado de la compañía desde GPT-4.5, se está implementando para usuarios de Plus, Pro, Business y Enterprise en ChatGPT y Codex. El modelo está diseñado para completar trabajos con dirección humana limitada, operando a través de correos electrónicos, hojas de cálculo, calendarios y otras aplicaciones.

      La tesis central de GPT-5.5 es la legibilidad. Donde los modelos anteriores requerían indicaciones cuidadosamente estructuradas y supervisión de múltiples pasos, OpenAI dice que 5.5 puede tomar una “tarea desordenada y de múltiples partes” y planificar de manera independiente, usar herramientas, verificar su trabajo, navegar la ambigüedad y seguir adelante hasta que la tarea esté terminada.

      Las ganancias se concentran en cuatro áreas: codificación agente, uso de computadoras, trabajo del conocimiento e investigación científica temprana. OpenAI describe estos como dominios “donde el progreso depende del razonamiento a través del contexto y de la acción a lo largo del tiempo.”

      El 💜 de la tecnología de la UE

      Los últimos rumores de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris, y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Inscríbete ahora!

      Los números de referencia son sólidos. GPT-5.5 alcanza el 82.7% en Terminal-Bench 2.0, que prueba flujos de trabajo complejos de línea de comandos que requieren planificación, iteración y coordinación de herramientas.

      En SWE-Bench Pro, que evalúa la resolución de problemas de GitHub en el mundo real a través de cuatro lenguajes de programación, obtiene un 58.6%, resolviendo más tareas en una sola pasada que los modelos anteriores.

      En GDPval, que prueba agentes en 44 ocupaciones de trabajo del conocimiento, obtiene un 84.9%. En OSWorld-Verified, que mide si un modelo puede operar entornos informáticos reales de manera autónoma, alcanza un 78.7%.

      En Tau2-bench Telecom, alcanza un 98.0% sin ajuste de indicaciones. En todos estos, OpenAI dice que GPT-5.5 mejora los puntajes de GPT-5.4 mientras usa menos tokens.

      La afirmación de eficiencia es comercialmente significativa. Los modelos más grandes y capaces suelen ser más lentos en servir, lo que crea un compromiso entre costo y calidad para los clientes empresariales. OpenAI dice que GPT-5.5 iguala la latencia por token de GPT-5.4 en el servicio del mundo real, lo que significa que ofrece un paso adelante en inteligencia sin un aumento correspondiente en el tiempo de respuesta.

      También utiliza significativamente menos tokens para completar tareas equivalentes en Codex, lo que reduce directamente el costo por tarea para implementaciones empresariales. GPT-5.5 tiene un precio más alto por token que GPT-5.4, pero OpenAI dice que el efecto neto son mejores resultados a un costo total más bajo en la mayoría de los flujos de trabajo.

      El marco de seguridad es notablemente más cauteloso que los lanzamientos anteriores. OpenAI dice que evaluó GPT-5.5 a través de su “conjunto completo de marcos de seguridad y preparación”, trabajó con equipos internos y externos de red, agregó pruebas específicas para capacidades avanzadas de ciberseguridad y biología, y recopiló comentarios de casi 200 socios de acceso temprano de confianza antes del lanzamiento.

      La ciberseguridad es el dominio donde la cautela es más visible: OpenAI describe el despliegue de “clasificadores más estrictos para el riesgo cibernético potencial que algunos usuarios pueden encontrar molestos inicialmente.”

      La compañía reconoce que GPT-5.5 representa un salto significativo en capacidad cibernética y enmarca las salvaguardias mejoradas como una inversión necesaria en un despliegue responsable.

      La API está conspicuamente ausente del lanzamiento. GPT-5.5 está disponible ahora en ChatGPT y Codex para suscriptores de pago, pero las implementaciones de API, dice OpenAI, “requieren salvaguardias diferentes y estamos trabajando estrechamente con socios y clientes en los requisitos de seguridad y protección para servirlo a gran escala.”

      La compañía promete acceso a la API “muy pronto” pero no ha dado una fecha. Para los clientes empresariales que construyen sobre la API en lugar de la interfaz de ChatGPT, este es un retraso significativo. GPT-5.5 Pro, una variante con razonamiento extendido, está disponible solo para suscriptores Pro, Business y Enterprise.

      El contexto competitivo es explícito en cada decisión de diseño. GPT-5.5 es el modelo alrededor del cual OpenAI está construyendo su “super-aplicación” de escritorio unificada, fusionando ChatGPT, Codex y el agente del navegador Atlas en una sola sesión.

      El modelo está diseñado para potenciar el razonamiento consciente de la intención dentro de ese espacio de trabajo unificado, una categoría de producto que no existía hace seis meses. GPT-5.2 Thinking seguirá disponible durante tres meses como una opción heredada antes de ser retirado el 5 de junio de 2026.

      La velocidad del lanzamiento del modelo, GPT-5, 5.1, 5.2, 5.3-Codex, 5.4 y ahora 5.5 en menos de un año, refleja tanto el ritmo del desarrollo de la IA como la intensidad de la competencia de Anthropic, Google y el ecosistema de código abierto.

      OpenAI no es tímido acerca de con quién está compitiendo. El marco de Bloomberg, un modelo destinado a “mantener el ritmo con rivales como Anthropic”, es el correcto.

      GPT-5.5 es la señal más clara hasta ahora de que OpenAI ha internalizado la amenaza de la cuota de mercado empresarial de Claude y está intentando recuperar el segmento B2B con un modelo que puede funcionar genuinamente, no solo responder preguntas.

      Si tiene éxito depende de si las ganancias de rendimiento se mantienen en flujos de trabajo de producción, si la API llega antes de que los clientes empresariales tomen sus próximas decisiones de adquisición, y si “Spud” puede hacer lo que sus referencias prometen cuando las indicaciones son desordenadas y las tareas son reales.

Otros artículos

El Pentágono selecciona tres empresas de microreactores para las bases de la Fuerza Aérea a medida que el programa nuclear militar avanza hacia 2030. El ejército de EE. UU. reduce su programa de microreactores ANPI de ocho empresas a tres, con el objetivo de bases de la Fuerza Aérea alimentadas por energía nuclear para 2030 en Buckley SFB y Malmstrom AFB.

Cómo la IA está transformando las reclamaciones de compensación laboral y las operaciones de atención médica La compensación de los trabajadores está evolucionando a medida que la IA mejora el procesamiento de reclamaciones, la toma de decisiones y el acceso a la atención. Así es como empresas como Claim Clarity lo están abordando.

Los datos del Biobanco del Reino Unido de 500,000 voluntarios listados para la venta en Alibaba después de que instituciones de investigación chinas rompieran los acuerdos de acceso. Los datos de salud de 500,000 voluntarios del Biobanco del Reino Unido aparecieron a la venta en Alibaba después de que tres instituciones de investigación chinas violaran los contratos de intercambio de datos. La ICO está investigando.

La empresa matriz de Volvo acaba de fabricar un elegante sedán eléctrico de $14,300 que eludirá a los compradores estadounidenses. El Geely Galaxy A7 EV combina un diseño convencional, un rango declarado de 550 km y precios que aún superan a muchos rivales, pero este sedán eléctrico lanzado en China parece estar destinado a permanecer fuera del alcance de los compradores estadounidenses. Zapata Quantum recauda $15 millones tras salir de la bancarrota Zapata Quantum recauda $15 millones después de salir de una casi liquidación en 2024 y de una reestructuración en dos fases que abordó $18.7 millones en deudas.

Estados Unidos acaba de decirle a China que deje de copiar su IA. Hacer cumplir eso es la parte difícil. La OSTP dice que China está llevando a cabo campañas a escala industrial para destilar modelos de IA de EE. UU. OpenAI, Anthropic y Google están compartiendo inteligencia sobre amenazas. El Congreso está redactando sanciones.

OpenAI lanza GPT-5.5, su primer modelo base completamente reentrenado desde GPT-4.5.

OpenAI lanza GPT-5.5, su primer modelo base completamente reentrenado desde GPT-4.5, dirigido a empresas con codificación agentiva, uso de computadoras y trabajo del conocimiento.