OpenAI lancia GPT-5.5, il suo primo modello di base completamente riaddestrato da GPT-4.5.
Il modello, con nome in codice “Spud”, è progettato per completare compiti complessi a più fasi con una minima direzione umana. Stabilisce nuovi parametri di riferimento nella codifica agentica, nell'uso del computer e nel lavoro di conoscenza, mantenendo la latenza per token di GPT-5.4. L'accesso all'API è ritardato in attesa di ulteriori lavori di sicurezza.
Per mesi, il segreto di Pulcinella dell'industria dell'IA è stato che Claude di Anthropic sta vincendo il mercato enterprise. OpenAI si trova in quello che le fonti interne hanno descritto come uno stato di “Codice Rosso” da almeno dicembre 2025, osservando la corsa dell'ARR di Anthropic da 9 miliardi a 30 miliardi, mentre la propria posizione B2B si erodeva.
Giovedì, OpenAI ha risposto. GPT-5.5, il primo modello base completamente riaddestrato dell'azienda da GPT-4.5, viene lanciato per gli utenti Plus, Pro, Business ed Enterprise in ChatGPT e Codex. Il modello è progettato per completare il lavoro con una direzione umana limitata, operando attraverso email, fogli di calcolo, calendari e altre applicazioni.
La tesi centrale di GPT-5.5 è la leggibilità. Dove i modelli precedenti richiedevano prompt strutturati con attenzione e supervisione a più fasi, OpenAI afferma che 5.5 può prendere un “compito disordinato e multi-part” e pianificare in modo indipendente, utilizzare strumenti, controllare il proprio lavoro, navigare nell'ambiguità e continuare fino al completamento del compito.
I guadagni sono concentrati in quattro aree: codifica agentica, uso del computer, lavoro di conoscenza e ricerca scientifica precoce. OpenAI descrive questi come domini “dove il progresso dipende dal ragionamento attraverso il contesto e dall'azione nel tempo.” Il 💜 della tecnologia dell'UE Gli ultimi rumori dalla scena tecnologica dell'UE, una storia del nostro saggio fondatore Boris e alcune opere d'arte IA discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora!
I numeri di riferimento sono solidi. GPT-5.5 raggiunge l'82,7% su Terminal-Bench 2.0, che testa flussi di lavoro complessi da riga di comando che richiedono pianificazione, iterazione e coordinamento degli strumenti.
Su SWE-Bench Pro, che valuta la risoluzione di problemi reali su GitHub in quattro linguaggi di programmazione, ottiene il 58,6%, risolvendo più compiti in un solo passaggio rispetto ai modelli precedenti.
Su GDPval, che testa gli agenti in 44 occupazioni di lavoro di conoscenza, ottiene l'84,9%. Su OSWorld-Verified, che misura se un modello può operare autonomamente in ambienti informatici reali, raggiunge il 78,7%.
Su Tau2-bench Telecom, raggiunge il 98,0% senza ottimizzazione dei prompt. In tutti questi casi, OpenAI afferma che GPT-5.5 migliora i punteggi di GPT-5.4 utilizzando meno token.
L'affermazione di efficienza è commercialmente significativa. Modelli più grandi e capaci sono tipicamente più lenti nel servire, il che crea un compromesso tra costo e qualità per i clienti enterprise. OpenAI afferma che GPT-5.5 corrisponde alla latenza per token di GPT-5.4 nel servizio reale, il che significa che offre un passo avanti in intelligenza senza un corrispondente aumento del tempo di risposta.
Utilizza anche significativamente meno token per completare compiti equivalenti in Codex, il che riduce direttamente il costo per compito per le implementazioni enterprise. GPT-5.5 ha un prezzo più alto per token rispetto a GPT-5.4, ma OpenAI afferma che l'effetto netto è risultati migliori a un costo totale inferiore nella maggior parte dei flussi di lavoro.
Il quadro di sicurezza è notevolmente più cauto rispetto ai lanci precedenti. OpenAI afferma di aver valutato GPT-5.5 attraverso la sua “completa suite di framework di sicurezza e preparazione”, di aver lavorato con red-team interni ed esterni, di aver aggiunto test mirati per capacità avanzate di cybersecurity e biologia, e di aver raccolto feedback da quasi 200 partner di accesso anticipato fidati prima del rilascio.
La cybersecurity è il dominio in cui la cautela è più visibile: OpenAI descrive il dispiegamento di “classificatori più rigorosi per potenziali rischi informatici che alcuni utenti potrebbero trovare inizialmente fastidiosi.”
L'azienda riconosce che GPT-5.5 rappresenta un salto significativo nelle capacità informatiche e inquadra le salvaguardie potenziate come un investimento necessario per un dispiegamento responsabile.
L'API è conspicuamente assente dal lancio. GPT-5.5 è disponibile ora in ChatGPT e Codex per gli abbonati a pagamento, ma le implementazioni API, afferma OpenAI, “richiedono salvaguardie diverse e stiamo lavorando a stretto contatto con partner e clienti sui requisiti di sicurezza e protezione per servirla su larga scala.”
L'azienda promette accesso all'API “molto presto” ma non ha fornito una data. Per i clienti enterprise che costruiscono sull'API piuttosto che sull'interfaccia di ChatGPT, questo è un ritardo significativo. GPT-5.5 Pro, una variante con ragionamento esteso, è disponibile solo per gli abbonati Pro, Business ed Enterprise.
Il contesto competitivo è esplicito in ogni decisione di design. GPT-5.5 è il modello attorno al quale OpenAI sta costruendo la sua “super-app” desktop unificata, fondendo ChatGPT, Codex e l'agente del browser Atlas in una singola sessione.
Il modello è progettato per alimentare il ragionamento consapevole dell'intento all'interno di quello spazio di lavoro unificato, una categoria di prodotto che non esisteva sei mesi fa. GPT-5.2 Thinking rimarrà disponibile per tre mesi come opzione legacy prima di essere ritirato il 5 giugno 2026.
La velocità del rilascio del modello, GPT-5, 5.1, 5.2, 5.3-Codex, 5.4 e ora 5.5 in meno di un anno, riflette sia il ritmo dello sviluppo dell'IA sia l'intensità della concorrenza da parte di Anthropic, Google e dell'ecosistema open-source.
OpenAI non è timida riguardo a chi sta competendo. La cornice di Bloomberg, un modello destinato a “tenere il passo con rivali come Anthropic”, è quella giusta.
GPT-5.5 è il segnale più chiaro finora che OpenAI ha interiorizzato la minaccia della quota di mercato enterprise di Claude e sta tentando di riconquistare il segmento B2B con un modello che può davvero lavorare, non solo rispondere a domande.
Se avrà successo dipende dal fatto che i guadagni di prestazione si mantengano nei flussi di lavoro di produzione, se l'API arrivi prima che i clienti enterprise prendano le loro prossime decisioni di approvvigionamento e se “Spud” possa fare ciò che i suoi parametri di riferimento promettono quando i prompt sono disordinati e i compiti sono reali.
Altri articoli
OpenAI lancia GPT-5.5, il suo primo modello di base completamente riaddestrato da GPT-4.5.
OpenAI lancia GPT-5.5, il suo primo modello di base completamente riaddestrato da GPT-4.5, rivolto alle imprese con codifica agentica, utilizzo del computer e lavoro conoscitivo.
