Gli Stati Uniti ordinano ad Anthropic di chiudere Fable 5 e Mythos 5
TL;DRIl governo degli Stati Uniti ha emesso una direttiva di controllo delle esportazioni il 12 giugno ordinando ad Anthropic di sospendere l'accesso a Fable 5 e Mythos 5, citando preoccupazioni per la sicurezza nazionale relative a un presunto jailbreak. Anthropic ha rispettato l'ordine ma ha contestato pubblicamente, definendo l'azione sproporzionata e avvertendo che avrebbe fermato tutti i dispiegamenti di modelli di frontiera se applicata a livello industriale. Il richiamo senza precedenti è avvenuto solo tre giorni dopo il lancio di Fable 5.
Il governo degli Stati Uniti ha ordinato ad Anthropic di sospendere l'accesso ai suoi due modelli di intelligenza artificiale più capaci, Fable 5 e Mythos 5, in quello che sembra essere il primo caso in cui Washington ha costretto un prodotto commerciale di intelligenza artificiale a essere disattivato. La direttiva, che Anthropic afferma di aver ricevuto alle 17:21 ET del 12 giugno, cita le autorità di sicurezza nazionale e richiede all'azienda di escludere tutti i cittadini stranieri, compresi i propri dipendenti.
Poiché Anthropic non può distinguere in modo affidabile i cittadini stranieri dagli utenti domestici in tempo reale, il risultato pratico è una disattivazione totale di entrambi i modelli per ogni cliente in tutto il mondo. L'accesso a tutti gli altri modelli di Anthropic rimane invariato.
Tre giorni dal lancio alla disattivazione
Anthropic ha lanciato Fable 5 il 9 giugno come il suo primo modello di "classe Mythos" disponibile per il pubblico generale. Fable 5 è la versione destinata al pubblico, con classificatori di sicurezza che indirizzano le richieste segnalate al modello più debole Claude Opus 4.8, mentre Mythos 5, lo stesso modello sottostante con le misure di sicurezza informatica rimosse, era riservato a difensori della cybersicurezza verificati e operatori di infrastrutture critiche.
Il 💜 della tecnologia dell'UE
Le ultime novità dalla scena tecnologica dell'UE, una storia dal nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora!
Entrambi i modelli erano già nel mirino dell'amministrazione Trump, che aveva precedentemente cercato di bloccare il dispiegamento più ampio di Mythos da parte di Anthropic. L'azienda aveva offerto Fable 5 gratuitamente a Pro, Max, Team e abbonati Enterprise fino al 22 giugno.
La disputa sul jailbreak
Il Dipartimento del Commercio ha agito dopo che un'azienda non identificata ha affermato di aver trovato un modo per jailbreakare Mythos, secondo Axios. Anthropic afferma di aver ricevuto solo prove verbali di un jailbreak ristretto, non universale, che comporta essenzialmente la richiesta al modello di leggere un codice specifico e correggere difetti software.
Anthropic ha esaminato la tecnica e afferma che le vulnerabilità emerse erano minori e già note pubblicamente. Sostiene che altri modelli, incluso il GPT-5.5 di OpenAI, possono scoprire gli stessi difetti senza alcun bypass, sebbene TNW non sia stata in grado di verificare indipendentemente questo specifico confronto.
L'azienda sta tracciando una netta distinzione tra jailbreak ristretti, che possono estrarre alcune informazioni in circostanze specifiche, e jailbreak universali, che eludono ampiamente le misure di sicurezza di un modello. Anthropic afferma che nessun tester ha ancora trovato un jailbreak universale per Fable 5, sebbene l'UK AI Safety Institute abbia sviluppato un jailbreak parziale per query di vulnerabilità a turno singolo entro poche ore di test.
Migliaia di ore di red-teaming, poi questo
Prima del lancio, Anthropic afferma di aver collaborato con il governo degli Stati Uniti, l'UK AISI e diverse organizzazioni private terze per testare le misure di sicurezza di Fable per migliaia di ore. Un programma di bug bounty esterno non ha prodotto jailbreak universali in oltre 1.000 ore di test.
L'azienda ha anche adottato una controversa politica di retention dei dati obbligatoria di 30 giorni per tutto il traffico di Fable e Mythos, sovrascrivendo gli accordi di zero retention esistenti con i clienti. Anthropic afferma che la retention è necessaria per rilevare schemi di uso improprio che diventano visibili solo attraverso più richieste.
Anthropic risponde
In una dichiarazione pubblica insolitamente combattiva, Anthropic ha affermato di non essere d'accordo sul fatto che un potenziale jailbreak ristretto dovrebbe essere "causa di richiamo di un modello commerciale distribuito a centinaia di milioni di persone". Ha avvertito che applicare questo standard in tutta l'industria "fermerebbe essenzialmente tutti i nuovi dispiegamenti di modelli per tutti i fornitori di modelli di frontiera".
L'azienda ha chiesto che qualsiasi potere governativo di bloccare dispiegamenti non sicuri sia basato su "un processo statutario che sia trasparente, equo, chiaro e fondato su fatti tecnici". Ha affermato che questa azione non supera quel test.
Un modello di tensione
La direttiva arriva in un contesto di crescente attrito tra Anthropic e Washington. Il Pentagono ha inserito Anthropic nella lista nera come minaccia alla catena di approvvigionamento per la sicurezza nazionale all'inizio di quest'anno, anche se la NSA ha continuato a utilizzare Claude perché non esisteva alcuna alternativa.
Anthropic ha citato in giudizio il governo per quella designazione. La stessa amministrazione che ha etichettato l'azienda come un rischio per la sicurezza ha anche esortato le banche ad adottare la sua tecnologia e autorizzato la NSA a continuare a utilizzare Mythos su reti classificate.
La contraddizione evidenzia l'incertezza del governo su come gestire un'azienda le cui capacità di intelligenza artificiale teme e di cui dipende contemporaneamente.
Cosa significa per l'industria
Se il precedente viene mantenuto, qualsiasi modello di intelligenza artificiale di frontiera potrebbe affrontare un richiamo simile per un singolo jailbreak segnalato, indipendentemente dalla gravità. Questa prospettiva è destinata a inviare un brivido attraverso un'industria che ha trascorso l'ultimo anno a correre per dispiegare modelli sempre più capaci con un crescente scrutinio governativo.
Anthropic afferma di ritenere che la direttiva sia un malinteso e sta lavorando per ripristinare l'accesso il prima possibile. Ha promesso di condividere ulteriori dettagli entro 24 ore.
Altri articoli
Gli Stati Uniti ordinano ad Anthropic di chiudere Fable 5 e Mythos 5
Washington ha costretto Anthropic a disabilitare i suoi modelli di intelligenza artificiale più potenti a causa di un jailbreak contestato, solo tre giorni dopo il lancio. Anthropic afferma che l'azione è sproporzionata.
