Il Mythos di Anthropic ha trovato difetti nei sistemi classificati degli Stati Uniti durante un test governativo.
Uno dei modelli di intelligenza artificiale di Anthropic ha identificato vulnerabilità in sistemi informatici governativi statunitensi altamente sensibili e classificati durante un esercizio di test, ha riferito un funzionario statunitense all'Associated Press.
Il modello in questione era Mythos, il sistema più capace di Anthropic, e ha rivelato i difetti in poche ore. È fondamentale notare che trovare una debolezza in poche ore non è la stessa cosa che sfruttarla in poche ore, e il funzionario non ha detto che il modello abbia fatto quest'ultimo.
Il contesto è importante perché una versione più drammatica ha viaggiato più velocemente dei fatti. Il test era un esercizio di red-team, un'organizzazione che esamina le proprie difese, in cui le agenzie di intelligence hanno utilizzato Mythos nei propri ambienti classificati per vedere cosa avrebbe trovato.
Non si è trattato di un'intrusione dall'esterno e non ci sono affermazioni che alcun sistema reale sia stato compromesso. Il resoconto dell'AP attribuisce la scoperta a un singolo funzionario non nominato.
Il 💜 della tecnologia dell'UE Gli ultimi rumori dalla scena tecnologica dell'UE, una storia dal nostro saggio fondatore Boris e alcune opere d'arte AI discutibili. È gratuito, ogni settimana, nella tua casella di posta. Iscriviti ora! L'esercizio rientra nel Progetto Glasswing, il programma a accesso controllato attraverso il quale Anthropic ha fornito Mythos a un insieme selezionato di organizzazioni piuttosto che rilasciarlo pubblicamente.
Il modello è stato costruito per trovare e, nei test, sfruttare vulnerabilità software, e lo ha fatto su una scala che ha inquietato le persone che lo hanno visto.
In valutazioni precedenti ha rivelato migliaia di difetti zero-day su sistemi operativi e browser principali, incluso un bug di 27 anni in OpenBSD.
La questione dei sistemi classificati è emersa pubblicamente durante un'udienza al Senato. L'11 giugno, il senatore Mark Warner, vicepresidente della Commissione per l'intelligence del Senato, ha dichiarato che il generale Joshua Rudd, che guida la NSA e il Cyber Command, gli aveva detto che Mythos "è entrato in quasi tutti i nostri sistemi classificati, non in settimane, ma in ore."
Che la versione più colorita sia vera o meno, la capacità sottostante non è in discussione. L'AI Security Institute del Regno Unito ha valutato Mythos come sostanzialmente più capace in attacco informatico rispetto a qualsiasi modello avesse testato in precedenza.
Ciò che è contestato è come interpretare un risultato di red-team contro reti classificate, una dimostrazione inquietante di velocità, non prova di una violazione effettivamente subita.
L'episodio si colloca all'interno di un groviglio che il governo degli Stati Uniti non ha risolto. La NSA è stata autorizzata a continuare a utilizzare Mythos su reti classificate, e parti della comunità di intelligence e della Cybersecurity and Infrastructure Security Agency lo hanno testato.
Allo stesso tempo, l'amministrazione ha costretto Anthropic a disabilitare Mythos e il suo gemello pubblico Fable 5 in tutto il mondo il 12 giugno, dopo una disputa separata su un presunto jailbreak, un ordine ora contestato in tribunale.
Lo stesso governo che dipende dal modello lo ha anche limitato, si è opposto alla sua espansione e in precedenza ha etichettato il suo creatore come un rischio per la catena di approvvigionamento della sicurezza nazionale.
Questa contraddizione è il filo conduttore degli ultimi tre mesi. Mythos di Anthropic si è mosso tra i governi più velocemente di quanto ciascuno di essi possa decidere a cosa serva: utilizzato dalla NSA, corteggiato dal Tesoro, opposto da parti della Casa Bianca e conteso dal Pentagono.
Warner, da parte sua, ha citato il test non per condannare Anthropic, ma per sostenere la necessità di una valutazione obbligatoria pre-rilascio dei modelli all'avanguardia, che è un punto diverso da quello che è diventato virale.
Anthropic non ha rivelato cosa abbia trovato il test, e le agenzie coinvolte hanno detto poco ufficialmente. L'azienda ha terminato la formazione di un successore di Mythos, un segno che la capacità sta avanzando indipendentemente da come si sistemano le politiche.
Per ora, il nucleo verificabile è ristretto e le inferenze attorno ad esso sono ampie: un modello potente, puntato su obiettivi difficili in un ambiente controllato, ha trovato debolezze rapidamente.
Ciò che questo significa per tutti coloro che non stanno conducendo un esercizio di red-team è la parte ancora in discussione.
Altri articoli
Il Mythos di Anthropic ha trovato difetti nei sistemi classificati degli Stati Uniti durante un test governativo.
Un funzionario statunitense afferma che il modello Mythos di Anthropic ha trovato vulnerabilità nei sistemi governativi classificati durante un test di red team, non a causa di una violazione esterna.
