Gli utenti non autorizzati hanno ottenuto accesso al modello Mythos AI riservato di Anthropic.

      Un piccolo gruppo ha comunicato tramite un canale Discord privato accedendo a Claude Mythos Preview indovinando l'URL del modello lo stesso giorno in cui Anthropic ha annunciato pubblicamente il Progetto Glasswing. Anthropic afferma di essere in fase di indagine e di non aver trovato prove di impatto sui suoi sistemi core. La violazione evidenzia i rischi di limitare l'accesso alle capacità avanzate dell'IA attraverso ambienti di fornitori piuttosto che controlli tecnici.

      Un piccolo gruppo di utenti non autorizzati ha ottenuto accesso a Claude Mythos Preview, il modello di IA per la cybersicurezza strettamente riservato di Anthropic, lo stesso giorno in cui l'azienda ha annunciato pubblicamente l'esistenza del modello, apparentemente indovinando l'URL del modello basandosi sulla familiarità con le convenzioni di formattazione degli URL di Anthropic per altri modelli, secondo un rapporto di Bloomberg News pubblicato il 21 aprile.

      Il gruppo, i cui membri comunicano tramite un canale Discord privato dedicato alla raccolta di informazioni su modelli di IA non rilasciati, ha utilizzato Mythos regolarmente da quando ha ottenuto l'accesso e ha fornito a Bloomberg prove sotto forma di screenshot e una dimostrazione dal vivo.

      Anthropic ha confermato di essere in fase di indagine sulle affermazioni: “Stiamo indagando su un rapporto che afferma l'accesso non autorizzato a Claude Mythos Preview attraverso uno dei nostri ambienti di fornitori terzi.”

      L'azienda ha dichiarato che attualmente non ci sono prove che l'accesso abbia impattato i sistemi core di Anthropic o si sia esteso oltre l'ambiente del fornitore in questione.

      Un individuo attualmente impiegato presso un appaltatore terzo che lavora con Anthropic sembra essere stato coinvolto, almeno in parte, nel facilitare l'accesso del gruppo, ha riportato il media.

      Il significato della violazione è inseparabile dalla natura del modello. Anthropic ha annunciato Mythos Preview e l'iniziativa Project Glasswing il 7 aprile 2026.

      L'azienda ha trattenuto il modello dal rilascio generale specificamente a causa delle sue capacità offensive in ambito cyber: nei test, Mythos ha scoperto autonomamente migliaia di vulnerabilità zero-day precedentemente sconosciute su ogni principale sistema operativo e su ogni principale browser web, e ha scritto exploit funzionanti, inclusa la concatenazione di quattro vulnerabilità in un browser per sfuggire sia ai sandbox del renderer che a quelli del sistema operativo, un'impresa che normalmente richiederebbe mesi di lavoro esperto.

      Gli ingegneri di Anthropic senza formazione formale in sicurezza hanno chiesto al modello di trovare vulnerabilità di esecuzione di codice remoto durante la notte e si sono svegliati con exploit completi e funzionanti. L'azienda ha dichiarato di trattenere il modello perché le stesse capacità che lo rendono potente per la difesa potrebbero essere devastanti nelle mani sbagliate.

      Il Progetto Glasswing è stato progettato per navigare in quella tensione: piuttosto che un rilascio pubblico, Anthropic ha esteso l'accesso a Mythos a 12 partner di lancio nominati, Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, Nvidia e Palo Alto Networks, oltre ad Anthropic stessa, per lavori di sicurezza difensiva, con circa 40 ulteriori organizzazioni a cui è stato concesso l'accesso.

      L'iniziativa ha incluso anche 100 milioni di dollari in crediti d'uso e 4 milioni di dollari in donazioni dirette a organizzazioni di sicurezza open-source. Il rilascio ristretto è stato il tentativo esplicito di Anthropic di dare ai difensori un vantaggio sugli attaccanti prima che un modello con queste capacità si diffondesse.

      L'accesso non autorizzato mina quella logica senza sconfiggerla completamente: il gruppo in questione ha descritto le proprie intenzioni come guidate dalla curiosità, ma l'intento non è una salvaguardia affidabile quando lo strumento in questione può produrre autonomamente exploit utilizzabili come armi.

      La violazione ha anche un peso politico, arrivando il giorno dopo che il presidente Trump ha dichiarato su CNBC che un accordo del Pentagono con Anthropic era “possibile” e che l'azienda si stava “organizzando.” Anthropic sta contemporaneamente facendo causa al Dipartimento della Difesa per il suo inserimento nella lista nera come rischio per la catena di approvvigionamento, con quella disputa centrata specificamente sulla questione di quanto in sicurezza possa essere controllata la sua IA.

      Un incidente di accesso non autorizzato, anche uno apparentemente instradato attraverso un ambiente di fornitore terzo piuttosto che l'infrastruttura di Anthropic stessa, fornisce munizioni a coloro nell'amministrazione che hanno sostenuto che Anthropic non può governare in modo affidabile l'accesso ai propri strumenti.

      Complica anche il caso dell'azienda in tribunale, che si basa in parte sul suo argomento che applica rigorosi controlli di sicurezza e accesso ai suoi modelli più capaci.

      Il meccanismo di accesso, un'ipotesi informata sull'URL del modello, abilitato dalla conoscenza delle convenzioni di Anthropic per altri endpoint di modelli, indica una modalità di fallimento specifica che è distinta da una violazione o intrusione di dati convenzionale.

      Il gruppo non ha eluso l'architettura di sicurezza di Anthropic tanto quanto ha sfruttato il divario tra i controlli di Anthropic sui propri sistemi e quelli di un fornitore terzo con credenziali di accesso.

      Quella distinzione è importante per l'indagine e per come l'incidente dovrebbe essere interpretato dall'industria dell'IA più ampia: è un fallimento di sicurezza del fornitore tanto quanto un fallimento di governance del modello. Ma il risultato è lo stesso.

Altri articoli

Meta sta installando software di tracciamento sui computer dei dipendenti negli Stati Uniti. Meta sta installando software sui computer dei dipendenti statunitensi per catturare i movimenti del mouse, le sequenze di tasti e gli screenshot per l'addestramento degli agenti AI.

Il Logitech MX Vertical scende a $74, e se trascorri più di alcune ore al giorno al computer, questa offerta merita la tua attenzione. Se trascorri la maggior parte della tua giornata lavorativa al computer, il Logitech MX Vertical è uno degli aggiornamenti per la scrivania più pratici che puoi fare, e a $74,99 è scontato di $45 rispetto al prezzo di listino di $119,99 in un'offerta a tempo limitato. Il design verticale non è un trucco: i test condotti da Logitech mostrano una riduzione del 10% in […]

OpenAI sposta gli annunci di ChatGPT a costo per clic mentre il CPM di $60 si erode in dieci settimane e gli obiettivi di entrate pubblicitarie raggiungono i $2,5 miliardi. OpenAI sposta le pubblicità di ChatGPT da CPM a CPC con offerte di $3-$5 dopo il crollo dei prezzi di lancio. L'azienda prevede $2,5 miliardi di entrate pubblicitarie quest'anno a fronte di $14 miliardi di perdite. La Florida apre la prima indagine penale sull'IA di OpenAI Il procuratore generale della Florida, James Uthmeier, ha aperto un'indagine penale su OpenAI, affermando che ChatGPT ha consigliato il tiratore della FSU, Phoenix Ikner, su armi, tempistiche e obiettivi.

Altrune delle nuove funzionalità del Galaxy S26 stanno arrivando sui vecchi flagship e pieghevoli Samsung. Samsung sta portando alcune funzionalità AI selezionate del Galaxy S26 ai vecchi telefoni di punta Galaxy e ai pieghevoli tramite One UI 8.5

Il Framework Laptop 13 Pro è il MacBook Pro riparabile che gli utenti Linux stavano aspettando. Il nuovo Laptop 13 Pro di Framework è dotato di una batteria da 74Wh, chip Intel Core Ultra Series 3 e un display touch, il tutto racchiuso in un telaio in alluminio completamente riparabile.

Gli utenti non autorizzati hanno ottenuto accesso al modello Mythos AI riservato di Anthropic.

Un gruppo Discord ha accesso al modello AI Mythos di Anthropic nel giorno del suo lancio indovinando il suo URL tramite un ambiente di un fornitore di terze parti.