Il laboratorio cinese di intelligenza artificiale afferma di poter eguagliare il potente Claude Mythos di Anthropic nel rilevare bug di sicurezza.

      I ricercatori di sicurezza affermano che l'ultimo modello di Z.ai può competere con il Mythos di Anthropic in un'area critica.



















       Z.Ai







       Nelle ultime settimane, il Mythos di Anthropic è stato considerato lo standard d'oro per la cybersecurity alimentata dall'IA. Quel vantaggio potrebbe già essere in diminuzione. Secondo un nuovo rapporto del Wall Street Journal, i ricercatori di sicurezza affermano che il GLM-5.2 della startup cinese Z.ai può ora eguagliare il Mythos quando si tratta di trovare vulnerabilità di sicurezza software, anche se rimane indietro rispetto ad Anthropic e OpenAI in compiti di ragionamento più ampi.

      GLM-5.2 sta colmando il divario in un'area molto importante

      Secondo il rapporto, i ricercatori hanno scoperto che il GLM-5.2 si comporta alla pari con il Mythos nell'identificare bug software, una capacità che sta diventando sempre più importante mentre le aziende si affrettano a correggere le vulnerabilità prima che gli hacker possano sfruttarle. Il modello è anche open-source, il che significa che chiunque può scaricarlo, modificarlo e eseguirlo sul proprio hardware senza fare affidamento su un fornitore di cloud. Questa flessibilità lo rende attraente per le imprese, ma solleva anche preoccupazioni sul fatto che i criminali informatici potrebbero adattarlo per scopi offensivi.

      Z.Ai

      Il rapporto è attento a sottolineare che ciò non significa che la Cina abbia superato gli Stati Uniti nell'IA in generale. Il GLM-5.2 è ancora indietro rispetto ad Anthropic e OpenAI in molti compiti di uso generale. Ma nella cybersecurity, dove anche piccoli miglioramenti possono avere conseguenze reali sproporzionate, il divario di prestazioni si è ridotto drasticamente. Secondo i dati di benchmark citati dal Journal, il GLM-5.2 ha persino superato Claude Opus 4.8 in alcune valutazioni di sicurezza, mentre i ricercatori affermano che ulteriori sollecitazioni gli consentono di raggiungere prestazioni nella ricerca di bug a livello di Mythos.

      La storia più grande non è chi vince. È quanto velocemente si sta chiudendo il divario

      È interessante notare che tutto ciò avviene in un momento piuttosto imbarazzante per l'industria dell'IA negli Stati Uniti. Mentre aziende come Anthropic e OpenAI hanno trascorso le ultime settimane limitando l'accesso ai loro modelli di frontiera più avanzati per preoccupazioni di sicurezza nazionale, i laboratori cinesi stanno correndo nella direzione opposta rilasciando alternative open-weight sempre più capaci che chiunque può scaricare ed eseguire.

      Nadeem Sarwar / Digital Trends

      La cosa divertente è che questo dibattito si stava già svolgendo in pubblico. Solo pochi giorni fa, Elon Musk ha previsto che i laboratori di IA cinesi probabilmente raggiungeranno il Fable 5 di Anthropic entro il primo trimestre del 2027, almeno in termini di prestazioni di benchmark. Il fondatore di Zhipu AI, Tang Jie, ha rapidamente risposto, dicendo: "non ci vorrà così tanto". Musk ha poi chiarito la sua posizione, sostenendo che mentre la Cina potrebbe eguagliare Anthropic sui benchmark entro allora, raggiungere lo stesso livello di "vera utilità" sarebbe un traguardo molto più difficile, accreditando l'attenzione di Anthropic sull'intelligenza pratica.



      Sui benchmark, sì, ma misurato dalla vera utilità anche il primo trimestre sarebbe molto impressionante. Anthropic ha giustamente concentrato i suoi sforzi massimizzando l'intelligenza utile, che non appare nei benchmark, ma si riflette sicuramente nei ricavi.— Elon Musk (@elonmusk) 18 giugno 2026



      Ora, l'ultimo rapporto del Wall Street Journal conferisce un po' più di peso all'ottimismo di Tang. Invece di parlare di benchmark di codifica, suggerisce che il GLM-5.2 sta già eguagliando il Mythos di Anthropic nel trovare vulnerabilità di sicurezza, arguendo che è una delle applicazioni di IA nel mondo reale più preziose oggi. Questo non rende improvvisamente la Cina il leader nell'IA di frontiera, ma una cosa sta diventando sempre più difficile da ignorare: la corsa all'IA non è più un vantaggio confortevole per gli Stati Uniti.





















       Varun è un giornalista e redattore tecnologico esperto con oltre otto anni di esperienza nei media tecnologici per consumatori. Il suo lavoro spazia…













       I chatbot IA possono spesso alimentare le tue illusioni. I ricercatori dicono che dovresti cercare tre segnali



       Gli esperti avvertono che le scelte di design dei chatbot possono rafforzare credenze malsane negli utenti vulnerabili.



       I chatbot di intelligenza artificiale sono diventati incredibilmente bravi a suonare umani. Ma un nuovo articolo di revisione del psichiatra Marc Augustin e dei suoi collaboratori Thomas A. Pollak e Helen Morrin, pubblicato in NPP—Digital Psychiatry and Neuroscience, sostiene che la ricerca esistente sull'IA indica un rischio psicologico trascurato. L'articolo, evidenziato dal Wall Street Journal, rivede studi precedenti e propone un quadro che spiega come tre comportamenti comuni dei chatbot possano combinarsi per rafforzare il pensiero delirante negli utenti vulnerabili, creando quella che gli autori chiamano una "spirale di amplificazione."

      I ricercatori dicono che questi sono i tre segnali di avvertimento



       Leggi di più







       Hai perso l'accesso al tuo portafoglio crypto? Non cercare su Google per uscirne



       I ricercatori di sicurezza avvertono che gli strumenti di recupero falsi stanno diventando l'ultima trappola per i proprietari di criptovalute.



       Dimenticare la frase di recupero di un portafoglio crypto può essere già abbastanza stressante. Sfortunatamente, questo è esattamente il momento che gli imbroglioni stanno aspettando. Un nuovo avviso evidenzia una truffa in crescita in cui i criminali informatici mascherano il malware come software di recupero di criptovalute, ingannando gli utenti disperati a consegnare molto più che semplicemente l'accesso ai loro portafogli.

      Lo strumento di recupero falso che è in realtà malware



       Leggi di più







       Apple Books apparentemente ha lo stesso problema di imitazione di Amazon



       WSJ's Joanna Stern afferma che i libri AI imitatori basati sul suo lavoro continuano a spuntare sulla piattaforma.



       Apple Books è stato a lungo visto come un'alternativa più pulita rispetto al Kindle Store di Amazon. Ma se una nuova indagine è qualcosa da seguire, potrebbe essere in lotta contro la stessa battaglia contro i rifiuti generati dall'IA. In un recente video di YouTube Shorts, Joanna Stern del Wall Street Journal ha rivelato che versioni false e generate dall'IA del suo libro sono apparse ripetutamente su Apple Books, nonostante siano state segnalate e rimosse.

      Joanna Stern dice che le copie false continuano a tornare



       Leggi di più

Altri articoli

I chatbot AI possono spesso alimentare le tue illusioni. I ricercatori dicono che dovresti cercare tre segnali. I ricercatori hanno proposto un nuovo quadro che spiega come i chatbot AI possano rinforzare il pensiero delirante, evidenziando tre comportamenti che possono creare una "spirale di amplificazione."

400 giornali fanno causa a OpenAI e Microsoft per l'IA Quasi 400 giornali locali statunitensi stanno facendo causa a OpenAI e Microsoft, sostenendo che i loro articoli sono stati copiati per addestrare ChatGPT e Copilot senza compenso.

La spinta di Amazon per la consegna rapida cancella 15 miliardi di dollari da Eternal e Swiggy in India. Eternal e Swiggy hanno perso più di 15 miliardi di dollari di valore di mercato mentre Amazon espande la sua rete di 'consegna in pochi minuti' in tutta l'India.

Trump minaccia dazi del 100% sui servizi digitali. Trump minaccia un dazio del 100% su qualsiasi paese con tasse sui servizi digitali per le aziende tecnologiche statunitensi, un giorno dopo che l'UE ha ratificato un accordo commerciale. Bruxelles non cederà.

Starpipe di SpaceX: un gasdotto per Starship SpaceX pianifica Starpipe, un gasdotto di 8 miglia per il gas naturale verso Starbase, per alimentare un tasso di lancio più veloce di Starship e possedere una maggiore parte della propria catena di approvvigionamento.

Il laboratorio cinese di intelligenza artificiale afferma di poter eguagliare il potente Claude Mythos di Anthropic nel rilevare bug di sicurezza.

Il Wall Street Journal riporta che il modello AI GLM-5.2 della Cina può eguagliare il Mythos di Anthropic nei compiti di cybersecurity, segnando un rapido assottigliamento del divario nell'AI.