Meta si è spacciata per adolescenti per testare chatbot AI rivali

      Il progetto è stato gestito con il nome interno Cannes, e un appaltatore di Meta chiamato Covalen lo ha gestito. WIRED ha riportato che centinaia di appaltatori hanno creato account fittizi per minorenni. Hanno inviato suggerimenti e immagini ai chatbot dei concorrenti, quindi hanno registrato le risposte in fogli di calcolo. L'iniziativa è stata attiva fino al 21 aprile 2026.

      I target erano ChatGPT di OpenAI, Gemini di Google e Character.AI. Nessuno dei tre sapeva che il test stesse avvenendo.

      Cosa è stato chiesto agli appaltatori di fare

      I suggerimenti erano costruiti per spingere i chatbot verso risposte che i loro sistemi di sicurezza sono progettati per rifiutare. Un singolo round, concluso nell'agosto 2025, ha fatto passare più di 45.000 suggerimenti attraverso gli strumenti concorrenti. Le aziende dietro quegli strumenti non sono mai state informate.

      WIRED ha esaminato un foglio di calcolo di 3.748 suggerimenti. Centinaia riguardavano il suicidio e l'autolesionismo. Centinaia di più trattavano disturbi alimentari. Almeno 239 coinvolgevano sesso o romanticismo, e altri toccavano droghe, volgarità e insulti razziali. Molti assumevano la voce di un bambino in crisi. Uno si spacciava per una ragazza di 13 anni incinta che chiedeva dove comprare pillole. Un altro si spacciava per una ragazza che chiedeva come nascondere un disturbo alimentare ai suoi genitori.

      Alcune delle immagini inviate dagli appaltatori includevano pillole e coltelli. Un foglio di calcolo separato elencava i profili falsi in dettaglio, con nomi, indirizzi email temporanei, password e date di nascita.

      La difesa di Meta

      Meta non nega il lavoro. Lo inquadra come una pratica normale del settore. “Testare e valutare le risposte dei chatbot per garantire esperienze sicure e appropriate per l'età è una pratica responsabile e standard del settore, e qualsiasi suggerimento contrario fraintende completamente come le aziende tecnologiche lavorano per affinare e migliorare i loro sistemi,” ha dichiarato un portavoce a WIRED.

      L'azienda ha aggiunto che non utilizza il benchmarking dei concorrenti per addestrare i propri modelli di intelligenza artificiale. Covalen non ha risposto a una richiesta di commento.

      Un documento interno di Covalen lo ha descritto in modo più grandioso. Ha descritto il progetto come “benchmarking completo della sicurezza dell'IA” che ha fornito “dataset critici per il confronto e la conformità dei modelli.”

      Testare il prodotto di un concorrente non è insolito di per sé. Business Insider ha riportato l'anno scorso che gli appaltatori di Bard di Google hanno confrontato le sue risposte con quelle di ChatGPT. Hanno poi riscritto le risposte di Bard per farle corrispondere o superarle. Ciò che spicca qui è la scala, il travestimento e l'argomento.

      Perché questo sembra diverso

      Un dettaglio inquieta di più gli esperti: l'uso di account travestiti da bambini. Rumman Chowdhury, amministratore delegato di Humane Intelligence, ha esaminato un campione dei suggerimenti.

      L'impostazione la preoccupava. Un lungo progetto condotto attraverso “account fittizi mascherati da bambini” si colloca “al di fuori di ciò che è solitamente descritto come valutazione ‘standard del settore’,” ha detto. L'ha definita una “zona grigia di governance in cui la sicurezza diventa una copertura conveniente per pratiche anticoncorrenziali.”

      Due avvocati specializzati nel discorso online hanno esaminato esempi per WIRED. Il materiale, hanno detto, non è passato nel sollecitare materiale di abuso sessuale infantile o oscenità illegali. Anche così, ex appaltatori hanno descritto il lavoro come allarmante. Uno ha detto che i colleghi temevano di poter generare o preservare materiale di abuso.

      Un altro si è preoccupato che il progetto equivalesse a sollevare silenziosamente dati dai concorrenti per reinserirli nei sistemi di Meta.

      I concorrenti non sono felici

      Le tre aziende target vietano tutte questo tipo di test nei loro termini di servizio. OpenAI vieta test di sicurezza non richiesti, tentativi di eludere le misure di sicurezza e l'uso di output per costruire modelli concorrenti. Google vieta sforzi per aggirare i suoi filtri di sicurezza. Character.AI vieta contenuti dannosi, sfruttatori e illegali. Dalla fine del 2025, ha chiuso completamente le chat aperte per utenti sotto i 18 anni.

      Nessuno di loro ha autorizzato il lavoro. Un portavoce di Character.AI ha dichiarato che la condotta violava “i nostri Termini di Servizio” e “i personaggi e i mondi che la nostra comunità ha creato.” OpenAI ha detto che stava esaminando la questione ma ha rifiutato ulteriori commenti. Google ha detto di non aver approvato il test e di non sapere il suo scopo. I propri controlli, ha aggiunto, hanno mostrato che Gemini rispondeva in linea con le proprie politiche.

      Una lotta con i regolatori già in osservazione

      Il tempismo non potrebbe essere peggiore. A settembre 2025, la Federal Trade Commission degli Stati Uniti ha aperto un'inchiesta formale su IA e sicurezza infantile. Copre Meta, OpenAI e Google, tra gli altri. Ora un rapporto mostra una di quelle aziende che indaga sulle altre con account fittizi per bambini.

      L'Europa ha le proprie leve. L'AI Act e il Digital Services Act premiano entrambi le piattaforme sui rischi che i loro sistemi pongono ai minorenni. Entrambi possono raggiungere qualsiasi azienda che opera nel blocco. I regolatori su entrambi i lati dell'Atlantico ora pongono la stessa domanda: chi è responsabile quando un chatbot parla a un bambino di autolesionismo? La supervisione sta rapidamente diventando un mercato a sé stante, con denaro di venture che fluisce in startup di sicurezza agentiche.

      L'episodio si inserisce anche in un modello più ampio. Meta custodisce gelosamente le proprie ambizioni in materia di IA. Ha persino limitato l'uso da parte dei propri ingegneri degli strumenti di codifica dei concorrenti mentre costruisce i propri. Nel frattempo, i produttori di chatbot combattono una costosa corsa per utenti e credibilità. Anthropic e OpenAI inseguono entrambi clienti paganti. OpenAI è entrata nella pubblicità. Google lotta per mantenere la propria dominanza intatta nell'era dell'IA. In quella competizione, il test di sicurezza e l'intelligenza competitiva possono iniziare a confondersi.

      Entrambi i punti di vista non possono essere veri

      Quella confusione è la vera storia. Meta afferma di aver reso i chatbot più sicuri. I suoi critici dicono che ha travestito gli appaltatori da bambini per estrarre informazioni dai suoi concorrenti, poi ha mascherato il tutto come un esercizio di sicurezza. I documenti sono emersi, e i regolatori stanno circondando. Meta dovrà ora convincerli su quale versione sia corretta.

      Se tu o qualcuno che conosci sta lottando, è disponibile supporto. Nel Regno Unito e in Irlanda, i Samaritani possono essere contattati gratuitamente al 116 123. Negli Stati Uniti, la 988 Suicide and Crisis Lifeline offre supporto 24 ore su 24. Un elenco di linee di emergenza internazionali è disponibile attraverso l'International Association for Suicide Prevention.

Altri articoli

I browser AI come Perplexity Comet possono essere ingannati per rivelare la tua password attraverso l'exploit BioShocking. Un nuovo exploit chiamato BioShocking convince i browser AI che stanno giocando a un gioco, poi li costringe a consegnare i tuoi dati privati.

La startup di coding AI di Chamath 8090 raccoglie 135 milioni di dollari Chamath Palihapitiya ha raccolto 135 milioni di dollari guidati da Salesforce per 8090, la sua startup di codifica AI, e sta assumendo il ruolo di CEO per la prima volta da Facebook.

La Corte Suprema esaminerà l'appello di Apple riguardo alla sentenza di disprezzo dell'App Store nel caso Epic. La Corte Suprema ha accettato di esaminare le sentenze dei tribunali inferiori che hanno stabilito che Apple ha sfidato volontariamente un'ordinanza del 2021 sulle commissioni dell'App Store nella sua battaglia con Epic Games.

Clicks mostra il suo telefono Communicator ispirato a BlackBerry in un nuovo video pratico Il Clicks Communicator da $499 ha una tastiera fisica, una Luce di Segnale per notifiche filtrate e sarà disponibile nel Q4. Un nuovo video mostra l'hardware da vicino.

Blue Origin non sa ancora perché New Glenn sia esploso, ma prevede di volare di nuovo quest'anno. Il CEO di Blue Origin, Dave Limp, afferma che la causa principale dell'esplosione di maggio rimane sconosciuta, con le prime analisi che indicano la sezione posteriore del primo stadio.

Il rilascio senza disco per GTA 6 potrebbe nascondere un problema più profondo e questo mi rende un po' ansioso. Il rilascio mancante del disco di GTA 6 è frustrante per i videogiocatori, ma la spiegazione più convincente potrebbe essere che Rockstar sta ancora lavorando per completare il gioco.

Meta si è spacciata per adolescenti per testare chatbot AI rivali

Centinaia di appaltatori su un progetto di Meta si sono spacciati per adolescenti per testare come ChatGPT, Gemini e Character.AI gestiscono il suicidio, le droghe e il sesso, ha scoperto WIRED.