ArXiv introduce un divieto di un anno per i ricercatori che presentano articoli con contenuti generati da intelligenza artificiale non verificati.
TL;DRArXiv bandirà i ricercatori per un anno se presenteranno articoli con evidenti segni di generazione AI non controllata, come riferimenti illusori o istruzioni residue del chatbot. La politica, annunciata dal presidente della sezione di informatica Thomas Dietterich, è la prima sanzione formale da parte di una grande piattaforma di preprint per contenuti generati dall'AI.
ArXiv, il repository ad accesso aperto che ha servito come principale canale di distribuzione per la ricerca preprint in informatica, matematica e fisica per più di tre decenni, bandirà gli autori per un anno se presenteranno articoli contenenti evidenti segni di generazione AI non controllata. Thomas Dietterich, presidente della sezione di informatica di arXiv, ha annunciato la politica giovedì, scrivendo che le sottomissioni con "prove incontrovertibili" di output di modelli linguistici non verificati significano "non possiamo fidarci di nulla nell'articolo."
La regola non è un divieto generale sull'uso degli strumenti AI. I ricercatori possono comunque utilizzare modelli linguistici per redigere, modificare o analizzare. Ciò che innesca la sanzione è la prova che un autore ha incollato l'output di un LLM in un articolo senza controllarlo, il tipo di negligenza che produce riferimenti illusori, istruzioni segnaposto dal chatbot o tabelle di dati fabricate con note che dicono "riempi con i numeri reali dei tuoi esperimenti." Se i moderatori trovano tali prove e un presidente di sezione le conferma, l'autore affronta un divieto di un anno da arXiv, dopo il quale tutte le sottomissioni successive devono prima essere accettate da una rivista peer-reviewed prima di poter apparire sulla piattaforma.
Perché è importante
ArXiv non è una rivista. Non sottopone a revisione paritaria gli articoli. Ma è diventato il modo de facto in cui la ricerca circola in diversi dei campi più dinamici della scienza, in particolare l'apprendimento automatico e l'intelligenza artificiale. Gli articoli pubblicati su arXiv vengono letti, citati e utilizzati come base per ulteriori ricerche molto prima di apparire in pubblicazioni formali, se mai lo fanno. Ciò rende gli standard di qualità della piattaforma particolarmente significativi: una citazione illusoria su arXiv può propagarsi attraverso la letteratura di ricerca altrettanto efficacemente quanto una in una rivista peer-reviewed, e spesso più rapidamente.
La scala del problema è significativa. Uno studio pubblicato su The Lancet nel maggio 2026 da ricercatori della Columbia University ha esaminato 2,5 milioni di articoli biomedici e 126 milioni di riferimenti indicizzati su PubMed Central. Ha scoperto che le citazioni fabricate sono aumentate di dodici volte dal 2023. In quell'anno, circa uno su 2.828 articoli conteneva almeno un riferimento falso. Entro il 2025, il tasso era salito a uno su 458. Nelle prime sette settimane del 2026, era uno su 277. I ricercatori hanno attribuito l'aumento alla proliferazione degli strumenti di scrittura AI, notando che studi precedenti stimano che il 30-69% dei riferimenti generati da LLM in contesti biomedici siano fabbricati.
ArXiv ha motivo di prendere sul serio la minaccia. La piattaforma riceve migliaia di sottomissioni ogni mese e il suo sistema di moderazione volontaria non è stato progettato per filtrare contenuti generati da macchine su larga scala. L'annuncio di Dietterich ha descritto la nuova sanzione come una regola "a un colpo", sebbene le decisioni siano soggette a ricorso e richiedano conferma da parte di un presidente di sezione prima di essere imposte.
Cosa conta come prova
La politica è deliberatamente ristretta in ciò che mira. Dietterich ha elencato esempi specifici di "prove incontrovertibili": riferimenti illusori che non corrispondono a nessuna pubblicazione reale, meta-commenti dal modello linguistico lasciati nel testo (come "ecco un riassunto di 200 parole; vuoi che apporti modifiche?"), e dati segnaposto con istruzioni all'autore che non sono mai stati rimossi. Questi non sono fallimenti di qualità sottili. Sono segni che l'autore non ha letto l'articolo prima di presentarlo.
La distinzione è importante perché evita la questione molto più difficile se la scrittura assistita dall'AI dovrebbe essere consentita. La politica esistente di arXiv afferma già che gli autori sono "pienamente responsabili" per il loro contenuto "indipendentemente da come vengono generati i contenuti." La nuova sanzione applica quel principio mirando alle violazioni più eclatanti, casi in cui il fallimento dell'autore di esercitare qualsiasi supervisione è dimostrabile dal testo stesso.
Questo approccio ha vantaggi pratici. Rilevare se un articolo ben editato è stato redatto con l'aiuto di un LLM è inaffidabile con gli attuali strumenti di rilevamento, e tentare di applicare un divieto più ampio sarebbe sia tecnicamente difficile che potenzialmente punitivo nei confronti dei ricercatori che utilizzano strumenti AI in modo responsabile. Concentrandosi su evidenti errori, arXiv può applicare la regola senza dover costruire o acquistare un sistema di rilevamento AI, una tecnologia che rimane soggetta ai propri errori.
Un problema più ampio
ArXiv non è l'unica istituzione a lottare con il problema. Le conferenze accademiche in informatica, tra cui NeurIPS e ICML, hanno segnalato un aumento delle sottomissioni che sembrano essere generate con una supervisione umana minima. Nature ha pubblicato un articolo alla fine del 2025 che descrive come l'AI stia creando una crisi nell'informatica, dove il volume di sottomissioni di bassa qualità sta sopraffacendo i revisori e diluendo il rapporto segnale-rumore dell'output del campo.
Le riviste peer-reviewed affrontano lo stesso problema. Lo studio de The Lancet ha trovato che le citazioni fabricate apparivano in articoli che avevano già superato la revisione paritaria, suggerendo che i revisori o non controllano i riferimenti o non sono in grado di identificare le fabbricazioni al ritmo in cui stanno ora apparendo. L'autore principale Maxim Topaz, della Scuola di Infermieristica della Columbia University, ha avvertito che i clinici e gli sviluppatori di linee guida non hanno modo di sapere quando le prove su cui si basano non esistono, un divario che gli sforzi per ridurre le allucinazioni AI nella ricerca scientifica non hanno ancora colmato.
ArXiv stesso sta subendo cambiamenti strutturali che potrebbero aiutarlo ad affrontare la sfida. Dopo più di 20 anni come progetto ospitato dalla Cornell University, la piattaforma sta diventando un'organizzazione no-profit indipendente, un passo che dovrebbe darle maggiore autonomia sulle sue politiche di moderazione e la capacità di raccogliere fondi specificamente per combattere i problemi di qualità. Ha anche introdotto un requisito per i nuovi sottomittenti di ottenere un'approvazione da un autore affermato, una misura di gatekeeping mirata a ridurre il volume di sottomissioni da account creati esclusivamente per pubblicare materiale generato dall'AI.
I limiti dell'applicazione
La nuova regola catturerà i trasgressori più negligenti, i ricercatori che presentano articoli che non hanno letto. Non catturerà i ricercatori che utilizzano modelli linguistici per generare affermazioni plausibili ma errate, fabbricare dati o produrre articoli che sono fluenti ma scientificamente vuoti. Questi problemi richiedono revisione paritaria, supervisione istituzionale e una volontà all'interno della comunità di ricerca di trattare la cattiva condotta assistita dall'AI con la stessa serietà delle forme tradizionali di fabbricazione.
Ciò che la politica di arXiv stabilisce è un principio: se presenti un articolo, sei responsabile di ogni parola in esso. Questo è sempre stato vero in teoria. La differenza ora è che i modelli linguistici hanno reso triviale produrre testi che sembrano scientifici ma non contengono nulla di sostanza. Il divieto di un anno di arXiv è una sanzione modesta per un reato serio, ma è anche il primo riconoscimento formale da parte di una grande piattaforma di ricerca che il problema non è più solo di negligenza occasionale. È strutturale, sta crescendo e richiede un'infrastrutt
Altri articoli
ArXiv introduce un divieto di un anno per i ricercatori che presentano articoli con contenuti generati da intelligenza artificiale non verificati.
La piattaforma di preprint penalizzerà gli autori i cui articoli contengono riferimenti allucinati o istruzioni residue di LLM. Uno studio del Lancet ha trovato che le citazioni fabricate negli articoli biomedici sono aumentate di dodici volte dal 2023.
