400 giornali fanno causa a OpenAI e Microsoft per l'IA
Una coalizione che possiede quasi 400 giornali locali statunitensi ha citato in giudizio OpenAI e Microsoft. Gli editori definiscono l'addestramento dell'IA sui loro reportage un colpo mortale per il giornalismo locale. È il più grande caso di copyright che la stampa locale abbia mai portato avanti.
I giornali locali riportano le riunioni a cui nessun algoritmo partecipa. Il voto del consiglio, la controversia del consiglio scolastico, l'epigrafe, il nuovo ristorante in centro. Ora le persone che possiedono quasi 400 di quei giornali vogliono che un tribunale decida una cosa. Quanto vale quel reportage per un'azienda di IA?
La sera del 24 giugno, una coalizione nazionale di editori ha citato in giudizio OpenAI e Microsoft. Il caso è approdato al tribunale federale di Manhattan. Il reclamo di 55 pagine è diretto. Affermano che le due aziende hanno copiato centinaia di migliaia di articoli per costruire ChatGPT e Microsoft Copilot. Non hanno chiesto alcun permesso e non hanno pagato nulla.
Il caso è stato dettagliato per la prima volta da Courthouse News. È guidato da Richner Communications, un editore di Long Island. L'avvocato degli editori è Matthew Platkin, che ha ricoperto il ruolo di procuratore generale del New Jersey dal 2022 al 2026. Ora gestisce il proprio studio legale. Gli editori portano tre capi di accusa per violazione del copyright. Vogliono danni legali, danni effettivi, restituzione dei profitti e spese legali.
Il più grande caso di stampa locale finora
Il numero principale è la scala: quasi 400 titoli in un'unica denuncia. Il cambiamento più importante è quale parte della stampa si trova ora in tribunale. Le testate nazionali e gli autori di bestseller hanno citato in giudizio OpenAI molto tempo fa. Questa è la prima volta che i giornali locali e regionali si muovono insieme a questa scala. Questi sono i titoli con finanziamenti esigui che coprono tribunali e consigli.
I querelanti nominati sembrano un tour dell'America regionale. Includono l'Arkansas Democrat-Gazette, il New York Amsterdam News, i Newspapers of New England, la catena Ogden Newspapers e i Straus Newspapers. Le loro intestazioni arrivano a centinaia.
Cosa sostengono gli editori
La meccanica è importante qui. Il reclamo afferma che OpenAI e Microsoft hanno "crawled" sistematicamente e segretamente centinaia di siti di notizie, comprese le pagine dietro paywall. Dicono di aver copiato gli articoli sui propri server. Poi hanno rimosso le informazioni sulla gestione del copyright: nomi degli autori, nomi delle pubblicazioni, termini di utilizzo e avvisi di copyright.
Quella rimozione è al centro di una seconda accusa. Gli editori definiscono la rimozione "una parte strumentale del pipeline di ingestione dei convenuti", sostenendo che ha separato ogni articolo dal suo proprietario. Dicono che il testo ripulito ha poi addestrato modelli di linguaggio di grandi dimensioni. Quei modelli hanno "memorizzato" il lavoro, afferma la causa, e lo hanno riprodotto parola per parola nelle risposte agli utenti.
Rimuovere quei dati di proprietà è di per sé illegale, sostengono gli editori, ai sensi del Digital Millennium Copyright Act. Secondo il New Jersey Globe, il reclamo cita anche la testimonianza di Sam Altman alla Camera dei Lords britannica. Lì, il capo di OpenAI ha detto che sarebbe "impossibile" addestrare i modelli leader di oggi senza materiale protetto da copyright.
Perché le notizie locali sono il test più severo
Platkin ha inquadrato il caso attorno a ciò che l'IA non può fare. "I sistemi di IA non valutano criticamente le riunioni del consiglio comunale e della comunità," ha detto. "Non indagano su crimini e corruzione locali, non pubblicano necrologi o coprono l'apertura del nuovo ristorante in centro. I reporter locali lo fanno."
L'economia sostiene l'argomento. I giornali locali operano con budget esigui e redazioni in riduzione. Il reclamo definisce l'uso non autorizzato un "colpo mortale" per un'industria che classifica tra le più fidate in America. L'affermazione non è solo che la copia sia avvenuta. È che il danno colpisce più duramente le testate meno in grado di assorbirlo.
Un modello che OpenAI continua a incontrare in tribunale
OpenAI è già stata qui. L'Encyclopaedia Britannica e la sua unità Merriam-Webster hanno citato in giudizio l'azienda all'inizio di quest'anno per "copiazione massiccia" dei loro contenuti, e il caso del New York Times continua. I giornali si uniscono anche a un fronte in espansione di titolari di diritti, da autori a attori che costruiscono strumenti per impedire all'IA di utilizzare il loro lavoro. Alcuni hanno scelto l'altra strada, con Getty Images che ha raggiunto un accordo piuttosto che combattere.
Microsoft è nominata insieme a OpenAI per un motivo. Il reclamo la definisce "un partner indispensabile in praticamente ogni aspetto dell'impresa commerciale di OpenAI." Quella relazione è iniziata con un investimento di 1 miliardo di dollari nel 2019 e ha rimodellato entrambe le aziende. Nessuna delle due ha risposto alle richieste di commento quando è stata presentata la causa.
OpenAI ha a lungo sostenuto che l'addestramento su testi pubblici conta come uso leale, una difesa che sta portando in ognuno di questi casi. Gli editori scommettono che il segreto e le intestazioni rimosse lo indeboliscano. Vogliono che una giuria veda il crawling dietro paywall come furto, non come ricerca.
Nel frattempo, OpenAI si dirige verso una valutazione di 852 miliardi di dollari, denaro raccolto sulla promessa che i suoi modelli possono rispondere a quasi tutto. Questo caso pone una domanda più ristretta. Se quelle risposte sono state costruite su reportage per cui nessuno ha pagato, chi possiede il conto? Un giudice di Manhattan, non una roadmap di prodotto, lo deciderà.
Altri articoli
400 giornali fanno causa a OpenAI e Microsoft per l'IA
Quasi 400 giornali locali statunitensi stanno facendo causa a OpenAI e Microsoft, sostenendo che i loro articoli sono stati copiati per addestrare ChatGPT e Copilot senza compenso.
