Il Nyt fa causa a OpenAi e Microsoft sul copyright: copiati milioni di nostri articoli per “addestrare” l’IA
L’accusa è stringente e mossa in punta di codice (anche deontologico), con venature di polemica tutt’altro che virtuale. Così, il New York Times ha fatto causa a OpenAI e Microsoft per violazione del copyright, accusando le società di intelligenza artificiale di avere copiato illegalmente milioni di articoli del quotidiano americano per “addestrare” ChatGPT ed altri servizi a fornire articoli e informazioni con una tecnologia che ora compete con il Times. Insomma, le società tech avrebbero attinto a piene mani a contenuti giornalistici, copiando a man bassa per rendere competitiva l’IA.
Media e IA, il New York Times fa causa a OpenAi e Microsoft per violazione del copyright
Come ricorda la Cnn e rilancia l’Adnkronos, allora, il ricorso del giornale è l’ultima di una serie di azioni legali avviate per limitare il recupero di grandi quantitativi di contenuti su Internet, senza nessuna forma di compenso, presi per addestrare i modelli di linguaggio artificiale. Attori, scrittori, giornalisti ed altri “creativi” che hanno messo il loro lavoro online temono infatti che l’Ai possa apprendere dai loro contenuti. E poi provvedere a dei “chatbot” alternativi ed altre fonti di informazione, senza alcuna forma di compensazione.
L’accusa: hanno sfruttato gratuitamente «il massiccio investimento del Times sul suo giornalismo»
Ma la causa del Times è la prima di una grande testata contro OpenAI e Microsoft, i brand principali di Ai che vengono accusati di «utilizzo illegale del lavoro del Times per creare prodotti di intelligenza artificiale che minacciano la capacità della testata di offrire i propri servizi». Insomma, le due società vengono accusate di avere sfruttato in maniera gratuita «il massiccio investimento del Times sul suo giornalismo e di usarlo per costruire prodotti sostituitivi senza permesso né pagamento».
Giornalismo e IA, la causa dopo i tentativi falliti per negoziare un accordo
«Per mesi, il Times ha cercato di negoziare un accordo, ma i negoziati non hanno condotto ad una risoluzione», si legge nel ricorso della testata d’oltreoceano. Portavoce di OpenAI e Microsoft non hanno ancora risposto ad una richiesta di commento, scrive sulla vicenda il Washington Post. I cosiddetti modelli linguistici di grandi dimensioni (LLMs) che sono dietro agli strumenti di Ai come ChatGPT funzionano ingerendo un’enorme quantità di testi recuperati da Internet. Apprendendo in questo modo le connessioni tra parole e concetti. E quindi sviluppando la capacità di predire quale parola dire nella frase successiva, riuscendo così ad imitare il linguaggio e la scrittura umana.
La replica delle società coinvolte nel ricorso
OpenAi, Microsoft e Google si sono rifiutati di rivelare quello che viene inserito nei modelli più nuovi. Ma i precedenti LLMs hanno compreso enormi quantitativi di contenuti dei media e cataloghi di libri. Di contro, le società tech hanno replicato sostenendo che l’uso delle informazioni estratte da Internet per addestrare gli algoritmi di Ai rientra nell’ambito del “giusto uso”: un concetto che per la legge del copyright permette alle persone di usare il lavoro di altri se viene modificato in modo sostanziale. Nel ricorso del Times, però, sono elencati diversi esempi di modelli Gpt-4 Ai di OpenAi in cui compaiono articoli del Times copiati parola per parola.
I media e la difesa con sistemi di blocco per impedire alle società di AI di “rubare” i loro articoli
Dallo scorso agosto sono almeno 538 i media, compresi New York Times, Washington Post e Reuters, che hanno installato dei sistemi di blocco ai loro siti per impedire alle società di Ai di “rubare” i loro articoli. Intanto, OpenAI ha negoziato accordi con le organizzazioni dei media nell’ultimo anno per poter pagare i loro contenuti. A luglio, ha firmato un accordo con l’Associated Press per aver accesso ai suoi articoli. Ma lo scorso ottobre un portavoce della società ha detto che le precedenti pratiche non violavano le leggi del copyright. E che il nuovo accordo fatto riguardava solo i contenuti che non sono reperibili online. La partita, insomma, è tutt’altro che conclusa…