Nvidia nega l'addestramento di AI con libri pirata

La società respinge le accuse di aver utilizzato materiale protetto da copyright per i suoi modelli di intelligenza artificiale, definendo le accuse "speculative"

Nvidia nega l'addestramento di AI con libri pirata

Nvidia ha categoricamente respinto le accuse di aver utilizzato libri piratati per addestrare i suoi modelli di intelligenza artificiale (AI). I legali dell'azienda hanno presentato una mozione presso il tribunale federale della California, affermando che i presunti contatti con la biblioteca online pirata Anna’s Archive non costituiscono una prova di violazione del copyright.

Nella mozione, depositata il 29 gennaio, Nvidia sostiene che gli autori della causa "Nazemian contro Nvidia" non sono riusciti a dimostrare in modo convincente che le loro specifiche opere siano state effettivamente scaricate o utilizzate nell'addestramento dei modelli AI di Nvidia. L'azienda contesta che l'ampliamento del reclamo da parte dei querelanti, con l'inclusione di nuove supposizioni e set di dati, sia sufficiente a provare la violazione.

La causa, avviata all'inizio del 2024 nel distretto settentrionale della California, si basa sull'affermazione che gli strumenti di intelligenza artificiale e i modelli di riferimento di Nvidia siano stati addestrati utilizzando libri protetti da copyright, ottenuti da cosiddette "biblioteche ombra", tra cui Anna’s Archive e Books3. La denuncia modificata fa riferimento a presunte discussioni interne in cui i dipendenti di Nvidia avrebbero tentato di ottenere la conferma dell'accesso ad Anna’s Archive, elemento che i querelanti considerano una prova di utilizzo illecito.

Nvidia ribatte che la denuncia modificata manca degli elementi fondamentali necessari per sostenere un'accusa di violazione del copyright. Secondo l'azienda, i querelanti non presentano fatti che dimostrino che Nvidia abbia copiato alcuna delle loro opere protette da copyright, né indicano quando tale copia sarebbe avvenuta o quali modelli di Nvidia conterrebbero presumibilmente tali opere. In assenza di questi dettagli, Nvidia definisce le accuse puramente speculative.

Affrontando direttamente le accuse relative al repository di libri pirata Anna’s Archive, Nvidia riconosce che la denuncia descrive discussioni interne e richieste di potenziale accesso al sito, ma sottolinea che non si afferma che Nvidia abbia effettivamente ottenuto o scaricato alcuna opera dei querelanti. La mozione sostiene inoltre che la discussione o la valutazione di possibili fonti di dati non equivalgono alla copia di materiale protetto da copyright e che la legge sul copyright richiede ai querelanti di presentare fatti che dimostrino la riproduzione di opere protette. "È altrettanto probabile che Nvidia non abbia [ottenuto accesso alle opere dei querelanti]", si legge nella mozione.

Nvidia critica aspramente i querelanti per essersi basati su affermazioni fatte "sulla base di voci e convinzioni". L'azienda sostiene che i querelanti stanno tentando impropriamente di utilizzare il processo di divulgazione delle informazioni come fondamento per la loro causa. Nella sua mozione, Nvidia ricorda al tribunale che i querelanti in cause per violazione del copyright devono dimostrare la violazione prima dell'inizio del processo di divulgazione delle informazioni, e non fare affidamento su di esso per determinare se la violazione si sia verificata. A parere di Nvidia, è proprio questo che i querelanti starebbero cercando di fare.

Nvidia contesta anche l'inclusione di informazioni su set di dati e modelli aggiuntivi, come Megatron 345M, aggiunti nella denuncia modificata. L'azienda afferma che i querelanti raggruppano impropriamente più modelli e strumenti in un'unica causa, senza spiegare come un particolare modello sia stato addestrato sulle loro opere. In diversi casi, Nvidia fa riferimento alla propria documentazione pubblica per dimostrare che le ipotesi dei querelanti sui dati di addestramento contraddicono le fonti pubblicamente disponibili.

La denuncia modificata avanza anche una teoria di responsabilità secondaria, legata al framework Nvidia NeMo Megatron e al suo supporto per il caricamento di grandi set di dati pubblici, come The Pile. Nvidia risponde che la causa non afferma una violazione diretta del copyright da parte di terzi, elemento necessario per sostenere accuse di complicità o violazione indiretta del copyright. L'azienda sostiene che la fornitura di strumenti opzionali non stabilisce la responsabilità in assenza di specifiche affermazioni che gli utenti abbiano violato il copyright utilizzando tali strumenti.

L'udienza sulla mozione di rigetto è fissata per il 2 aprile 2026 presso il tribunale distrettuale degli Stati Uniti per il distretto settentrionale della California.

Pubblicato Lunedì, 09 Febbraio 2026 a cura di Anna S. per Infogioco.it

Ultima revisione: Lunedì, 09 Febbraio 2026

Anna S.

Anna S.

Anna è una giornalista dinamica e carismatica, con una passione travolgente per il mondo dell'informatica e le innovazioni tecnologiche. Fin da giovane, ha sempre nutrito una curiosità insaziabile per come la tecnologia possa trasformare le vite delle persone. La sua carriera è caratterizzata da un costante impegno nell'esplorare le ultime novità in campo tecnologico e nel raccontare storie che ispirano e informano il pubblico.


Consulta tutti gli articoli di Anna S.

Footer
Articoli correlati
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
Infogioco.it - Sconti