Apple
si trova al centro di una nuova e seria controversia legale. Gli autori
Grady Hendrix
e
Jennifer Robertson
hanno presentato una denuncia presso un tribunale federale in
California del Nord
, accusando il colosso tecnologico di aver utilizzato illegalmente un set di dati di libri piratati per addestrare le sue
intelligenze artificiali
. La controversia, come riportato dall'agenzia
Reuters
, riguarda l'uso dei modelli di linguaggio naturale che Apple ha sviluppato, in particolare attraverso l'uso di un dataset noto come
Books3
. Questo set di dati, secondo i querelanti, include le loro opere che sono protette da copyright. OpenELM, un modello reso open-source da Apple su
Hugging Face
, è al centro di questa disputa.
A ulteriore complicazione della vicenda c'è la presenza del dataset
RedPajama
, anch'esso citato come parte delle risorse utilizzate da Apple. È risaputo che RedPajama contiene opere che non hanno ottenuto le necessarie autorizzazioni per essere utilizzate. Apple, da parte sua, sostiene che regolarmente acquista licenze necessarie da editori di libri e archivi di notizie per formare i suoi modelli, intraprendendo accordi di licenza con gli editori per assicurare una giusta divisione dei profitti con gli autori. Tuttavia, Apple potrebbe non essere stata pienamente consapevole dell'origine di alcuni contenuti senza licenza e ritiene che ottenere le necessarie autorizzazioni post hoc potrebbe essere sufficiente per risolvere la questione.
Gli autori, nel formulare la loro denuncia, sperano di ottenere il riconoscimento del caso come
azione collettiva
, il che consentirebbe di rappresentare un'intera comunità di autori le cui opere potrebbero essere state sfruttate senza consenso. Le richieste legali includono una serie di rimedi, dai danni compensatori alle ingiunzioni permanenti contro l'illecito continuato. Questa causa legale emerge in un contesto già complesso, dove altri giganti tecnologici come
Meta
si sono trovati ad affrontare problemi simili. Recentemente, un giudice ha stabilito che l'uso di opere sotto copyright da parte di Meta per il training dei suoi modelli AI rientra nel
fair use
, un principio che permette riproduzioni limitate di materiale protetto da copyright senza necessità del permesso del titolare del diritto. Anche l'ex presidente
Donald Trump
ha commentato sulla questione, descrivendo come insostenibile l'idea di obbligare le aziende a pagare per ogni singolo dato utilizzato.
L'esito di questa controversa causa potrebbe avere ripercussioni di vasta portata per il futuro della gestione dei diritti d'autore nel contesto delle tecnologie AI, sollevando interrogativi su come meglio bilanciare le esigenze di innovazione tecnologica con la protezione dei diritti degli autori.
