Tre noti canali YouTube hanno intentato una causa federale in California contro Apple, accusando la compagnia di aver eluso le protezioni di YouTube per scaricare milioni di video protetti da copyright. L'obiettivo sarebbe stato quello di addestrare i propri modelli di Intelligenza Artificiale (IA), violando così il "Digital Millennium Copyright Act" (DMCA) degli Stati Uniti.
Nella class action, i proprietari dei canali YouTube h3h3Productions (compresi H3 Podcast e H3 Podcast Highlights), MrShortGame Golf e Golfholics, accusano Apple di aver "intenzionalmente aggirato" le misure di protezione di YouTube contro la raccolta di contenuti video e di aver "ottenuto profitti significativi" da tale attività. Gli accusatori fanno riferimento a una ricerca di Apple intitolata STIV: Scalable Text and Image Conditioned Video Generation, sostenendo che sia stato utilizzato il dataset Panda-70M per addestrare il modello di generazione video descritto nell'articolo.
Il dataset Panda 70M funziona come una mappa o un file indice, identificando specifici video e clip di YouTube tramite URL, ID video e timestamp. Gli accusatori sostengono che, sebbene il dataset contenga solo collegamenti ai video, Apple avrebbe aggirato le protezioni di YouTube contro la raccolta di dati per scaricare e utilizzare il contenuto originale per l'addestramento dei suoi modelli di IA. Avrebbero individuato circa 500 utilizzi non autorizzati dei loro contenuti in questo dataset, invitando altri canali YouTube i cui clip sono stati utilizzati illegalmente da Apple ad unirsi alla causa.
I querelanti richiedono che la causa sia classificata come una class action e che venga giudicata da una giuria. Inoltre, chiedono un risarcimento per i danni legali (entro l'importo massimo consentito dalla legge per ogni violazione), un'ingiunzione restrittiva, nonché il pagamento delle spese legali e delle spese processuali, in conformità con l'articolo 1203 del titolo 17 dello United States Code.
Oltre ad Apple, i querelanti hanno intentato class action anche contro Amazon e OpenAI, accusandole di aver utilizzato il dataset Panda-70M nel processo di addestramento dei loro modelli di IA. Negli ultimi tre mesi, questi canali YouTube hanno presentato azioni legali simili contro altri colossi tecnologici, tra cui Meta, Nvidia, ByteDance e Snap. Questo solleva interrogativi significativi sulle pratiche di acquisizione dati e sull'utilizzo di materiale protetto da copyright nell'ambito dello sviluppo dell'intelligenza artificiale. Le implicazioni legali e le potenziali conseguenze per le aziende tecnologiche potrebbero essere considerevoli, aprendo un dibattito cruciale sul rispetto dei diritti d'autore nell'era dell'IA.
La questione solleva un dibattito più ampio sull'etica e la legalità dell'utilizzo di dati protetti da copyright per l'addestramento di modelli di IA. Mentre le aziende tecnologiche sostengono spesso che tale utilizzo rientra nel fair use o in eccezioni simili, i creatori di contenuti e i titolari dei diritti d'autore sono sempre più preoccupati per la perdita di controllo e di compensazione per l'uso delle loro opere. Questo caso potrebbe stabilire importanti precedenti legali e influenzare le future pratiche di sviluppo dell'IA.
Inoltre, la crescente frequenza di queste cause legali suggerisce una crescente consapevolezza e determinazione da parte dei creatori di contenuti a proteggere i propri diritti e a richiedere un compenso equo per l'utilizzo delle loro opere nell'ambito dell'IA. Il risultato di queste battaglie legali potrebbe ridefinire il panorama dell'industria tecnologica e del diritto d'autore.

