Jimmy Wales, co-fondatore di Wikipedia, ha annunciato piani ambiziosi per il futuro dell'enciclopedia online: stringere accordi di licenza con le grandi aziende tecnologiche che utilizzano i contenuti di Wikipedia per addestrare i loro modelli di intelligenza artificiale (IA). Questa mossa strategica mira a compensare i crescenti costi operativi derivanti dallo scraping massiccio dei dati da parte dei bot IA. L'annuncio è stato fatto durante il Reuters Next Summit a New York.
Wales ha sottolineato come l'uso intensivo dei contenuti di Wikipedia da parte delle aziende tech per alimentare i loro modelli linguistici di grandi dimensioni stia gravando pesantemente sulle risorse dell'organizzazione non profit che gestisce il sito. "I bot IA che scansionano Wikipedia elaborano l'intero sito", ha spiegato Wales. "Questo significa che abbiamo bisogno di più server, più RAM e più memoria per la cache, e tutto ciò comporta costi sproporzionati".
Nonostante questa svolta, Wales ha tenuto a precisare che i contenuti di Wikipedia rimarranno gratuiti per i singoli utenti, in linea con la filosofia open source che da sempre caratterizza l'enciclopedia. Tuttavia, l'accesso automatizzato a fini commerciali è una questione diversa. A tal proposito, è già stato siglato un accordo con Alphabet, la società madre di Google, e sono in corso trattative con altre aziende del settore. Nel 2022, la Wikimedia Foundation, l'organizzazione non profit che supervisiona Wikipedia, ha stretto un accordo con Google in base al quale quest'ultima si impegna a pagare per l'accesso ai contenuti di Wikipedia utilizzati per l'addestramento dei modelli IA.
Wales ha ricordato che la principale fonte di finanziamento di Wikipedia sono le piccole donazioni del pubblico, fondi che non sono destinati a sovvenzionare lo sviluppo di prodotti IA commerciali multimiliardari. "Le persone donano denaro per sostenere Wikipedia, non per sussidiare OpenAI, il che ci costa un'enormità. È ingiusto", ha affermato.
In risposta a queste sfide finanziarie, Wikipedia sta valutando anche l'implementazione di misure tecniche, come il controllo dell'accesso ai contenuti basato sull'IA offerto da Cloudflare, che consente ai clienti di limitare i bot IA che scansionano il web. Tuttavia, Wales ha riconosciuto che questa opzione potrebbe creare un dilemma, data la storica adesione di Wikipedia all'accesso aperto alla conoscenza. In precedenza, Wikipedia aveva rilasciato un set di dati specifico per l'addestramento dell'IA, nel tentativo di ridurre il carico sui propri server causato dallo scraping indiscriminato.
La decisione di Wikipedia segna un punto di svolta nel rapporto tra i contenuti open source e l'industria dell'intelligenza artificiale. Mentre l'IA continua a svilupparsi a un ritmo vertiginoso, diventa sempre più cruciale trovare modelli di finanziamento sostenibili che consentano di bilanciare l'accesso aperto alla conoscenza con la necessità di compensare i costi operativi e garantire la qualità dei contenuti. Resta da vedere come si evolveranno questi accordi e quale impatto avranno sul futuro di Wikipedia e sull'ecosistema dell'IA nel suo complesso. L'iniziativa di Wikipedia potrebbe fare da apripista per altre piattaforme open source, aprendo un nuovo capitolo nella gestione dei diritti d'autore e nella monetizzazione dei dati nell'era dell'intelligenza artificiale.
Prima di procedere


