
Wikipedia: Il Gigante dei Saperi Sfidato dalle Intelligenze Artificiali!
2025-04-02
Autore: Chiara
Negli ultimi tre mesi, l'utilizzo di Wikipedia, la famosa enciclopedia online collaborativa, ha visto un incremento allarmante del 50%. Tuttavia, questa notizia non è affatto positiva. Il colpevole di questo aumento è stato identificato nei crawler utilizzati dalle aziende che sviluppano intelligenza artificiale, programmi automatizzati che attingono a immagini, video, articoli e file vari con licenza aperta per addestrare i loro modelli di IA generativa.
Questa non è la prima volta che Wikipedia deve affrontare problematiche legate all'IA generativa. Un esempio evidente è stato il picco di traffico avvenuto dopo la morte dell'ex presidente Jimmy Carter, quando molti utenti si sono recati sull'enciclopedia alla ricerca di dibattiti storici. Questo ha causato dei rallentamenti e incertezze nel caricamento delle pagine, un’esperienza frustrante per numerosi lettori.
Wikipedia ha implementato vari strumenti per resistere a picchi di traffico durante eventi significativi, ma l'aggiunta del traffico artificiale generato dai crawler ha reso la situazione insostenibile. Il risultato è che le infrastrutture del sito sono costantemente sotto pressione.
Il comunicato della fondazione evidenzia: "Il volume di traffico generato dai bot di scraping è senza precedenti e presenta rischi e costi crescenti." Ciò è dovuto a circostanze tecniche legate al funzionamento della cache. Quando i crawler delle aziende, come OpenAI, interagiscono con Wikipedia, i loro richieste generano costi molto più elevati rispetto a quelli degli utenti normali. Questo perché il sistema ottimizza la consegna delle pagine più popolari tramite server più vicini all'utente, riducendo i tempi di caricamento e il consumo di risorse. Quando invece viene richiesta una voce meno consultata, il sistema deve attingere a dati da data center centrali, aumentando notevolmente il carico e i costi.
A causa di questa situazione, la Wikimedia Foundation ha stimato che circa il 65% del traffico che consuma risorse considerevoli è generato da questi crawler e bot. Di fronte a questa crescente problematica, la fondazione ha annunciato che si prenderà del tempo per discutere nuove misure che consentano agli sviluppatori di accedere ai suoi contenuti contribuendo tuttavia alla sostenibilità del progetto, introducendo limiti e tariffe che saranno comunicati entro la fine dell'anno.
In conclusione, "I nostri contenuti sono gratuiti, la nostra infrastruttura no", ha ribadito la fondazione, lanciando un appello per un uso più responsabile e consapevole delle risorse di Wikipedia da parte delle aziende tecnologiche.