Wikipedia, la famosa enciclopedia online gestita dalla Wikimedia Foundation, sta vivendo un'esplosione del traffico con un incremento del 50% rispetto all'anno precedente. A sorprendere non è tanto un maggiore numero di utenti che consulta le voci, quanto l'enorme crescita dovuta all'uso sempre più diffuso dell'intelligenza artificiale generativa.
L'aumento del traffico riguarda principalmente il download di contenuti multimediali come immagini e video, che vengono estratti automaticamente dai siti web dai cosiddetti "crawler". Questi programmi, infatti, vengono impiegati per raccogliere informazioni utili all'addestramento dei modelli di AI.
Sebbene Wikipedia ospiti contenuti senza copyright e l'uso di crawler sia legittimo, la situazione sta creando notevoli difficoltà per l'infrastruttura dell'enciclopedia. La Wikimedia Foundation ha dichiarato che la sua rete di server è stata progettata per affrontare picchi di traffico legati a eventi particolarmente seguiti, ma l'innalzamento delle richieste da parte dei bot è una novità che sta comportando un aumento dei costi e dei rischi legati al suo mantenimento.
Ulteriori aspetti evidenziati da Wikimedia Foundation
I crawler non si limitano a visitare solo le voci più richieste, ma attingono a un ampio spettro di articoli, comprese le pagine meno popolari contenenti immagini e video. Questo comportamento genera una pressione significativa sulla rete di data center che supporta Wikipedia, costringendo la fondazione a mantenere una quantità sempre maggiore di contenuti disponibili, con costi operativi in aumento.
Un altro aspetto fondamentale evidenziato dalla Wikimedia Foundation è la necessità di attribuire correttamente la fonte dei contenuti. L'obiettivo è stimolare la partecipazione degli utenti e incoraggiare la crescita della piattaforma, ma la gestione di un'infrastruttura così complessa ha un impatto economico che non può essere ignorato. La fondazione ha precisato che, mentre i contenuti sono gratuiti, la gestione della rete e dei server richiede risorse finanziarie.
Tra le soluzioni in esame per far fronte a questi cambiamenti ci sono la creazione di sistemi di attribuzione più severi e l'introduzione di linee guida chiare per l'uso delle risorse da parte delle intelligenze artificiali durante il loro addestramento. Il crescente utilizzo di Wikipedia da parte dei crawler AI sta dunque sollevando questioni importanti riguardo alla sostenibilità a lungo termine della piattaforma e alla gestione delle risorse necessarie per mantenerla operativa.