Finanse

Wikipedia na krawędzi przepaści! Boty AI mogą zablokować dostęp do darmowej wiedzy!

2025-04-05

Autor: Agnieszka

W ostatnich latach zasoby Wikipedii i powiązanych projektów zaczęły być szeroko wykorzystywane przez komercyjne firmy oraz w środowiskach akademickich. Jednak według najnowszych informacji, od początku 2024 roku, wzrost zapotrzebowania na dane do modeli sztucznej inteligencji przyczynił się do masowego pobierania treści z Wikipedii przez różne boty AI. Proces ten przebiega w różnorodny sposób — od standardowego indeksowania stron po hurtowe pobieranie całych baz danych.

Zdaniem przedstawicieli Wikimedia, takie tłumy botów generują ogromne koszty techniczne i finansowe, przybrano na to uwagę, że organizacja nie otrzymuje wystarczającego wsparcia finansowego ani rzetelnego przypisania autorstwa. Ich działania stają się problemem, z którym walka jest coraz trudniejsza.

Drastyczny wzrost ruchu botów wzbudza niepokój, zwłaszcza w obliczu zdarzeń, takich jak śmierć byłego prezydenta USA Jimmy'ego Cartera w grudniu 2024 roku. Wówczas artykuł o nim odnotował rekordową liczbę odsłon, a równolegle miliony użytkowników próbowały obejrzeć 1,5-godzinną debatę z 1980 roku, co doprowadziło do znacznego obciążenia serwerów.

Wikimedia przypomina, że boty stanowią obecnie 65% najbardziej wymagających zapytań, choć generują tylko 35% całkowitej liczby wizyt. Takie działanie przeciąża infrastrukturę oraz często ignoruje zasady zapisane w plikach robots.txt, co dodatkowo utrudnia współpracę z wirtualnymi gośćmi.

To odciąga uwagę zespołu odpowiedzialnego za zapewnienie niezawodności strony, a ich wysiłki w walce z niepożądanym ruchem stają się problematyczne. Wprowadzenie bardziej zaawansowanych rozwiązań takich jak proof-of-work czy taperity, mające na celu spowolnienie reakcji botów, może być jednym z rozwiązań problemu, ale nie eliminuje go całkowicie.

Jednym z podejmowanych działań jest tworzenie dedykowanych API oraz luźniejsze zasady dotyczące pobierania danych. Jednocześnie programiści zaczynają współpracować z firmami technologicznymi, aby dostosować infrastrukturę w odpowiedzi na wyzwania, jakie stawiają boty. Przykłady takich inicjatyw obejmują Cloudflare AI Labyrinth, które oferuje usługi rozpoznawania niepożądanych gości.

Wikimedia nieustannie podkreśla, że dostęp do treści jest darmowy i powinien pozostać taki, ale infrastruktura wymaga realnych inwestycji. Wspieranie projektu WE5: Responsible Use of Infrastructure ma na celu ustalenie zasad odpowiedzialnego korzystania z zasobów Wikipedii, co mogłoby zabezpieczyć przyszłość tej platformy.

W kontekście inteligencji sztucznej istnieje potrzeba lepszej koordynacji z programistami projektującymi AI, co prowadzi do propozycji stworzenia dedykowanych interfejsów oraz zapewnienia współfinansowania między dużymi firmami a dostawcami treści. Bez takich działań, przyszłość Wikipedii oraz innych podobnych organizacji może być zagrożona, co w efekcie ograniczy dostęp milionów ludzi do wiedzy, zaś instytucje te mogłyby nie być w stanie utrzymać niezbędnej infrastruktury. W obliczu rosnącego wyzwania, aby nie doprowadzić do zniknięcia darmowych treści w Internecie, potrzebne są pilne działania i zmiany nawołujące do bezpiecznego i odpowiedzialnego korzystania z zasobów.

Czy Wikipedia znajduje się na krawędzi przepaści? Bądź na bieżąco z tymi wydarzeniami, które mogą zmienić oblicze dostępu do wiedzy w sieci!