Reddit a anunțat că va restricționa accesul Internet Archive la majoritatea conținutului său, după ce a descoperit că unele companii de inteligență artificială folosesc Wayback Machine pentru a extrage date în mod abuziv.
Potrivit purtătorului de cuvânt Tim Rathschmidt, platforma va bloca indexarea paginilor cu detalii ale postărilor, comentariilor și profilurilor, permițând doar arhivarea paginii principale Reddit.com. Astfel, Internet Archive va putea păstra doar o evidență a titlurilor de știri și postărilor populare dintr-o anumită zi.
„Internet Archive oferă un serviciu pentru web-ul deschis, dar am constatat cazuri în care companiile AI încalcă politicile platformei și extrag date din Wayback Machine”, a declarat Rathschmidt pentru The Verge. El a adăugat că, până când Internet Archive nu își va securiza mai bine site-ul și nu va respecta politicile platformei — inclusiv protejarea confidențialității utilizatorilor și ștergerea conținutului eliminat —, accesul va fi limitat pentru protejarea comunității Reddit.
Restricțiile vor începe să fie implementate gradual, iar Reddit spune că a notificat Internet Archive înainte de aplicarea lor. Rathschmidt a menționat că platforma și-a exprimat anterior îngrijorarea privind posibilitatea ca materialele arhivate să fie exploatate de terți pentru colectarea de date.
Această măsură se înscrie în strategia Reddit de a controla accesul la datele sale, în contextul creșterii cererii pentru antrenarea modelelor AI. În ultimii ani, compania a încheiat acorduri comerciale cu Google și OpenAI pentru acces la date, dar a blocat motoarele de căutare și API-urile gratuite care erau folosite pentru colectarea lor. În iunie, Reddit a dat în judecată Anthropic, acuzând compania că a continuat să extragă date chiar și după ce a promis că va opri această practică.
Mark Graham, directorul Wayback Machine, a declarat pentru The Verge: „Avem o relație de lungă durată cu Reddit și continuăm discuțiile pe această temă”





