Reddit въведе ограничения върху дейността на Internet Archive (IA), след като стана ясно, че някои компании за изкуствен интелект използват платформата за индиректно извличане на данни от архивирано съдържание.
IA, най-известна с инструмента Wayback Machine, запазва моментни снимки на уеб страници, включително популярни постове, коментари и дискусии от Reddit. Тази практика позволяваше на потребителите да намират изтрити публикации или коментари, особено по време на значими промени в платформата, като въвеждането на API ограничения през 2023 г.
С новите мерки архивът вече ще съхранява само снимки на началната страница на Reddit, без пълни страници и коментари. Това силно ограничава възможността на IA да служи като пълен архив на съдържанието в платформата, особено при изтрити или променени публикации.
Причината за ограниченията е двойна – защита на личните данни на потребителите и контрол върху това как се използва съдържанието. Reddit твърди, че Wayback Machine запазва и изтрити постове, което противоречи на правилата за поверителност. Освен това, компанията настоява IA да предприеме допълнителни мерки срещу неразрешено извличане на данни, за да има шанс част от ограниченията да бъдат отменени.
Експерти предполагат и финансов мотив – ограничаването на безплатното извличане на данни може да тласне AI фирмите към платени лицензионни споразумения. Reddit вече има подобни сделки с OpenAI и Google, като последната се оценява на 60 млн. долара, а приходите от подобни партньорства може да надхвърлят 200 млн. долара в следващите години.
Въпреки напрежението, директорът на Wayback Machine, Марк Греъм, подчерта, че отношенията с Reddit са „дългогодишни“ и че преговорите продължават. Засега обаче съдбата на пълното архивиране на Reddit остава несигурна.









