Reddit обмежує доступ Internet Archive через скрапінг даних для ШІ

Представники Reddit заявили, що виявили використання даних з Wayback Machine для навчання моделей штучного інтелекту без згоди платформи. Через це сервіс Internet Archive більше не зможе зберігати сторінки з постами, коментарями та профілями користувачів Reddit.
Доступною для архівації залишиться лише головна сторінка сайту, що фактично обмежує збереження до списків популярних тем і заголовків за день.
За словами Тіма Ратшмідта, речника Reddit, платформа не проти архівації в цілому, але вимагає дотримання політик і захисту приватності користувачів, зокрема видалення видаленого контенту.
Раніше компанія уклала угоди з Google та OpenAI, а також змінила політику API у 2023 році, обмеживши безоплатний доступ після зловживань для навчання ШІ. У червні 2025 року Reddit подав до суду на Anthropic, звинувативши її у несанкціонованому скрапінгу.
Архівні дані Reddit важливі, оскільки допомагають журналістам і маркетологам відстежувати настрої й динаміку онлайн-спільноти. Великі платформи дедалі частіше монетизують дані, особливо у зв’язку зі зростанням попиту з боку ШІ-розробників.
Джерело: TheVerge