Reddit обмежує доступ Internet Archive через скрапінг даних для ШІ

Reddit обмежує доступ Internet Archive через скрапінг даних для ШІ

Представники Reddit заявили, що виявили використання даних з Wayback Machine для навчання моделей штучного інтелекту без згоди платформи. Через це сервіс Internet Archive більше не зможе зберігати сторінки з постами, коментарями та профілями користувачів Reddit.

Доступною для архівації залишиться лише головна сторінка сайту, що фактично обмежує збереження до списків популярних тем і заголовків за день.

За словами Тіма Ратшмідта, речника Reddit, платформа не проти архівації в цілому, але вимагає дотримання політик і захисту приватності користувачів, зокрема видалення видаленого контенту.

Обмеження почнуть діяти поетапно, про що Internet Archive повідомили заздалегідь. Рішення вписується у загальну стратегію Reddit з монетизації доступу до своїх даних.

Раніше компанія уклала угоди з Google та OpenAI, а також змінила політику API у 2023 році, обмеживши безоплатний доступ після зловживань для навчання ШІ. У червні 2025 року Reddit подав до суду на Anthropic, звинувативши її у несанкціонованому скрапінгу.

Архівні дані Reddit важливі, оскільки допомагають журналістам і маркетологам відстежувати настрої й динаміку онлайн-спільноти. Великі платформи дедалі частіше монетизують дані, особливо у зв’язку зі зростанням попиту з боку ШІ-розробників.

Джерело: TheVerge

Софія Старк
Софія Старк
• Media Editor & Email Marketing Manager
Агенція digital-маркетингу Inweb
Media Editor, дипломована журналістка з фокусом на Digital і технології. Маю 5 років досвіду у графічному дизайні, опанувала SEO, email-маркетинг та керувала SMM-відділом. У роботі — як персональна Сірі: швидко знаходжу потрібне, аналізую та перетворюю на зрозумілий контент. Педантична перфекціоністка з невичерпною допитливістю, тож збираю найважливіше і найцікавіше, щоб ви могли прочитати це у медіа. Люблю геймінг та експериментую з мобільною фотографією.
Більше цікавого