The Atlantic опублікувало базу з 21 мільйона пісень, які могли використати для навчання музичних ШІ
Видання The Atlantic опублікувало чотири відкриті бази даних із музичними творами, які використовували для навчання моделей штучного інтелекту. Загалом вони містять понад 21 мільйон композицій, включно з роботами популярних виконавців.
Автор розслідування Алекс Райснер зазначає, що масштаби використання захищеної авторським правом музики для тренування генеративних моделей виявилися значно більшими, ніж вважалося раніше. Найбільші бази містять близько 12 мільйонів і 9 мільйонів треків відповідно, ще дві — приблизно по 100 тисяч композицій.
Публікація з’явилася на тлі судових суперечок між музичною індустрією та сервісами генерації музики на кшталт Suno і Udio. Правовласники звинувачують такі платформи у використанні захищених авторським правом творів без дозволу для навчання своїх моделей.
Опубліковані бази даних можуть стати додатковим інструментом для музичних лейблів та виконавців у майбутніх судових процесах. Вони дозволяють перевірити, чи потрапляли конкретні композиції до наборів даних, які використовували для навчання моделей штучного інтелекту.
Музичні стримінгові сервіси вже намагаються боротися з наслідками масового поширення ШІ-контенту. Частина платформ позначає або обмежує поширення музики, створеної штучним інтелектом. Водночас проблема копіювання стилю відомих артистів та появи фейкових виконавців залишається актуальною для індустрії.
Джерело: Engadget