Новини | The Atlantic виявив понад 21 мільйон музичних треків у датасетах для навчання ШІ

The Atlantic опублікувало базу з 21 мільйона пісень, які могли використати для навчання музичних ШІ

Видання The Atlantic опублікувало чотири відкриті бази даних із музичними творами, які використовували для навчання моделей штучного інтелекту. Загалом вони містять понад 21 мільйон композицій, включно з роботами популярних виконавців.

Автор розслідування Алекс Райснер зазначає, що масштаби використання захищеної авторським правом музики для тренування генеративних моделей виявилися значно більшими, ніж вважалося раніше. Найбільші бази містять близько 12 мільйонів і 9 мільйонів треків відповідно, ще дві — приблизно по 100 тисяч композицій.

Публікація з’явилася на тлі судових суперечок між музичною індустрією та сервісами генерації музики на кшталт Suno і Udio. Правовласники звинувачують такі платформи у використанні захищених авторським правом творів без дозволу для навчання своїх моделей.

У матеріалі також згадується інша судова справа у книжковій галузі. Суд не підтримав частину претензій щодо порушення авторських прав, однак аргументи про використання піратського контенту виявилися більш переконливими. Остаточне рішення у цій справі ще не ухвалили, хоча початкова сума врегулювання становила $1,5 млрд.

Опубліковані бази даних можуть стати додатковим інструментом для музичних лейблів та виконавців у майбутніх судових процесах. Вони дозволяють перевірити, чи потрапляли конкретні композиції до наборів даних, які використовували для навчання моделей штучного інтелекту.

Музичні стримінгові сервіси вже намагаються боротися з наслідками масового поширення ШІ-контенту. Частина платформ позначає або обмежує поширення музики, створеної штучним інтелектом. Водночас проблема копіювання стилю відомих артистів та появи фейкових виконавців залишається актуальною для індустрії.

Джерело: Engadget

Гнатюк Дмитро • News Editor

Inweb

Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.