Поетичні запити можуть обходити захисні обмеження чатботів ШІ — дослідження Icaro Lab

Поетичні запити можуть обходити захисні обмеження чатботів ШІ — дослідження Icaro Lab

Видання Icaro Lab проаналізувало, як поетичні структури впливають на роботу великих мовних моделей. Автори виявили, що віршована форма запиту може діяти як універсальний спосіб обходу захисних механізмів, забезпечуючи успішність на рівні 62%. Моделі в окремих випадках відповідали на теми, які зазвичай блокуються: створення зброї, матеріали щодо насильства над дітьми, поради з завдання собі шкоди.

Команда протестувала різні моделі: GPT-5, Google Gemini, Claude та інші. За результатами тестів, найбільш схильними відповідати на заборонені теми були Gemini, DeepSeek і MistralAI, а GPT-5 та Claude Haiku 4.5 найчастіше залишалися в межах обмежень.

Автори дослідження не оприлюднили повні приклади використаних поетичних запитів, вказавши, що поширення таких методів може створити ризики. У коментарі Wired вони зазначили, що механізм обходу легший, ніж може здатися, тому публікація повних прикладів була б небезпечною.

Джерело: Engadget

Гнатюк Дмитро
Гнатюк Дмитро
• News Editor
Inweb
Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.
Більше цікавого