Поетичні запити можуть обходити захисні обмеження чатботів ШІ — дослідження Icaro Lab
Видання Icaro Lab проаналізувало, як поетичні структури впливають на роботу великих мовних моделей. Автори виявили, що віршована форма запиту може діяти як універсальний спосіб обходу захисних механізмів, забезпечуючи успішність на рівні 62%. Моделі в окремих випадках відповідали на теми, які зазвичай блокуються: створення зброї, матеріали щодо насильства над дітьми, поради з завдання собі шкоди.
Команда протестувала різні моделі: GPT-5, Google Gemini, Claude та інші. За результатами тестів, найбільш схильними відповідати на заборонені теми були Gemini, DeepSeek і MistralAI, а GPT-5 та Claude Haiku 4.5 найчастіше залишалися в межах обмежень.
Автори дослідження не оприлюднили повні приклади використаних поетичних запитів, вказавши, що поширення таких методів може створити ризики. У коментарі Wired вони зазначили, що механізм обходу легший, ніж може здатися, тому публікація повних прикладів була б небезпечною.
Джерело: Engadget