• 1 Грудня 2025

Поетичні запити можуть обходити захисні обмеження чатботів ШІ — дослідження Icaro Lab

Видання Icaro Lab проаналізувало, як поетичні структури впливають на роботу великих мовних моделей. Автори виявили, що віршована форма запиту може діяти як універсальний спосіб обходу захисних механізмів, забезпечуючи успішність на рівні 62%. Моделі в окремих випадках відповідали на теми, які зазвичай блокуються: створення зброї, матеріали щодо насильства над дітьми, поради з завдання собі шкоди.

Команда протестувала різні моделі: GPT-5, Google Gemini, Claude та інші. За результатами тестів, найбільш схильними відповідати на заборонені теми були Gemini, DeepSeek і MistralAI, а GPT-5 та Claude Haiku 4.5 найчастіше залишалися в межах обмежень.

Автори дослідження не оприлюднили повні приклади використаних поетичних запитів, вказавши, що поширення таких методів може створити ризики. У коментарі Wired вони зазначили, що механізм обходу легший, ніж може здатися, тому публікація повних прикладів була б небезпечною.

Джерело: Engadget

OpenAI

Гнатюк Дмитро

• News Editor

Inweb

Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.

Більше цікавого

Новини

Бізнес отримав 10,68 млн грн штрафів за порушення правил реклами у 2025 році 6 Лютого 2026

Новини

Apple додав новий інструмент для видалення зайвих об’єктів на фото 29 Серпня 2024

Новини

DeepSeek створила ШІ, що самостійно доводить математичні теореми 28 Листопада 2025

Новини

Hellmann’s випустила роман про вампірів з ароматом часнику 8 Жовтня 2025

Новини

Оновлення Telegram: браузер у месенджері та обкладинки для Stories 1 Серпня 2024

Новини

Кім Кардаш’ян з’явиться у відеогрі Fortnite 11 Грудня 2025