ШІ-браузери залишатимуться вразливими до хакерських атак через підказки агента — OpenAI

ШІ-браузери залишатимуться вразливими до хакерських атак через підказки агента — OpenAI

Компанія OpenAI заявила, що браузери з вбудованими ШІ-агентами можуть залишатися вразливими до атак типу prompt injection навіть за умови постійного посилення захисту. Йдеться про спосіб атаки, коли приховані інструкції вміщують у вебсторінки або електронні листи, щоб змусити ШІ виконувати небажані дії.

Prompt injection — це тип атаки на ШІ-системи, коли в текст, який вони обробляють, навмисно вбудовують приховані інструкції. Такі інструкції можуть бути заховані у вебсторінці, електронному листі або документі й змушують ШІ-агента виконувати дії, яких від нього не очікували, наприклад надсилати повідомлення, змінювати налаштування або працювати з чутливими даними. Проблема в тому, що ШІ сприймає ці інструкції як частину завдання і не завжди може відрізнити їх від легітимних команд.

У блозі компанії зазначається, що prompt injection є довгостроковою проблемою, подібною до фішингу або соціальної інженерії в інтернеті. В OpenAI визнають, що режим роботи ШІ-агента в браузері Atlas розширює поверхню атаки, а отже підвищує ризики для безпеки.

OpenAI запустила браузер ChatGPT Atlas у жовтні 2025 року. Майже одразу дослідники безпеки показали, що поведінку браузера можна змінити через приховані інструкції, наприклад у документах Google. Подібні ризики раніше публічно визнавали й інші компанії, зокрема Brave та розробники браузерів з ШІ-функціями.

Проблему prompt injection визнають не лише в OpenAI. На початку грудня National Cyber Security Centre у Великій Британії заявив, що такі атаки, ймовірно, ніколи не вдасться повністю усунути. Регулятор радить зосереджуватися на зменшенні ризиків і наслідків, а не на спробах повністю заблокувати цей тип загроз.

У відповідь OpenAI використовує підхід швидкого тестування та оновлення захисту. Компанія розробила спеціального автоматизованого атакувальника — ШІ-агента, навченого за допомогою підкріплювального навчання, який імітує дії зловмисників і шукає нові способи обійти захист системи ще до того, як їх використають у реальних атаках.

Цей агент тестує атаки в симуляції, аналізує реакцію цільового ШІ та багаторазово змінює сценарії, щоб знайти слабкі місця. За даними OpenAI, такий підхід уже допоміг виявити нові типи атак, які не фіксувалися під час ручного тестування або зовнішніх аудитів.

У компанії наголошують, що жодне рішення не може гарантувати повний захист. Тому OpenAI рекомендує обмежувати доступ ШІ-агентів до чутливих даних, вимагати підтвердження перед відправленням повідомлень або платежів і давати агентам чіткі, вузькі інструкції замість загальних повноважень.

Експерти з безпеки також застерігають від завищених очікувань. За словами дослідника компанії Wiz Рамі Маккарті, поєднання автономності та широкого доступу до даних робить такі браузери особливо ризикованими. На його думку, для більшості повсякденних сценаріїв користь від агентних браузерів поки що не переважає потенційні ризики.

Джерело: TechCrunch

Гнатюк Дмитро
Гнатюк Дмитро
• News Editor
Inweb
Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.
Більше цікавого