OpenAI запустила режим Lockdown Mode для захисту ChatGPT від атак через приховані інструкції
OpenAI оголосила про запуск нового режиму безпеки Lockdown Mode для ChatGPT. Він має допомогти організаціям і окремим користувачам захищати конфіденційні дані від так званих prompt injection-атак.
Такі атаки використовують приховані інструкції у вебсторінках, документах або інших джерелах даних. Модель може сприймати ці інструкції як частину запиту та змінювати свою поведінку, що потенційно створює ризик витоку інформації.
Після активації Lockdown Mode ChatGPT вимикає низку функцій. Зокрема, режим блокує перегляд вебсторінок у реальному часі, завантаження та відображення зображень з інтернету, Deep Research і Agent Mode. Водночас користувачі можуть і надалі створювати зображення за допомогою ШІ.
У OpenAI зазначають, що новий режим не гарантує повний захист від таких атак. Компанія попереджає, що приховані інструкції можуть міститися навіть у кешованому вебконтенті або файлах, які завантажує людина. Через це Lockdown Mode лише знижує ризик впливу сторонніх інструкцій на відповіді моделі.
За словами компанії, режим створили насамперед для організацій та фахівців, які працюють із чутливими даними й потребують додаткового рівня захисту від витоку інформації.
Наразі OpenAI поступово відкриває доступ до Lockdown Mode для клієнтів ChatGPT Business із самостійним підключенням, а також для частини персональних акаунтів, які відповідають вимогам компанії.
Джерело: TechCrunch