OpenAI підтвердила, що ChatGPT використовує кешовані копії сайтів для вебпошуку
OpenAI фактично підтвердила, що ChatGPT Search використовує власний кеш вебсторінок та індексований контент для пошуку інформації. На це звернув увагу редактор Search Engine Roundtable Баррі Шварц.
Йдеться про функцію Offline web search, опис якої OpenAI додала у довідкову документацію для корпоративних середовищ ChatGPT. У ній компанія прямо зазначає, що система може працювати не через «живий» пошук у реальному часі, а через попередньо збережені копії сторінок.
OpenAI пояснює, що офлайн-пошук «використовує індексований і кешований вебконтент OpenAI замість зовнішнього вебпошуку під час кожного запиту». Це означає, що ChatGPT може відповідати на основі сторінок, які вже є в індексі або кеші компанії.
Також у документації вказано:
- якщо сторінка або URL не збережені в індексі чи кеші, ChatGPT не зможе отримати до них доступ через офлайн-пошук;
- окремі сторінки можуть оновлюватися з різною частотою залежно від популярності сайту, доступності для сканування, кешування та інших технічних факторів;
- результати офлайн-пошуку можуть містити застарілу або неповну інформацію;
- ChatGPT не завжди показує, коли саме сторінку додали до кешу.
Тему обговорили SEO-спеціалісти у LinkedIn після публікації Емі Рігбі, яка звернула увагу на нові формулювання в документації OpenAI. За її словами, представники SEO-спільноти вже кілька місяців припускали, що OpenAI формує власний прихований індекс вебсторінок.
Для SEO та медіа це означає, що контент може потрапляти у відповіді ChatGPT навіть без звернення до актуальної версії сторінки в момент запиту. Водночас OpenAI наголошує: кешований контент не гарантує точності інформації й може містити помилки або застарілі дані.
Джерело: Search Engine Roundtable