44% посилань ChatGPT припадає на першу третину тексту — дослідження
ChatGPT найчастіше бере посилання з початку сторінки. Про це свідчить аналіз 1,2 млн відповідей ШІ та 18 012 перевірених цитувань, який провів консультант з розвитку Кевін Індіг. За його словами, модель демонструє стабільний «ефект трампліна»: що ближче до початку тексту, то вища ймовірність цитування.
За результатами дослідження, 44,2% цитат припадає на перші 30% контенту, 31,1% — на середню частину, а лише 24,7% — на останню третину сторінки. Наприкінці матеріалів спостерігається різке зниження частоти цитувань. Водночас на рівні абзаців модель працює глибше: 53% цитат походять із середини абзаців, 24,5% — з перших речень, 22,5% — з останніх.
Дослідники пояснюють це тим, що великі мовні моделі навчаються на журналістських і академічних текстах із чіткою структурою «головне — на початку». Модель швидко формує контекст на основі перших фрагментів і далі інтерпретує текст через цю рамку.
Індіг також визначив п’ять характеристик контенту, який частіше потрапляє в відповіді ШІ:
- чіткі формулювання і визначення типу «X — це…»;
- структура запитання–відповідь, особливо в підзаголовках;
- висока концентрація назв брендів, інструментів і персон;
- збалансований тон без емоційних крайнощів;
- проста структура речень і зрозуміла мова.
У межах дослідження команда проаналізувала 3 млн відповідей ChatGPT і 30 млн цитувань, з яких виокремила 18 012 підтверджених джерел. Для зіставлення відповідей із конкретними реченнями використовували ембедінги на основі sentence-transformer, після чого вимірювали позицію фрагмента на сторінці та його мовні характеристики.
Автор дослідження робить висновок: класичні «великі гіди» з поступовим розкриттям теми можуть працювати гірше в середовищі ШІ-пошуку. Контент у форматі чіткого брифінгу з ключовими висновками на початку має більше шансів бути процитованим.
Джерело: Search Engine Land