ШІ-моделі з функцією міркування можуть уповільнити прогрес — дослідження Epoch AI

Розвиток штучного інтелекту з навичками логічного міркування може сповільнитися в найближчий рік. Про це йдеться у звіті дослідницького інституту Epoch AI, який вивчає межі масштабування reasoning моделей — ШІ, здатних розв’язувати складні завдання, зокрема математичні й програмістські задачі.
Reasoning моделі, як-от OpenAI o3, демонструють вищі результати на тестах, але потребують значно більше обчислювальних ресурсів. Їх навчають у два етапи: спершу на великому обсязі даних, потім — методом підкріпленого навчання (reinforcement learning), де модель отримує зворотний зв’язок щодо складних задач.
За даними Epoch, компанії на кшталт OpenAI раніше витрачали обмежену кількість обчислювальних потужностей на етап підкріпленого навчання, але ситуація змінюється. Зокрема, на тренування моделі o3 витратили приблизно у 10 разів більше ресурсів, ніж на попередню версію o1. Припускається, що більшість цієї потужності пішла саме на RL-фазу.
Водночас у звіті зазначено, що навіть цей підхід має межі масштабування. Вартість навчання зростає, а приріст продуктивності починає вирівнюватися. Наприклад, якщо класичне навчання ШІ-моделей наразі дає чотириразове зростання результатів на рік, то ефект від reinforcement learning збільшується в 10 разів лише кожні 3–5 місяців. Але ця тенденція може вирівнятися до 2026 року.
Крім технічних обмежень, у дослідженні згадуються високі накладні витрати на дослідження та розробку reasoning-моделей як ще один стримувальний чинник.
Джерело: Tech Crunch