OpenAI представила GPT-5.4 для складної професійної роботи
OpenAI представила нову мовну модель GPT-5.4, яку компанія називає найпотужнішою та найефективнішою моделлю для професійної роботи. Вона доступна у кількох версіях: стандартній, reasoning-версії GPT-5.4 Thinking та високопродуктивній GPT-5.4 Pro.
API-версія моделі підтримує контекст до 1 мільйона токенів, що є найбільшим контекстним вікном серед моделей OpenAI. Це дає змогу працювати з набагато довшими документами та складними задачами.
У компанії також заявили про підвищену ефективність використання токенів. За даними OpenAI, GPT-5.4 може розв’язувати ті самі завдання, використовуючи значно менше токенів, ніж попередня модель.
GPT-5.4 показала покращені результати у низці бенчмарків. Зокрема, модель встановила рекордні показники у тестах для роботи з комп’ютером OSWorld-Verified і WebArena Verified, а також набрала 83% у тесті GDPval, який оцінює виконання завдань для інтелектуальної роботи.
У бенчмарку APEX-Agents, що перевіряє професійні навички у сферах права та фінансів, модель також посіла перше місце. За словами CEO Mercor Брендана Фуді, GPT-5.4 добре справляється зі створенням складних результатів на довгих часових горизонтах — зокрема презентацій, фінансових моделей і юридичного аналізу.
Разом із запуском моделі OpenAI змінила систему виклику інструментів в API. Нова функція Tool Search дає змогу моделі знаходити потрібні інструменти під час роботи, замість того щоб передавати їх усі в системному запиті. Це скорочує використання токенів і прискорює запити в системах із великою кількістю інструментів.
Компанія також додала нову перевірку безпеки для reasoning-моделей, яка оцінює їхній chain-of-thought — внутрішній процес міркування під час виконання складних завдань. За результатами тестів, версія GPT-5.4 Thinking рідше демонструє спроби приховати або спотворити логіку своїх міркувань.
Для бізнесу це означає подальший розвиток моделей, орієнтованих на професійну роботу — від аналізу документів до створення фінансових моделей і презентацій. Великі контекстні вікна та ефективніше використання токенів можуть зменшити вартість інтеграцій ШІ у бізнес-процеси.
Джерело: Tech Crunch