OpenAI представила GPT-5.4 для складної професійної роботи

OpenAI представила GPT-5.4 для складної професійної роботи

OpenAI представила нову мовну модель GPT-5.4, яку компанія називає найпотужнішою та найефективнішою моделлю для професійної роботи. Вона доступна у кількох версіях: стандартній, reasoning-версії GPT-5.4 Thinking та високопродуктивній GPT-5.4 Pro.

API-версія моделі підтримує контекст до 1 мільйона токенів, що є найбільшим контекстним вікном серед моделей OpenAI. Це дає змогу працювати з набагато довшими документами та складними задачами.

У компанії також заявили про підвищену ефективність використання токенів. За даними OpenAI, GPT-5.4 може розв’язувати ті самі завдання, використовуючи значно менше токенів, ніж попередня модель.

GPT-5.4 показала покращені результати у низці бенчмарків. Зокрема, модель встановила рекордні показники у тестах для роботи з комп’ютером OSWorld-Verified і WebArena Verified, а також набрала 83% у тесті GDPval, який оцінює виконання завдань для інтелектуальної роботи.

У бенчмарку APEX-Agents, що перевіряє професійні навички у сферах права та фінансів, модель також посіла перше місце. За словами CEO Mercor Брендана Фуді, GPT-5.4 добре справляється зі створенням складних результатів на довгих часових горизонтах — зокрема презентацій, фінансових моделей і юридичного аналізу.

OpenAI також заявила про зниження кількості помилок. За внутрішніми тестами компанії, GPT-5.4 на 33% рідше робить помилки в окремих фактичних твердженнях, а загальна кількість помилок у відповідях зменшилася на 18% порівняно з GPT-5.2.

Разом із запуском моделі OpenAI змінила систему виклику інструментів в API. Нова функція Tool Search дає змогу моделі знаходити потрібні інструменти під час роботи, замість того щоб передавати їх усі в системному запиті. Це скорочує використання токенів і прискорює запити в системах із великою кількістю інструментів.

Компанія також додала нову перевірку безпеки для reasoning-моделей, яка оцінює їхній chain-of-thought — внутрішній процес міркування під час виконання складних завдань. За результатами тестів, версія GPT-5.4 Thinking рідше демонструє спроби приховати або спотворити логіку своїх міркувань.

Для бізнесу це означає подальший розвиток моделей, орієнтованих на професійну роботу — від аналізу документів до створення фінансових моделей і презентацій. Великі контекстні вікна та ефективніше використання токенів можуть зменшити вартість інтеграцій ШІ у бізнес-процеси.

Джерело: Tech Crunch

Гнатюк Дмитро
Гнатюк Дмитро
• News Editor
Inweb
Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.
Більше цікавого