• 6 Серпня 2025

OpenAI запустила дві відкриті AI-моделі для логічних завдань

OpenAI оголосила про запуск двох відкритих мовних моделей — gpt-oss-120b і gpt-oss-20b. Це перші відкриті моделі компанії з часів GPT-2, випущеної понад п’ять років тому. Моделі доступні для безкоштовного завантаження з платформи Hugging Face, а також уперше інтегровані у сервіси Amazon Web Services — Bedrock і SageMaker.

Модель gpt-oss-120b має 117 млрд параметрів і може працювати на одній GPU Nvidia, активуючи лише частину параметрів для економії ресурсів. Легша gpt-oss-20b підходить для ноутбуків із 16 ГБ оперативної пам’яті.

Фото: OpenAI запустила дві відкриті AI-моделі для логічних завдань

Обидві побудовані за архітектурою mixture-of-experts і навчені з використанням reinforcement learning, що підвищує точність виконання завдань. Вони здатні працювати з текстом і підключати інструменти на кшталт вебпошуку чи Python, але не підтримують обробку зображень та аудіо.

За результатами тестування, gpt-oss перевершують провідні відкриті моделі DeepSeek і Qwen, але поступаються закритим моделям OpenAI серій o3 та o4-mini. Рівень галюцинацій у відкритих моделей вищий, що пов’язано з меншими обсягами знань порівняно з великими комерційними моделями.

Моделі поширюються під ліцензією Apache 2.0, що дозволяє їх вільне використання та комерціалізацію без погодження з OpenAI. Компанія не розкриває дані, використані для навчання, щоб знизити юридичні ризики. Перед випуском моделі пройшли перевірку на можливість використання у небезпечних цілях і не досягли високого рівня загрози навіть після донавчання.

Для бізнесу це означає можливість швидко протестувати ШІ-рішення без додаткових витрат на ліцензії. Ліцензія Apache 2.0 дозволяє вільно інтегрувати моделі у комерційні проєкти, а розміщення на AWS спрощує запуск у корпоративній інфраструктурі.

Цей крок також посилює конкуренцію на ринку відкритих моделей, де вже активно працюють DeepSeek, Alibaba та інші гравці. Для компаній це може означати ширший вибір інструментів та нижчі витрати на впровадження оптимізації за допомогою ШІ.

Джерело: TechCrunch

Софія Старк

• Content & Email Strategist

Агенція digital-маркетингу Inweb

Media Editor, дипломована журналістка з фокусом на Digital і технології. Маю 5 років досвіду у графічному дизайні, опанувала SEO, email-маркетинг та керувала SMM-відділом. У роботі — як персональна Сірі: швидко знаходжу потрібне, аналізую та перетворюю на зрозумілий контент. Педантична перфекціоністка з невичерпною допитливістю, тож збираю найважливіше і найцікавіше, щоб ви могли прочитати це у медіа. Люблю геймінг та експериментую з мобільною фотографією.