OpenAI запустила дві відкриті AI-моделі для логічних завдань

OpenAI оголосила про запуск двох відкритих мовних моделей — gpt-oss-120b і gpt-oss-20b. Це перші відкриті моделі компанії з часів GPT-2, випущеної понад п’ять років тому. Моделі доступні для безкоштовного завантаження з платформи Hugging Face, а також уперше інтегровані у сервіси Amazon Web Services — Bedrock і SageMaker.
Модель gpt-oss-120b має 117 млрд параметрів і може працювати на одній GPU Nvidia, активуючи лише частину параметрів для економії ресурсів. Легша gpt-oss-20b підходить для ноутбуків із 16 ГБ оперативної пам’яті.

Обидві побудовані за архітектурою mixture-of-experts і навчені з використанням reinforcement learning, що підвищує точність виконання завдань. Вони здатні працювати з текстом і підключати інструменти на кшталт вебпошуку чи Python, але не підтримують обробку зображень та аудіо.
Моделі поширюються під ліцензією Apache 2.0, що дозволяє їх вільне використання та комерціалізацію без погодження з OpenAI. Компанія не розкриває дані, використані для навчання, щоб знизити юридичні ризики. Перед випуском моделі пройшли перевірку на можливість використання у небезпечних цілях і не досягли високого рівня загрози навіть після донавчання.
Для бізнесу це означає можливість швидко протестувати ШІ-рішення без додаткових витрат на ліцензії. Ліцензія Apache 2.0 дозволяє вільно інтегрувати моделі у комерційні проєкти, а розміщення на AWS спрощує запуск у корпоративній інфраструктурі.
Цей крок також посилює конкуренцію на ринку відкритих моделей, де вже активно працюють DeepSeek, Alibaba та інші гравці. Для компаній це може означати ширший вибір інструментів та нижчі витрати на впровадження оптимізації за допомогою ШІ.
Джерело: TechCrunch