Мінцифри та Київстар створять українську мовну модель на базі Gemma 3 від Google
Міністерство цифрової трансформації та Київстар оголосили, що створять українську мовну модель штучного інтелекту. Базою для моделі стане Gemma 3 від Google. Команда планує адаптувати її до української мови та навчити на спеціально підготовлених даних. Серед пріоритетів — оновлення моделі для точнішої роботи з українською, донавчання моделі на унікальних текстах та створення тестів для подальшої перевірки якості.
У Мінцифри зазначають, що вибір Gemma пов’язаний із балансом між продуктивністю та технічними вимогами. Модель підтримує понад 140 мов, має довге контекстне вікно до 128 тисяч токенів і може працювати з текстами та зображеннями. Київстар додає, що Gemma вже стала основою для українських моделей MamayLM і Lapa LLM, а також для болгарської INSAIT BgGPT, що підтверджує ефективність її архітектури.
Про запуск національної LLM Мінцифра та Київстар оголосили у неформальній манері: у короткому ролику, стилізованому під відомий мем із Михайлом Добкіним.
У дописі команди підкреслили, що створюють «не копію й не аналог», а власну українську модель, яку навчали на локальних даних і культурному контексті. Аудиторію закликали запропонувати назву для майбутньої LLM — 10 найкращих варіантів винесуть на голосування в «Дію», а автори найвлучніших отримають подарунки від Київстару.