Мінцифри та Київстар створять українську мовну модель на базі Gemma 3 від Google

Мінцифри та Київстар створять українську мовну модель на базі Gemma 3 від Google

Міністерство цифрової трансформації та Київстар оголосили, що створять українську мовну модель штучного інтелекту. Базою для моделі стане Gemma 3 від Google. Команда планує адаптувати її до української мови та навчити на спеціально підготовлених даних. Серед пріоритетів — оновлення моделі для точнішої роботи з українською, донавчання моделі на унікальних текстах та створення тестів для подальшої перевірки якості.

У Мінцифри зазначають, що вибір Gemma пов’язаний із балансом між продуктивністю та технічними вимогами. Модель підтримує понад 140 мов, має довге контекстне вікно до 128 тисяч токенів і може працювати з текстами та зображеннями. Київстар додає, що Gemma вже стала основою для українських моделей MamayLM і Lapa LLM, а також для болгарської INSAIT BgGPT, що підтверджує ефективність її архітектури.

Представники Google зазначили, що підхід України є стратегічно важливим, оскільки демонструє потенціал відкритих моделей для створення локальних мовних систем. Наразі команда збирає україномовні дані та готує інфраструктуру для подальшого навчання.

Про запуск національної LLM Мінцифра та Київстар оголосили у неформальній манері: у короткому ролику, стилізованому під відомий мем із Михайлом Добкіним. 

У дописі команди підкреслили, що створюють «не копію й не аналог», а власну українську модель, яку навчали на локальних даних і культурному контексті. Аудиторію закликали запропонувати назву для майбутньої LLM — 10 найкращих варіантів винесуть на голосування в «Дію», а автори найвлучніших отримають подарунки від Київстару.

Джерело: Міністерство цифрової трансформації України

Гнатюк Дмитро
Гнатюк Дмитро
• News Editor
Inweb
Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.
Більше цікавого