Google представила TranslateGemma — відкриті ШІ-моделі для перекладу
Google оголосила про запуск TranslateGemma — нового сімейства відкритих моделей для машинного перекладу, створених на базі Gemma 3. Компанія називає реліз суттєвим кроком у розвитку відкритих інструментів перекладу. Моделі підтримують 55 мов, разом з українською.
TranslateGemma доступна у трьох варіантах — з 4, 12 і 27 мільярдами параметрів. За даними Google, версія 12B показала кращі результати в бенчмарку WMT24++ порівняно з базовою Gemma 3 на 27B параметрів. Для розробників це означає вищу швидкість роботи та меншу затримку без втрати якості перекладу.

У компанії пояснюють, що модель 4B оптимізована для роботи на мобільних пристроях, версія 12B підходить для споживчих ноутбуків, а 27B орієнтована на серверні та хмарні середовища й потребує значних обчислювальних ресурсів, зокрема рівня GPU **NVIDIA H100.
Окремо Google відзначає результати тестів на бенчмарку Vistra для перекладу тексту на зображеннях: TranslateGemma показала вищу точність, хоча її не навчали спеціально для цього завдання. Це вказує на кращу роботу з контекстом і візуальними даними.
Такої якості вдалося досягти завдяки двоетапному процесу навчання. Спочатку моделі проходили навчання з учителем на поєднанні людських перекладів і високоякісних синтетичних даних, згенерованих моделями Gemini. На другому етапі застосували навчання з підкріпленням із використанням систем оцінювання якості, зокрема MetricX-QE та AutoMQM, щоб наблизити переклади до природного мовлення.
Моделі TranslateGemma вже доступні для завантаження на платформах Kaggle та Hugging Face, що дає змогу розробникам інтегрувати їх у власні продукти та дослідницькі проєкти.
Джерело: Google