Alibaba представила Qwen3.5-397B — нову модель ШІ для самостійного виконання складних завдань
Alibaba випустила Qwen3.5-397B-A17B — першу модель із відкритими вагами Компанія розробила її як візуально-мовну систему, здатну самостійно виконувати складні завдання.
Модель має 397 млрд параметрів, але під час одного проходу активує 17 млрд. Такий підхід дає змогу зменшити навантаження на обчислювальні ресурси без втрати продуктивності.
Архітектура поєднує розріджену суміш експертів і механізм лінійної уваги через Gated Delta Networks. За даними компанії, це пришвидшує обробку запитів і зберігає високі результати в тестах на міркування, програмування та роботу агентів.
Хмарна версія Qwen3.5-Plus вже доступна через платформу Alibaba Cloud Model Studio. Вона підтримує контекстне вікно до 1 млн токенів і має вбудовану функцію адаптивного використання інструментів.
Під час навчання з підкріпленням розробники зосередилися на здатності моделі узагальнювати завдання, а не лише оптимізуватися під конкретні сценарії. Інфраструктура включає навчальний конвеєр FP8 та асинхронну платформу для підвищення стабільності процесу.
Alibaba позиціює Qwen3.5 як базу для створення мультимодальних агентів, які поєднують міркування, пошук інформації та програмування. Для бізнесу це означає можливість будувати системи, що працюють з текстом і зображеннями в межах однієї моделі та масштабуються через хмару.
Джерело: dev.ua