Google запускає найпотужнішу модель ШІ для логічних задач — Gemini 2.5 Deep Think

Google представила Gemini 2.5 Deep Think — нову багатокомпонентну модель ШІ, здатну аналізувати кілька ідей водночас й обирати найкращу відповідь. За словами компанії, це найпросунутіша модель для логічних міркувань, яка доступна публічно.
Gemini 2.5 Deep Think буде доступною з 2 серпня лише для підписників Gemini Ultra через застосунок Gemini. У найближчі тижні модель також тестуватимуть вибрані розробники через API.
Модель працює за принципом мультиагентної системи — для кожного запиту створюється кілька агентів, які паралельно аналізують завдання. Цей підхід потребує більше обчислювальних ресурсів, але забезпечує точніші результати. Відповідно до тестів Google, Gemini 2.5 Deep Think показала найкращі результати серед сучасних моделей:
- 34,8% на тесті Humanity’s Last Exam (HLE), що перевищує показники xAI Grok 4 (25,4%) і OpenAI o3 (20,3%);
- 87,6% на LiveCodeBench6 — випробуванні з програмування, де вона також випередила Grok 4 (79%) і OpenAI o3 (72%).

Модель автоматично використовує допоміжні інструменти, зокрема виконання коду та Google Search, і генерує довші й структурованіші відповіді, ніж традиційні чатботи. За результатами внутрішніх тестів, вона краще справляється із завданнями веброзробки й наукових досліджень.
Також Google передає окрему варіацію цієї моделі — ту, що допомогла здобути золоту медаль на Міжнародній математичній олімпіаді 2025 — для тестування обраним науковцям. Її обчислення можуть тривати годинами, тож компанія очікує отримати зворотний зв’язок щодо потенціалу моделі в академічних задачах.
Мультиагентні системи стають новим стандартом в індустрії: над схожими підходами працюють xAI (Grok 4 Heavy), OpenAI та Anthropic. Водночас вартість обслуговування таких моделей залишається високою — тому компанії обмежують доступ до них найдорожчими планами підписки.
Джерело: Tech Crunch