Google презентувала Gemini 2.5 — тепер агент може самостійно працювати з браузером

Google анонсувала нову модель штучного інтелекту Gemini 2.5. Тепер агент може самостійно працювати з браузером, виконуючи 13 основних дій: відкриття браузера, введення тексту, перетягування елементів, повернення на попередню сторінку, перехід на наступну сторінку, пошук, навігація, наведення курсора тощо.
Агент не має доступу до повного комп’ютерного середовища (тобто до операційної системи, локальних файлів, програмного забезпечення та інших ресурсів комп’ютера), що відрізняє його від інших моделей, таких як ChatGPT Agent. Це обмеження дозволяє Gemini 2.5 виконувати завдання лише в межах браузера.
Gemini 2.5 доступна для розробників через сервіси Google AI Studio та Vertex AI. Також Google демонструє роботу цього агента на платформі Browserbase, де можна побачити, як AI виконує завдання.
Джерело: The Verge