Google представила Gemini Robotics — ШІ-модель для керування роботами

Google DeepMind представили дві нові моделі — Gemini Robotics і Gemini Robotics-ER. Вони базуються на останній версії ШІ-моделі Gemini 2.0 та додають можливість керування роботами.
Gemini Robotics поєднує аналіз зображень, розуміння мови та контроль фізичних дій, що дозволяє роботам адаптуватися до нових завдань без попереднього навчання. Google заявляє, що ця модель удвічі перевищує точність аналогічних систем у тестах на узагальнення даних. Серед її можливостей — виконання складних багатокрокових дій, зокрема складання оригамі чи пакування предметів.
Gemini Robotics-ER зосереджена на просторовому аналізі та сумісності з існуючими робототехнічними системами. Вона забезпечує повний цикл управління, включаючи розпізнавання навколишнього середовища, оцінку стану, планування рухів і створення коду для керування роботами.
Google співпрацює з компанією Apptronik для створення людиноподібних роботів на основі Gemini 2.0. Серед перших тестувальників — Agile Robots, Agility Robotics, Boston Dynamics та Enchanted Tools.
Джерело: Neowin