ASPIRE: агентная система для автоматического обнаружения навыков робота

ASPIRE (Agentic Skill Programming through Iterative Robot Exploration), это система непрерывного обучения, которая автономно создаёт и улучшает программы управления роботами в парадигме «code-as-policy», накапливая опыт в переиспользуемую библиотеку навыков.

Система работает в открытом цикле с тремя компонентами: (1) движок исполнения с замкнутой обратной связью, который собирает мультимодальные трассы, позволяя диагностировать сбои и синтезировать исправления; (2) постоянно расширяющаяся библиотека навыков, которая дистиллирует проверенные исправления в переиспользуемое знание; (3) эволюционный поиск, генерирующий разнообразные последовательности задач для исследования.

На бенчмарках ASPIRE превосходит предыдущие методы на 77% (манипуляция под возмущениями), 72% (двуручный захват) и 32% (долгосрочные домашние задачи). Кроме того, знания, полученные в симуляции, демонстрируют перенос в реальные роботы разных конфигураций, значительно снижая затраты на программирование.

Ключевые факты

ASPIRE автономно диагностирует ошибки роботов и синтезирует исправления, накапливая их в переиспользуемую библиотеку
Система достигает 77% улучшения на задачах манипуляции и 72% на двуручных захватах по сравнению с предыдущими методами
Навыки, открытые в симуляции, переносятся на реальных роботов разных типов без переобучения
На долгосрочных домашних задачах ASPIRE достигает 31% успеха против 4% у конкурентов, даже без test-time рассуждений
Система работает в открытом цикле: исполнение → диагностика → синтез → дистилляция в навык → генерация новых задач

Почему это важно

Программирование поведения роботов, сложная инженерная задача: нужно координировать восприятие, управлять контактной механикой, адаптироваться к разным конфигурациям и сбоям. ASPIRE решает эту задачу через автоматизацию: система сама пишет программы, учится на ошибках и переиспользует знание на новых задачах. Успех на стандартных бенчмарках (LIBERO-Pro, Robosuite) и реальных роботах показывает, что подход масштабируется.

Кому это важно

Исследователям робототехники и ИИ, которые работают над автономными системами. Инженерам, которые занимаются программированием роботов (специалисты в области манипуляции, домашней робототехники). Организациям, инвестирующим в робототехнику, ASPIRE обещает снизить затраты на разработку и ускорить адаптацию на новые задачи.

Как это применить

Подход ASPIRE применим к любой задаче манипуляции или навигации, если её можно выразить в коде (code-as-policy). Система требует симуляции для первичного обучения (Robosuite, BEHAVIOR-1K), затем переносит навыки на реальных роботов. Исследователи могут использовать ASPIRE для быстрого прототипирования новых задач: вместо ручного программирования система автоматизирует синтез и улучшение кода.

Можно ли доверять

Статья опубликована на HuggingFace и содержит результаты на трёх независимых бенчмарках (LIBERO-Pro, Robosuite, BEHAVIOR-1K) с численными сравнениями против конкурентов. Данные о переносе из симуляции в реальность наиболее интересны, но авторы достаточно честны о границах (они отмечают, что это «начальное свидетельство»). Результаты показывают значительный прогресс, но полная валидация требует независимой проверки.

Риски и подводные камни

Система зависит от качества симуляции: если модель робота или окружения неточна, открытые навыки могут не перенестись на реальность. Эволюционный поиск требует вычислительных ресурсов и времени. Библиотека навыков растёт, что может привести к разрастанию и конфликтам между старыми и новыми исправлениями. Масштабируемость на очень долгосрочные задачи (>100 шагов) и сложные взаимодействия требует дополнительного исследования.