DART: адаптация робототехнических моделей к новым условиям через векторную арифметику

Vision-Language-Action (VLA) модели, нейросети, которые воспринимают визуальную сцену, понимают команды и управляют роботом, теряют способность выполнять задачи при изменении окружения. Даже смена угла камеры или переход на другой тип робота (например, с Panda на UR5e) приводит к отказам. Обычно адаптация к новым условиям требует сбора множества новых демонстраций для каждой задачи, что дорого и медленно.

Исследователи из Seoul National University предложили метод DART (Domain ARiThmetic), решающий эту проблему через арифметику векторов весов сети. Вместо переобучения, метод добавляет специфичную для нового окружения информацию в веса уже обученной модели. Ключевая техника, выравнивание подпространств компонент весовых векторов, которое отфильтровывает шумовые элементы и позволяет корректно добавить новую информацию. Главное преимущество: для адаптации требуется всего одна демонстрация новой задачи.

Эксперименты как в симуляции, так и с реальными роботами показали, что DART превосходит существующие методы адаптации VLA-моделей при работе с единственным примером. Тестировались различные визуальные сдвиги (угол камеры, условия света) и разные типы роботов. Код опубликован на GitHub.

Ключевые факты

VLA-модели теряют способность выполнять задачи при любых изменениях окружения: смена угла камеры, другой робот, новая локация
Стандартная адаптация требует сбора десятков новых примеров; DART обходится всего одной демонстрацией
Метод добавляет информацию о новом домене через арифметику весовых векторов, без полного переобучения
Выравнивание подпространств компонент весов позволяет отфильтровать шум и корректно добавить новую информацию
Протестировано на реальных роботах Panda и UR5e с различными визуальными и физическими сдвигами

Почему это важно

Робототехнические системы часто работают в различных условиях, разные помещения, разное освещение, разное оборудование. Если адаптация к каждому новому условию требует сбора десятков новых примеров и часов переобучения, это делает развёртывание систем экономически нецелесообразным и медленным. DART показывает, что векторная арифметика весов может быть эффективным инструментом для быстрой адаптации с минимальным сбором новых данных. Это открывает путь к гибким и практичным робототехническим системам, которые легко адаптируются к новым условиям.

Кому это важно

Исследователям и инженерам в робототехнике и компьютерном зрении. Компаниям, развёртывающим роботов в различных местах и условиях (логистика, производство, бытовая робототехника). Разработчикам VLA-моделей, которые хотят повысить практическую применимость своих систем. Командам машинного обучения, работающим над эффективной адаптацией моделей к новым доменам.

Как это применить

DART встраивается в конвейер адаптации при развёртывании VLA-модели в новое окружение. Процесс: собрать одну видео-демонстрацию нужного поведения в новых условиях, применить алгоритм выравнивания подпространств к весовым векторам уже обученной модели, добавить специфичную для нового домена информацию через арифметические операции. Открытый код на GitHub позволяет встроить DART в собственные системы. Метод работает как в симуляторе, так и с реальными роботами.

Можно ли доверять

DART, это peer-reviewed исследование, опубликованное группой из Seoul National University (SnuMPL Lab). Результаты подтверждены как экспериментами в симуляции, так и реальными опытами с промышленными робот-манипуляторами. Тестировались различные сценарии: смена угла камеры, переход между разными типами роботов. Код открыт, что позволяет сообществу независимо проверить результаты. Однако это исследовательская работа, и практическое применение в промышленных системах ещё не подтверждено независимо.

Риски и подводные камни

Метод требует, чтобы исходная VLA-модель была хорошо обучена на похожих сценариях; для совершенно новых типов окружений одной демонстрации может быть недостаточно. Выравнивание подпространств требует вычислительных затрат, хотя и меньших, чем полное переобучение. Результаты показаны на конкретных роботах и типах сдвигов; обобщение на более необычные системы требует дополнительной проверки. Как и все методы адаптации, DART работает лучше всего, когда новое окружение находится на близком расстоянии от обучающего распределения.

«В отличие от предыдущих подходов, DART требует сбора только одной демонстрации, обеспечивая эффективную адаптацию.»

— авторы DART