ИИ станет настоящим коллегой, когда начнёт заканчивать задачи вместо ответов

ИИ станет настоящим коллегой, когда начнёт заканчивать задачи вместо ответов

Исследовательская группа из Tencent Youtu Lab и нескольких китайских университетов опубликовала обзор, описывающий переход «от чатбота к цифровому коллеге» по двум измерениям: эволюция когнитивного ядра и инструментально-ориентированное выполнение задач.

В эру чатботов модели генерировали текст быстро, опираясь на параметры и выполняя цепь токенов в один проход без проверки промежуточных шагов. Эра thinking-моделей (инициирована OpenAI o1 и Deepseek-R1) переносит вычисления в фазу рассуждения: модели строят длинные цепочки мыслей, проверяют промежуточные результаты и через reinforcement learning учатся самокоррекции.

Первое поколение агентов могло вызывать API, писать код и просматривать веб, но оставалось хрупким: видело окружение фрагментарно, не сохраняло состояние между вызовами инструментов, ломалось при неожиданном поведении, редко доводило задачи до конца.

Прорыв приходит с OpenClaw: окружение становится перманентным. Файлы, сессии, логи, браузеры, права доступа и навыки (skills) сохраняются на протяжении всего цикла работы. Исследователи ссылаются на OpenHands и SWE-agent как примеры агентов, встроенных в контролируемые среды разработки.

Ключевой аргумент: комбинация workspace (рабочей среды) и skills (переиспользуемых операционных знаний), это то, что дает реальный скачок производительности. Workspace обеспечивает состояние, хранилище и консеквенции; skill упаковывает операционное знание в модульные, тестируемые, переносимые пакеты. Anthropic Agent Skills уже формализует этот паттерн как папки со SKILL.md, скриптами и ресурсами.

Навыки, это не промпты и не традиционные инструменты, они сидят между рассуждениями модели и выполнением в workspace, позволяя организациям фиксировать знания. Но авторы предупреждают: переиспользуемые процедуры могут устаревать, переобучаться на конкретные рабочие потоки или становиться векторами атак.

Оценка и обучение меняются: чатботы учились на парах инструкция-ответ и оценивались по точности ответа, workspace-системы учатся на траекториях состояние-действие-наблюдение. Успех теперь, не правдоподобный ответ, а замыкание задачи: привела ли система целевое окружение в проверяемое конечное состояние. Бенчмарки вроде SWE-bench, OSWorld, WebArena требуют воспроизводимых начальных состояний, исполняемых инструментов, логов траекторий и проверок конечного состояния. GPT-4 вначале завершил только 14% задач WebArena.

Безопасность становится операционной проблемой: агенты в постоянных средах держат учётные данные, локальные файлы, токены идентификации, каналы коммуникации. Проекты вроде OpenClaw PRISM и ClawGuard пытаются установить разрешения, отслеживание происхождения, аудит-логи как рантайм-защиты. Требуется управление жизненным циклом навыков, гигиена workspace, контроль разрешений, sandbox, откаты, оценка на основе траекторий. Переиспользование без управления создаёт новые режимы отказа.

Ключевые факты

  • Переход от моделей, генерирующих ответы за один проход, к thinking-LLM (o1, Deepseek-R1), которые выполняют slow reasoning с проверкой промежуточных результатов
  • Первые агенты (API-вызовы, код, браузинг) были хрупкими; OpenClaw era вводит постоянные рабочие среды, где файлы, сессии, логи и rights сохраняются
  • Ключевой паттерн: workspace + skills (переиспользуемые пакеты знаний, типа Anthropic Agent Skills) вместе дают скачок производительности, но требуют управления жизненным циклом
  • Оценка переходит с точности ответов (instruction-response пары) на замыкание задач (state-action-observation траектории); GPT-4 решает 14% реальных задач WebArena
  • Security расширяется: агенты в постоянных средах держат credentials, files, tokens; требуются permissions, provenance tracking, audit logs, sandboxing, workspace hygiene

Почему это важно

Современные ИИ-ассистенты застревают в режиме вопрос-ответ и не доводят сложные задачи до конца. Исследование показывает, что переход к постоянным рабочим средам с переиспользуемыми навыками, это не просто улучшение, а принципиальный сдвиг в архитектуре. Это определит, станет ли ИИ надёжным рабочим инструментом или останется интерактивным помощником. Масштабирование требует не лучших ответов, а гарантированного замыкания задач.

Кому это важно

Разработчикам ИИ-систем, которые строят агентов (от стартапов вроде OpenHands до крупных компаний типа Anthropic); инженерам и архитекторам, проектирующим системы с долгоживущими процессами; компаниям, которые хотят автоматизировать многошаговые workflow; исследователям в области АГИ, изучающим переход от узконаправленных помощников к универсальным партнёрам.

Как это применить

Если вы строите агент, начните с постоянной рабочей среды (файлы, сессии, логи, права), а не с отдельных API-вызовов. Упакуйте операционное знание в модульные, тестируемые skills, как Anthropic Agent Skills (папка со SKILL.md, скриптами, ресурсами). Оценивайте не на точность отдельных ответов, а на замыкание полного цикла задачи; используйте траектории состояния-действия-наблюдения. Внедрите контроль разрешений, аудит-логи и sandbox, чтобы управлять risks в долгоживущей среде.

Можно ли доверять

Статья опирается на рецензируемое исследование (survey paper) группы уважаемых академических и промышленных организаций (Tencent Youtu Lab, китайские университеты). Утверждения подкреплены примерами из реальных систем (OpenHands, SWE-agent, Anthropic Agent Skills, OpenClaw) и бенчмарков (SWE-bench, WebArena). Упомянутые числа (14% на WebArena, 79% на Vercel evaluation, 56% не используют skill system) базируются на опубликованных экспериментах. Авторы честно признают, что workspace+skills, не полное решение и требует дополнительного управления.

Риски и подводные камни

Skills могут устаревать и переобучаться на конкретные рабочие потоки, теряя универсальность. Постоянные рабочие среды расширяют attack surface: агенты хранят credentials, токены, имеют доступ к внутренним документам. Governance без строгого управления создаёт новые режимы отказа. Workspace могут заполняться stale files и broken artifacts. Переиспользование без lifecycle-управления, sandbox, rollback и trajectory-оценки становится источником новых уязвимостей. Требуется также переосмысление, как обучать и оценивать такие системы, старые метрики (accuracy на answer-pairs) неприменимы.

«Надёжное развёртывание, утверждают исследователи, требует управления жизненным циклом навыков, гигиены рабочей среды, контроля разрешений, sandbox, откатов и оценки на основе траекторий. Переиспользование без управления просто создаёт новые режимы отказа.»

— Исследовательская группа Tencent Youtu Lab и китайских университетов