ИИ станет настоящим коллегой, когда начнёт заканчивать задачи вместо ответов

Исследовательская группа из Tencent Youtu Lab и нескольких китайских университетов опубликовала обзор, описывающий переход «от чатбота к цифровому коллеге» по двум измерениям: эволюция когнитивного ядра и инструментально-ориентированное выполнение задач.

В эру чатботов модели генерировали текст быстро, опираясь на параметры и выполняя цепь токенов в один проход без проверки промежуточных шагов. Эра thinking-моделей (инициирована OpenAI o1 и Deepseek-R1) переносит вычисления в фазу рассуждения: модели строят длинные цепочки мыслей, проверяют промежуточные результаты и через reinforcement learning учатся самокоррекции.

Первое поколение агентов могло вызывать API, писать код и просматривать веб, но оставалось хрупким: видело окружение фрагментарно, не сохраняло состояние между вызовами инструментов, ломалось при неожиданном поведении, редко доводило задачи до конца.

Прорыв приходит с OpenClaw: окружение становится перманентным. Файлы, сессии, логи, браузеры, права доступа и навыки (skills) сохраняются на протяжении всего цикла работы. Исследователи ссылаются на OpenHands и SWE-agent как примеры агентов, встроенных в контролируемые среды разработки.

Ключевой аргумент: комбинация workspace (рабочей среды) и skills (переиспользуемых операционных знаний), это то, что дает реальный скачок производительности. Workspace обеспечивает состояние, хранилище и консеквенции; skill упаковывает операционное знание в модульные, тестируемые, переносимые пакеты. Anthropic Agent Skills уже формализует этот паттерн как папки со SKILL.md, скриптами и ресурсами.

Навыки, это не промпты и не традиционные инструменты, они сидят между рассуждениями модели и выполнением в workspace, позволяя организациям фиксировать знания. Но авторы предупреждают: переиспользуемые процедуры могут устаревать, переобучаться на конкретные рабочие потоки или становиться векторами атак.

Оценка и обучение меняются: чатботы учились на парах инструкция-ответ и оценивались по точности ответа, workspace-системы учатся на траекториях состояние-действие-наблюдение. Успех теперь, не правдоподобный ответ, а замыкание задачи: привела ли система целевое окружение в проверяемое конечное состояние. Бенчмарки вроде SWE-bench, OSWorld, WebArena требуют воспроизводимых начальных состояний, исполняемых инструментов, логов траекторий и проверок конечного состояния. GPT-4 вначале завершил только 14% задач WebArena.

Безопасность становится операционной проблемой: агенты в постоянных средах держат учётные данные, локальные файлы, токены идентификации, каналы коммуникации. Проекты вроде OpenClaw PRISM и ClawGuard пытаются установить разрешения, отслеживание происхождения, аудит-логи как рантайм-защиты. Требуется управление жизненным циклом навыков, гигиена workspace, контроль разрешений, sandbox, откаты, оценка на основе траекторий. Переиспользование без управления создаёт новые режимы отказа.

Ключевые факты

Переход от моделей, генерирующих ответы за один проход, к thinking-LLM (o1, Deepseek-R1), которые выполняют slow reasoning с проверкой промежуточных результатов
Первые агенты (API-вызовы, код, браузинг) были хрупкими; OpenClaw era вводит постоянные рабочие среды, где файлы, сессии, логи и rights сохраняются
Ключевой паттерн: workspace + skills (переиспользуемые пакеты знаний, типа Anthropic Agent Skills) вместе дают скачок производительности, но требуют управления жизненным циклом
Оценка переходит с точности ответов (instruction-response пары) на замыкание задач (state-action-observation траектории); GPT-4 решает 14% реальных задач WebArena
Security расширяется: агенты в постоянных средах держат credentials, files, tokens; требуются permissions, provenance tracking, audit logs, sandboxing, workspace hygiene

Почему это важно

Современные ИИ-ассистенты застревают в режиме вопрос-ответ и не доводят сложные задачи до конца. Исследование показывает, что переход к постоянным рабочим средам с переиспользуемыми навыками, это не просто улучшение, а принципиальный сдвиг в архитектуре. Это определит, станет ли ИИ надёжным рабочим инструментом или останется интерактивным помощником. Масштабирование требует не лучших ответов, а гарантированного замыкания задач.

Кому это важно

Разработчикам ИИ-систем, которые строят агентов (от стартапов вроде OpenHands до крупных компаний типа Anthropic); инженерам и архитекторам, проектирующим системы с долгоживущими процессами; компаниям, которые хотят автоматизировать многошаговые workflow; исследователям в области АГИ, изучающим переход от узконаправленных помощников к универсальным партнёрам.

Как это применить

Если вы строите агент, начните с постоянной рабочей среды (файлы, сессии, логи, права), а не с отдельных API-вызовов. Упакуйте операционное знание в модульные, тестируемые skills, как Anthropic Agent Skills (папка со SKILL.md, скриптами, ресурсами). Оценивайте не на точность отдельных ответов, а на замыкание полного цикла задачи; используйте траектории состояния-действия-наблюдения. Внедрите контроль разрешений, аудит-логи и sandbox, чтобы управлять risks в долгоживущей среде.

Можно ли доверять

Статья опирается на рецензируемое исследование (survey paper) группы уважаемых академических и промышленных организаций (Tencent Youtu Lab, китайские университеты). Утверждения подкреплены примерами из реальных систем (OpenHands, SWE-agent, Anthropic Agent Skills, OpenClaw) и бенчмарков (SWE-bench, WebArena). Упомянутые числа (14% на WebArena, 79% на Vercel evaluation, 56% не используют skill system) базируются на опубликованных экспериментах. Авторы честно признают, что workspace+skills, не полное решение и требует дополнительного управления.

Риски и подводные камни

Skills могут устаревать и переобучаться на конкретные рабочие потоки, теряя универсальность. Постоянные рабочие среды расширяют attack surface: агенты хранят credentials, токены, имеют доступ к внутренним документам. Governance без строгого управления создаёт новые режимы отказа. Workspace могут заполняться stale files и broken artifacts. Переиспользование без lifecycle-управления, sandbox, rollback и trajectory-оценки становится источником новых уязвимостей. Требуется также переосмысление, как обучать и оценивать такие системы, старые метрики (accuracy на answer-pairs) неприменимы.

«Надёжное развёртывание, утверждают исследователи, требует управления жизненным циклом навыков, гигиены рабочей среды, контроля разрешений, sandbox, откатов и оценки на основе траекторий. Переиспользование без управления просто создаёт новые режимы отказа.»

— Исследовательская группа Tencent Youtu Lab и китайских университетов