CUGA: 24 рабочих примера агентных приложений на лёгком фреймворке от IBM

CUGA (Configurable Generalist Agent), открытый фреймворк от IBM, который берёт на себя всю оркестрацию агентных приложений: цикл выполнения, управление состоянием, инструменты, выполнение кода. Разработчик определяет только доступные инструменты и системный промпт; всё остальное делает фреймворк. Сложные части вроде планирования, переменного отслеживания и самокоррекции встроены в ядро. CUGA поддерживает переключение моделей через переменные окружения (OpenAI, Anthropic, watsonx, Ollama), работает с инструментами MCP и LangChain, имеет встроенную систему политик безопасности (блокировка опасных команд через Intent Guard, Tool Approval, Output Formatter) и поддерживает делегирование между несколькими агентами. В репозитории cuga-apps собрано 24 полных примера в одном файле: советник архитектуры IBM Cloud, рекомендатель фильмов, анализ научных статей, веб-исследователь, браузерная автоматизация (Playwright), семиагентная система для обработки лидов. Фреймворк топит бенчмарки вроде AppWorld и WebArena благодаря встроенному механизму рефлексии, который ловит ошибки и перепланирует вместо того, чтобы продолжить с ошибкой. Концептуально это инверсия обычного подхода: вместо недель разработки инфраструктуры агент становится полезен сразу.

Ключевые факты

Фреймворк готов к продакшену: встроены планирование, рефлексия, переменное отслеживание, кроссовая проверка ошибок
Быстрый старт: агент создаётся четырьмя аргументами (модель, инструменты, промпт, папка состояния)
Гибкость: один промпт работает в режимах Fast, Balanced, Accurate; переключение модели, одна env-переменная
Безопасность встроена: системы политик блокируют опасные команды до их выполнения, без обёрток
Готовые примеры: 24 app в cuga-apps служат шаблонами для адаптации

Почему это важно

Разработка агентов сегодня требует недель рутины: выбор фреймворка, адаптеры инструментов, потоковая передача состояния, обработка ошибок. Только потом начинается интересная часть, логика самого агента. CUGA переворачивает приоритет: инфраструктура готова, разработчик пишет только специфику задачи. Это ускоряет прототипирование и снижает порог входа.

Кому это важно

Разработчикам, которые хотят быстро прототипировать агентные приложения. Компаниям, готовящим агентов к продакшену и нуждающимся в встроенной безопасности. Тем, кто работает в экосистеме FastAPI/Python и ценит простоту над гибкостью.

Как это применить

Клонируй cuga-apps, найди приложение, похожее на твою задачу, скопируй его структуру, отредактируй список инструментов (tools) и системный промпт (special_instructions). Инструменты берут либо из MCP-серверов (веб-поиск, Википедия, геокодирование), либо пишешь свои как Python-функции. Фреймворк автоматически превратит доксстринги инструментов в описания для агента. Для продакшена добавь политики безопасности (Intent Guard, Tool Approval) в конструктор агента.

Можно ли доверять

CUGA от IBM, результаты на бенчмарках (AppWorld, WebArena) выше, чем у ручной оптимизации. Открытый исходный код. Встроенные политики безопасности позволяют контролировать поведение агента. Однако полагаться стоит на хорошо написанный промпт: доксстринги инструментов и системные инструкции должны быть точными, иначе агент будет галлюцинировать.

Риски и подводные камни

Инструменты обязаны возвращать структурированный результат (success: {ok: true, data: ...}, failure: {ok: false, code, error}), иначе агент не сможет обработать ошибку. Промпт должен содержать явные правила (не выдумывай сервисы, не запускай опасные команды), потому что фреймворк не может угадать. На больших горизонтах (многошаговые задачи) агент может потерять контекст, несмотря на рефлексию. Не все 24 примера одинаково отточены, новичку лучше начать с cloud-advisor или movie-recommender.