Superpowers 6: разработка на 50% быстрее и на 60% дешевле

Superpowers, платформа для разработки, где ИИ-агенты полностью управляют процессом написания кода: планирование, реализация, тестирование, код-ревью. Версия 6 значительно оптимизирована по затратам и скорости. На тестовых случаях Anthropic время выполнения сократилось на 50%, токены, на 60% без потери качества.

Оптимизация шла в два этапа. Сначала команда готовила 5.2 с поддержкой новых агентов (Pi, Antigravity, Kimi Code, Cursor, Codex, OpenCode) и исправлениями ошибок. Затем они получили доступ к модели Fable от Anthropic и решили её использовать для системной оптимизации.

Ключевые улучшения:

Объединение ревьюеров. Раньше код и спецификация проверялись отдельными агентами. Теперь один ревьюер проверяет оба аспекта, снизив использование токенов на 15%.
Подготовка пакета для ревью. Вместо того чтобы ревьюер заново собирал диффы и метаданные через git, система предварительно генерирует отформатированный пакет. Это сэкономило 10% токенов и времени.
Условный выбор моделей. Система научилась выбирать лёгкие модели (Haiku) для простых задач и мощные (Opus) для сложных. Экономия ~$0.5, 1 за запуск.
Более тесные инструкции для ревьюера. Чёткий контракт с ревьюером сократил объём его вывода на 41% без потери качества вердиктов.

Для валидации команда запустила автоматизированный цикл исследований с 25 экспериментами, где Fable предлагала гипотезы, код и проверяла результаты. Цикл выявил неожиданное: ограничение времени размышления контроллера не экономит токены, а наоборот увеличивает их и качество падает.

Superpowers 6 доступна с GitHub (https://github.com/obra/superpowers) и будет добавлена в маркетплейсы плагинов в течение нескольких дней. Компания ищет инженера для работы над сообществом вокруг Superpowers.

Ключевые факты

Superpowers 6 работает на 50% быстрее и использует на 60% меньше токенов чем предыдущая версия без потери качества
Основная оптимизация, объединение агентов для code review и spec compliance проверок; сокращение токенов на 15%
Команда использовала Fable для автоматизированного цикла исследований: 25 экспериментов, гипотезы и проверка через ночь
Улучшения включают условный выбор моделей по сложности задачи и подготовку review пакетов без лишних git команд
Система научилась различать, когда лёгкие модели справляются хорошо, а когда нужны мощные, это критично для оптимизации

Почему это важно

Самая частая жалоба пользователей Superpowers, дорогие токены и медленная разработка. Платформа работает тщательно: глубокое планирование, TDD, двухосный ревью каждого изменения, что обеспечивает качество, но требует ресурсов. Версия 6 решает эту дилемму: сохраняет строгий процесс, но убирает избыточность в инструкциях агентам и их взаимодействии. На 50% быстрее, это ощутимо для разработчиков, на 60% дешевле, это существенно для использования в production.

Кому это важно

Разработчикам и организациям, использующим Superpowers для автоматизированной разработки, особенно тем, кто встречается с высокой стоимостью API токенов. Компаниям, которые развёртывают AI-агентов для кода (Cursor, Codex, Pi и др.) и ищут способ делать это эффективнее. Интегратором AI инструментов, которые балансируют между качеством и затратами.

Как это применить

Обновить Superpowers до версии 6 с GitHub репозитория. Новая версия совместима с популярными агентами (Cursor, Codex, OpenCode, Pi и др.) и различными фреймворками. Разработчикам рекомендуется пересчитать ROI использования Superpowers, на 60% меньше токенов может означать, что платформа теперь выгодна для проектов, где раньше казалась дорогой. Для организаций: пересчёт бюджета на AI-разработку.

Можно ли доверять

Результаты подкреплены собственным eval suite Superpowers, набором тестов через множество агентов и фреймворков, собранных командой специально для измерения производительности. Компания показала дефекты в собственных измерениях (обнаружила ошибки в grep, harness, regex), что свидетельствует о добросовестности. Улучшения перепроверены на Codex и других агентах и держат результаты. Исходный код доступен на GitHub.

Риски и подводные камни

Один риск, обнаруженный во время исследований: если ревьюер получает только упакованный диф без полного контекста, он может самостоятельно переопределить требования (spec), упустив ключевые детали. Это требует внимания при настройке инструкций для новых типов задач. Результаты основаны на тестовых случаях Anthropic, реальная эффективность на production кодбейсе может варьироваться. Быстрая разработка требует хорошей изоляции тестов и изоляции окружения, иначе будут ложные положительные результаты (как произошло в первых запусках на Codex).