Токенмаксинг вернулся: почему компании опять будут тратить на ИИ без меры

Токенмаксинг вернулся: почему компании опять будут тратить на ИИ без меры

Токенмаксинг, явление, когда корпорации через метрики по использованию токенов подталкивали сотрудников тратить на ИИ без смысла, считался мёртв. Причина проста: когда OpenAI и Anthropic подняли цены на API, а субсидии кончились, ROI исчез.

Но автор Амол из Noria AI указывает на более глубокую динамику. Во-первых, токенмаксинг был нужен как инструмент переломить сопротивление сотрудников внедрению ИИ несколько месяцев назад, когда старшие специалисты отказывались работать с новыми инструментами. Метрики выполнили свою роль: теперь почти все используют ИИ-кодировщики.

Во-вторых, появилась новая экономика: «compounding correctness» (нарастающая корректность). Раньше дольше работавшие агенты накапливали ошибки и галлюцинации, делая результат хуже, поэтому потратить больше токенов было невыгодно. Теперь модели достаточно сильны, чтобы каждая дополнительная итерация улучшала результат. Это переворачивает расчёты.

Примеры уже видны: в кибербезопасности Anthropic's Mythos находила эксплойты при бюджетах в 100М токенов (~$12 500 на попытку) и продолжала прогрессировать без признаков убывающей отдачи. Компании начинают массово внедрять «loops» (агенты, рестартующие сами до нужного результата). Автор предупреждает: хотя открытые модели могут стать экономичнее, окончательный результат остаётся прежним, тратить больше токенов в целях, чем враг.

Ключевые факты

  • Токенмаксинг был инструментом преодоления организационного сопротивления ИИ, а не просто расточительностью
  • Динамика изменилась: раньше больше токенов = хуже результаты (ошибки компаундились), теперь наоборот, больше итераций = лучше выход
  • Antropic's Mythos при 100М токенов на попытку по-прежнему находит новые уязвимости без признаков убывающей отдачи
  • Новые инструменты (Claude Code, loops) делают непрерывный запуск агентов более доступным и привлекательным
  • Два типа токенмаксинга: на разработчиков (Claude Code в sidebar) vs на конвейеры (дешевые агенты-замены детерминированного кода), второй неэффективен

Почему это важно

Сдвиг в экономике ИИ вовсе не случаен, это решающая границa в применении агентов. Когда каждый дополнительный токен приносит измеримый прирост, инвестиции в ИИ становятся стратегическими, а не трендовыми. Кроме того, это объясняет странные решения крупных компаний (Meta, Google): они не были глупы, они ломали сопротивление организационной культуры перед новым инструментом. Понимание этого нюанса важно для любого лидера, планирующего внедрение ИИ.

Кому это важно

Разработчикам, которые уже используют Claude Code и подобные инструменты, увеличение лимитов и цены станут ещё выше, и это будет оправданным. CTO и VP Engineering, планирующим инвестиции в ИИ-инфраструктуру. Компаниям, предложившим дешёвые агент-конвейеры на базе ИИ для автоматизации, многим грозит переревалюация ROI в сторону убытков, потому что детерминированный код окупается лучше.

Как это применить

Различи два типа расходов на токены: токены для разработчиков (инструменты вроде Claude Code, loops) почти всегда окупаются через производительность. Токены для агент-конвейеров имеют смысл только если агент надежнее и дешевле, чем альтернатива. Если ты строишь агента, убедись, что его задача действительно требует non-deterministic подхода, а не просто обходит нормальный код. Рассчитывай бюджет в токенах через неск. итераций, а не одно предположение, и закладывай запас на улучшение качества через loops.

Можно ли доверять

Автор опирается на наблюдения за реальными командами и реальную схему, как работает Mythos. Примеры конкретны: половина текста посвящена разбору двух видов токенмаксинга на производстве. Однако статья, мнение, а не исследование или данные. Цифры про Mythos ($12 500, 100М токенов, отсутствие убывающей отдачи) взяты из официального AISI доклада, что повышает надёжность. Прогнозы про будущее (что компании вернутся к высоким расходам) логичны, но не гарантированы.

Риски и подводные камни

Компании могут слишком оптимистично оценить переход на loops и потратить на инфраструктуру без гарантии результата. Мессидж про «платить больше токенов = выигрывать в безопасности» может привести к ненужным расходам, если конкурент просто не ищет уязвимости или имеет другую атаку-вектор. Открытые модели, если кривая улучшения будет крутой, могут опрокинуть калькуляцию за счёт стоимости (5x дешевле за 1.05x отдачи × 5 = лучше, чем платная модель). Ещё риск: привычка к агентам может заслепить разработчиков и они переведут на них даже детерминированные задачи, где это не нужно.

«Если Mythos продолжает находить уязвимости столько, сколько ты на неё тратишь, безопасность сводится к простому уравнению: чтобы укрепить систему, тебе нужно потратить больше токенов на поиск уязвимостей, чем потратит нападающий на их использование.»

— Амол Шах, Noria AI