Show HN: Интеллектуальная маршрутизация моделей прямо в Claude, Codex и Cursor

Show HN: Интеллектуальная маршрутизация моделей прямо в Claude, Codex и Cursor

Weave запустила инструмент Smart Model Router, drop-in прокси-сервер для интеграции с Claude Code, Codex, Cursor и другими приложениями. Роутер анализирует каждый запрос с помощью встроенного (on-box) эмбеддера и выбирает лучшую модель из подключенных провайдеров (Anthropic Claude, OpenAI, Google Gemini) автоматически, без эвристик.

Основные возможности:

  • Маршрутизация по запросам: специальный скорер на основе Avengers-Pro 1 выбирает оптимальную модель на каждый ход.
  • Поддержка нескольких API: native интеграция с Anthropic Messages, OpenAI Chat Completions, Gemini, включая стриминг, инструменты и обработку изображений.
  • Поддержка open-source моделей: DeepSeek, Kimi, GLM, Qwen, Llama, Mistral через OpenRouter или любой OpenAI-совместимый эндпоинт.
  • Безопасность: ключи провайдеров хранятся локально, зашифрованы в покое.
  • Наблюдаемость: встроенные OTLP traces, видны через Weave-дашборд или отправляются в Honeycomb, Datadog, Grafana.

Установка: быстрый путь через npx @workweave/router для Claude Code, Codex или opencode с интерактивным конфигуратором. Альтернатива, self-hosted через Docker (localhost:8080, требует Postgres). Роутер говорит как Anthropic и OpenAI API одновременно: один эндпоинт для всех форматов запросов. Для Cursor требуется переопределение базового URL в Settings → Models. Компания Weave позиционирует себя как платформу инженерной аналитики (используют Robinhood, PostHog, Reducto).

Ключевые факты

  • Автоматический выбор модели на основе анализа каждого запроса (не правила), используя встроенный скорер Avengers-Pro
  • Единый прокси-эндпоинт работает со всеми основными API (Anthropic, OpenAI, Gemini) и open-source моделями через OpenRouter
  • Easy integration: npx установщик для Claude Code, Codex, Cursor; self-hosted вариант на localhost:8080
  • Встроенная телеметрия (OTLP) с дашбордом и экспортом в Honeycomb/Datadog/Grafana
  • Ключи провайдеров хранятся локально, зашифрованы, не отправляются в облако

Почему это важно

В разработке ML и AI приложений сложность выбора правильной модели растёт: Claude лучше для рассуждений, GPT-4o для скорости, Gemini для бюджета, open-source Llama для приватности. Ручной переключение между провайдерами неудобно и неоптимально. Роутер автоматизирует эту задачу через встроенный ML-скорер (Avengers-Pro), что позволяет приложениям всегда использовать лучшую модель для конкретного запроса и одновременно снижает затраты через балансировку между дорогими и дешёвыми вариантами.

Кому это важно

Разработчикам Claude Code, Codex и Cursor, которые хотят гибкости в выборе моделей. Компаниям, использующим несколько провайдеров (multi-cloud стратегия). Teams, беспокоящимся о приватности данных и готовым к self-hosted решениям. AI-инженерам и платформ-командам, которым нужна телеметрия на уровне production.

Как это применить

Для Claude Code: npx @workweave/router запускает интерактивный установщик. Для self-hosted: клонировать репо, добавить API ключ в .env.local (OpenRouter рекомендуется как baseline), запустить make full-setup (поднимает Postgres + роутер на 8080). Для Cursor: Settings → Models → Override OpenAI Base URL → http://localhost:8080/v1, вставить router key как API key. После установки команды npx @workweave/router on/off переключают маршрутизацию включение/выключение без удаления конфига.

Можно ли доверять

Проект от Weave, коммерческой платформы с клиентами (Robinhood, PostHog), open-source на GitHub. Исходный код доступен для аудита.架构 говорит правильно о безопасности (BYOK, local encryption). Routers с ML-скорингом, реальный research тренд (Avengers-Pro на arXiv), не маркетинговая выдумка. Однако production-готовность раннего кода неясна (Cursor-интеграция помечена как early beta).

Риски и подводные камни

Self-hosted требует Postgres и управления инфраструктурой. Встроенный эмбеддер (on-box scorer) может быть узким местом на высоких нагрузках. Выбор модели через ML означает непредсказуемость маршрутизации: один и тот же запрос может пойти в разные модели (может быть фичей или проблемой в зависимости от use case). Отсутствие гарантий SLA на качество маршрутизации. Cursor-интеграция в статусе 'early beta' = нестабильна.

«Одна точка подключения. Каждая модель. Всегда правильная.»

— Tagline роутера (перевод: One endpoint. Every model. Always the right one.)