Show HN: Интеллектуальная маршрутизация моделей прямо в Claude, Codex и Cursor

Weave запустила инструмент Smart Model Router, drop-in прокси-сервер для интеграции с Claude Code, Codex, Cursor и другими приложениями. Роутер анализирует каждый запрос с помощью встроенного (on-box) эмбеддера и выбирает лучшую модель из подключенных провайдеров (Anthropic Claude, OpenAI, Google Gemini) автоматически, без эвристик.
Основные возможности:
- Маршрутизация по запросам: специальный скорер на основе Avengers-Pro 1 выбирает оптимальную модель на каждый ход.
- Поддержка нескольких API: native интеграция с Anthropic Messages, OpenAI Chat Completions, Gemini, включая стриминг, инструменты и обработку изображений.
- Поддержка open-source моделей: DeepSeek, Kimi, GLM, Qwen, Llama, Mistral через OpenRouter или любой OpenAI-совместимый эндпоинт.
- Безопасность: ключи провайдеров хранятся локально, зашифрованы в покое.
- Наблюдаемость: встроенные OTLP traces, видны через Weave-дашборд или отправляются в Honeycomb, Datadog, Grafana.
Установка: быстрый путь через npx @workweave/router для Claude Code, Codex или opencode с интерактивным конфигуратором. Альтернатива, self-hosted через Docker (localhost:8080, требует Postgres). Роутер говорит как Anthropic и OpenAI API одновременно: один эндпоинт для всех форматов запросов. Для Cursor требуется переопределение базового URL в Settings → Models. Компания Weave позиционирует себя как платформу инженерной аналитики (используют Robinhood, PostHog, Reducto).
Ключевые факты
- Автоматический выбор модели на основе анализа каждого запроса (не правила), используя встроенный скорер Avengers-Pro
- Единый прокси-эндпоинт работает со всеми основными API (Anthropic, OpenAI, Gemini) и open-source моделями через OpenRouter
- Easy integration: npx установщик для Claude Code, Codex, Cursor; self-hosted вариант на localhost:8080
- Встроенная телеметрия (OTLP) с дашбордом и экспортом в Honeycomb/Datadog/Grafana
- Ключи провайдеров хранятся локально, зашифрованы, не отправляются в облако
Почему это важно
В разработке ML и AI приложений сложность выбора правильной модели растёт: Claude лучше для рассуждений, GPT-4o для скорости, Gemini для бюджета, open-source Llama для приватности. Ручной переключение между провайдерами неудобно и неоптимально. Роутер автоматизирует эту задачу через встроенный ML-скорер (Avengers-Pro), что позволяет приложениям всегда использовать лучшую модель для конкретного запроса и одновременно снижает затраты через балансировку между дорогими и дешёвыми вариантами.
Кому это важно
Разработчикам Claude Code, Codex и Cursor, которые хотят гибкости в выборе моделей. Компаниям, использующим несколько провайдеров (multi-cloud стратегия). Teams, беспокоящимся о приватности данных и готовым к self-hosted решениям. AI-инженерам и платформ-командам, которым нужна телеметрия на уровне production.
Как это применить
Для Claude Code: npx @workweave/router запускает интерактивный установщик. Для self-hosted: клонировать репо, добавить API ключ в .env.local (OpenRouter рекомендуется как baseline), запустить make full-setup (поднимает Postgres + роутер на 8080). Для Cursor: Settings → Models → Override OpenAI Base URL → http://localhost:8080/v1, вставить router key как API key. После установки команды npx @workweave/router on/off переключают маршрутизацию включение/выключение без удаления конфига.
Можно ли доверять
Проект от Weave, коммерческой платформы с клиентами (Robinhood, PostHog), open-source на GitHub. Исходный код доступен для аудита.架构 говорит правильно о безопасности (BYOK, local encryption). Routers с ML-скорингом, реальный research тренд (Avengers-Pro на arXiv), не маркетинговая выдумка. Однако production-готовность раннего кода неясна (Cursor-интеграция помечена как early beta).
Риски и подводные камни
Self-hosted требует Postgres и управления инфраструктурой. Встроенный эмбеддер (on-box scorer) может быть узким местом на высоких нагрузках. Выбор модели через ML означает непредсказуемость маршрутизации: один и тот же запрос может пойти в разные модели (может быть фичей или проблемой в зависимости от use case). Отсутствие гарантий SLA на качество маршрутизации. Cursor-интеграция в статусе 'early beta' = нестабильна.
«Одна точка подключения. Каждая модель. Всегда правильная.»
— Tagline роутера (перевод: One endpoint. Every model. Always the right one.)