AI 资讯Hacker News·2 小时前

Show HN：在 Claude、Codex 和 Cursor 中实现智能模型路由

原标题：Show HN: Smart model routing directly in Claude, Codex and Cursor

速览

该帖子展示了在 Claude、Codex 和 Cursor 等 AI 开发工具中直接集成智能模型路由的技术方案。这一功能允许开发者根据任务需求动态选择最合适的模型，从而优化性能与成本。此举提升了多模型协作的灵活性和效率。

AI 深度解读

Show HN: 在 Claude、Codex 和 Cursor 中直接实现智能模型路由

背景

随着大语言模型（LLM）生态的碎片化，开发者面临着“模型选择困难症”。不同的模型在特定任务上表现各异，且成本差异巨大。传统的解决方案往往依赖复杂的提示词工程（Prompt Engineering）或外部代理来动态选择模型，但这通常缺乏精确度，且增加了系统延迟和运维复杂度。

Weave 作为领先的工程智能平台（被 Robinhood、PostHog 等公司采用），推出了一款名为 Weave Router 的工具。它旨在解决这一痛点：提供一个即插即用的代理层，能够根据请求内容自动选择最佳的底层模型提供商（Anthropic、OpenAI、Gemini 等）及具体模型。该工具在 RouterArena 排行榜上以 76.09 的 Acc-Cost 得分位居第一，证明了其在准确率与成本平衡上的有效性。

核心内容

Weave Router 的核心设计理念是“一个端点，所有模型，始终正确”。它不仅仅是一个简单的流量转发器，而是一个具备智能决策能力的路由层。

1. 智能路由机制

该路由器不再依赖基于“感觉”（vibes-based）的提示词来猜测该用哪个模型，而是使用一个轻量级的本地嵌入模型（on-box embedder）结合 Avengers-Pro 集群评分器。Avengers-Pro 是一种通过性能与效率优化路由来提升 LLM 效果的技术（参考 Zhang, Y. et al. 的研究）。这意味着对于每一个请求，路由器都能实时分析上下文，从已启用的提供商集群中选出性价比最高、能力最匹配的模型。

2. 广泛的兼容性与 API 支持

原生协议支持：完美兼容 Anthropic Messages API、OpenAI Chat Completions API 以及 Gemini 原生接口。
功能全覆盖：支持流式传输（Streaming）、工具调用（Tools）、视觉理解（Vision）等高级功能。
开源模型支持：除了商业模型，还通过 OpenRouter 或任何兼容 OpenAI 的端点支持 DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等开源模型。

3. 安全与可观测性

BYOK (Bring Your Own Key)：默认支持自带密钥。提供商的 API 密钥仅存储在本地机器上，并在静止状态下加密，确保密钥不离开用户环境。
开箱即用的可观测性：内置 OTLP（OpenTelemetry Protocol）追踪支持。用户可以直接在 Weave 提供的本地仪表板（http://localhost:8080/ui/dashboard）查看数据，也可以无缝对接 Honeycomb、Datadog、Grafana 等第三方监控平台。

4. 极简部署与集成方式

Weave Router 提供了多种部署和集成路径，旨在最小化开发者的配置负担：

快速启动（Hosted）：只需一条命令即可启动托管版路由器，无需克隆代码、Docker 或 Postgres。
```
npx @workweave/router
```
安装程序会引导用户选择工具（Claude Code, Codex, 或 opencode），配置作用域（用户级或项目级），并获取路由器密钥。
本地自托管（Self-hosted）：对于需要更高控制权的用户，可以通过 make full-setup 启动本地 Postgres 数据库和路由器。
- 需要在 .env.local 中配置上游提供商密钥（推荐 OpenRouter）。
- 启动后，路由器监听 localhost:8080，仪表板位于 http://localhost:8080/ui/（默认密码 admin）。
- 生成的 rk_... 密钥将打印在日志中，用于客户端认证。
主流 AI 工具集成：
- Claude Code：通过 make install-cc 或 npx @workweave/router --claude 自动配置。
- Codex (OpenAI CLI)：通过 npx @workweave/router --codex 修改 ~/.codex/config.toml，注入 weave 模型提供商配置。原有的 OPENAI_API_KEY 仍用于计划内透传，路由器密钥通过 HTTP 头 X-Weave-Router-Key 传递。
- opencode：通过 npx @workweave/router --opencode 合并配置到 opencode.json，利用其内置的 Anthropic 提供商指向路由器端点。
- Cursor：处于早期测试阶段。需在设置中覆盖 OpenAI Base URL 为 http://localhost:8080/v1 并填入路由器密钥。

5. 灵活的控制与配置

开关控制：安装后，可通过 npx @workweave/router off --claude 临时禁用路由，使客户端直接连接上游提供商，而不删除配置。on 命令可恢复路由。Claude Code 还支持 /router-off 等斜杠命令。
密钥区分：
- sk-or-... / sk-ant-... / sk-...：上游提供商密钥，存储在 .env.local。
- rk_...：路由器密钥，客户端作为 Bearer Token 发送。

关键要点

性能领先：在 RouterArena 排行榜上以 76.09 的 Acc-Cost 得分位列第一，证明了其路由策略在准确率与成本之间的优越平衡。
本地智能决策：使用本地嵌入模型和 Avengers-Pro 评分器，而非模糊的提示词工程，实现每请求级别的精准模型选择。
零侵入集成：通过 npx 命令即可为 Claude Code、Codex、opencode 和 Cursor 提供配置补丁，自动管理配置文件，保留原有设置。
企业级安全：默认 BYOK 模式，密钥本地加密存储；支持 OpenRouter 及各类兼容 OpenAI 的端点，包括众多开源模型。
全链路可观测：内置 OTLP 追踪，支持对接主流 APM 工具，让路由决策过程透明化。
低门槛部署：提供“一键托管”和“本地自托管”两种模式，前者无需数据库依赖，后者支持完整的功能定制。
细粒度控制：支持用户级或项目级（per-repo）的配置隔离，以及随时启用的路由开关功能。

意义与影响

Weave Router 的出现标志着 LLM 应用开发从“单模型依赖”向“多模型编排”演进的关键一步。

降低开发复杂度：开发者无需在代码中硬编码模型选择逻辑，也无需维护复杂的路由中间件。通过简单的代理配置，即可享受动态模型调优带来的红利。
优化成本与性能：通过智能路由，简单任务可路由至低成本模型，复杂任务路由至高性能模型，从而在保证质量的同时显著降低 API 调用成本。
增强系统韧性：支持多提供商和开源模型，避免了单一供应商锁定（Vendor Lock-in）风险，并在某个提供商服务中断时提供潜在的故障转移能力。
推动工程智能化：将“模型路由”这一通常由后端工程师处理的任务，下沉为开发者日常工具链的一部分（如 IDE 插件或 CLI 工具），使得智能路由成为 AI 辅助编程的标准基础设施。

对于使用 Claude Code、Cursor 或 OpenAI Codex 的开发者而言，Weave Router 提供了一个无需重构代码即可提升开发体验和降低成本的实用工具。

查看原文 →github.com