AI 资讯雷峰网·4 小时前

Fable 5遭封杀，OpenRouter推多模型协作平替方案

原标题：Fable 5 刚被封杀，OpenRouter 用「多模型协作」搞出了「平替天团」

速览

Anthropic旗下Fable 5模型突遭封杀，OpenRouter迅速推出Fusion API作为替代方案。该服务通过多模型并行、裁判筛选及主笔合成的机制，实现“多模型协作”以复刻顶尖智力。实测数据显示，中端模型组合在DRACO基准测试中得分误差不足1%，且调用成本仅为原模型的一半。

AI 深度解读

背景

2026年6月14日，全球最大大模型 API 聚合平台 OpenRouter 发布了一项名为 Fusion API 的新产品，旨在通过“多模型协作”的方式，复刻当时全球最强 AI 模型 Claude Fable 5 的智力水平。这一举措恰逢其时：就在同周，Anthropic 发布了号称史上最强的模型 Claude Fable 5，该模型凭借强悍的长周期智能体推理能力，能将企业数月代码迁移工作缩短至一天。然而，发布仅 3 天，美国政府便签发紧急出口管制令，Anthropic 被迫切断全球网络并暂停 API 访问，导致市场出现巨大的供应真空。

OpenRouter 的 Fusion API 正是在这一背景下推出，它不依赖单一模型，而是通过让多个 AI 模型协同工作，对外统一提供一个 API 入口。其宣称的核心优势在于：通过组合 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 等模型，其综合智力得分误差不到被禁 Fable 5 的 1%，且调用成本仅为 Fable 5 的一半。

核心内容

Fusion API 的底层逻辑是将“多模型并行、裁判海选、终审合成”三步流程标准化。其具体运作机制如下：

专家团头脑风暴：用户提示词被同时派发给最多 8 个“专家模型”（包括 Fable 5、GPT-5.5、Gemini 3.1 Pro、GLM-5.2、Kimi K2.6 等）。为防止模型闭门造车，系统统一配备实时联网搜索与网页抓取工具，确保专家在交卷前能查阅最新参考资料。
裁判模型挑刺：指定一个“裁判”模型对所有专家的回答进行分析，撰写详细报告，指出意见一致处、矛盾点、出彩见解及盲点。
主笔模型定稿：主笔模型吸收专家优点，排除幻觉，产出逻辑顺畅的高质量回答。为避免延迟，裁判与主笔工作被整合在同一个超级大模型的一次思考中完成。

该架构源于学术界提出的多模型协同技术范式 MoA（Mixture of Agents）。OpenRouter 将其转化为商用 API，提供了两个关键机制：

透明控制权：用户可自定义评审模型、主裁判及模型权重，甚至指定国产模型挑大梁。
动态智能门控：简单问题由便宜模型秒回，仅复杂问题启动多模型协作，以优化成本。

在 Perplexity AI 发布的深度研究基准测试 DRACO 中，Fusion 表现优异。DRACO 包含法律、金融等 10 个领域的 100 道复杂任务，采用负分淘汰制。评测显示：

组合模型在总榜前列占据主导。
同模型融合（如两个 Claude Opus 4.8）也能超越单体性能，甚至超越 Fable 5。
由中端模型组成的“平民专家队”（Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro）逼近 Fable 5 水平。
最强组合 Fable 5 + GPT-5.5 霸榜第一。

关于成本，Fusion 宣称“半价达到 Fable 5 智力”。其收费逻辑为“调用几个模型付几个模型的钱”。省钱的核心在于 Token 价格的不对称性：输入极便宜，输出极昂贵。Fusion 通过支付多份廉价输入费，规避了高昂的输出费。此外，“提示词缓存”技术允许多个专家模型共享缓存数据，大幅降低重复输入成本。然而，若日常任务简单却强行组队，成本反而更高。

尽管概念惊艳，Fusion 目前存在三个主要短板：

编程场景不实用：反应速度慢，无法适应代码补全等实时需求；处理超长上下文易断片；缺乏编译器验证，拼凑代码可能无法运行。
速度极慢：需等待所有模型完成及裁判处理，耗时是单一模型的 2-4 倍，不适合实时客服或即时编码。
数据合规黑箱：请求经过多家不同服务商服务器，数据留存及中间路由层担保透明度不足，存在隐私合规风险。

关键要点

技术原理：Fusion API 基于 MoA 范式，通过“专家并行生成+裁判分析+主笔合成”的流程，将复杂的多模型协作封装为开箱即用的 API。
性能表现：在 DRACO 深度研究基准测试中，中端模型组合（Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro）智力得分误差不到 Fable 5 的 1%；同模型融合亦可超越单体性能。
成本逻辑：利用“廉价输入+昂贵输出”的 Token 价格差异，通过多模型分担输入成本并共享缓存，实现总体成本约为 Fable 5 的一半。
适用边界：适用于复杂深度研究、信息整合场景；不适用于实时代码补全、超长上下文连贯处理及高速度要求的实时交互。
主要风险：延迟高（2-4倍）、代码工程落地难、多路分发带来的数据合规与隐私不确定性。
市场影响：打破了单体模型的定价霸权，推动 AI 能力商品化；为国产模型（如 GLM-5.2、DeepSeek）提供了进入“专家库”的窗口；地缘政治风险促使企业转向多模型依赖以对冲单一供应商风险。

意义与影响

Fusion API 的推出标志着 AI 行业从崇拜“万亿参数单体战神”向“系统工程调度”的转变，其影响深远：

商业权力重构：打破了 Anthropic、OpenAI 等头部玩家通过单体模型建立的定价护城河。底层模型逐渐像 CPU 算力一样商品化，掌握调度系统的平台（如 OpenRouter）可能成为 AI 时代的“终极入口”，迫使前沿模型重新审视定价策略。
地缘政治与供应链风险对冲：Claude Fable 5 的突然下架警示了单一模型依赖的风险。Fusion 提供的“拼盘”方案成为一种合规意义上的风险对冲手段。这为国产大模型提供了绝佳机会，无需在所有指标上争第一，只需在 MoA 专家库中占据高性价比位置即可实现商业胜利。
技术演进瓶颈转移：多模型协作的下限由廉价专家模型拉高，但上限取决于“裁判模型”的综合评审、去幻觉及抗偏见能力。未来竞争焦点将从算力堆叠转向调度算法与裁判模型的质量。

总体而言，Fusion 并非万能药，而是特定场景下的高性价比替代方案。它证明了在算力边际效应递减的背景下，通过精巧的系统调度，组合拳的输出确定性可以超越单打独斗，为 AI 下半场提供了新的技术路径和商业逻辑。

查看原文 →leiphone.com

Fable 5遭封杀，OpenRouter推多模型协作平替方案

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐