← 返回信息流
AI 资讯雷峰网·4 小时前

Fable 5遭封杀,OpenRouter推多模型协作平替方案

原标题:Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」

速览

Anthropic旗下Fable 5模型突遭封杀,OpenRouter迅速推出Fusion API作为替代方案。该服务通过多模型并行、裁判筛选及主笔合成的机制,实现“多模型协作”以复刻顶尖智力。实测数据显示,中端模型组合在DRACO基准测试中得分误差不足1%,且调用成本仅为原模型的一半。

AI 深度解读

背景

2026年6月14日,全球最大大模型 API 聚合平台 OpenRouter 发布了一项名为 Fusion API 的新产品,旨在通过“多模型协作”的方式,复刻当时全球最强 AI 模型 Claude Fable 5 的智力水平。这一举措恰逢其时:就在同周,Anthropic 发布了号称史上最强的模型 Claude Fable 5,该模型凭借强悍的长周期智能体推理能力,能将企业数月代码迁移工作缩短至一天。然而,发布仅 3 天,美国政府便签发紧急出口管制令,Anthropic 被迫切断全球网络并暂停 API 访问,导致市场出现巨大的供应真空。

OpenRouter 的 Fusion API 正是在这一背景下推出,它不依赖单一模型,而是通过让多个 AI 模型协同工作,对外统一提供一个 API 入口。其宣称的核心优势在于:通过组合 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 等模型,其综合智力得分误差不到被禁 Fable 5 的 1%,且调用成本仅为 Fable 5 的一半。

核心内容

Fusion API 的底层逻辑是将“多模型并行、裁判海选、终审合成”三步流程标准化。其具体运作机制如下:

  1. 专家团头脑风暴:用户提示词被同时派发给最多 8 个“专家模型”(包括 Fable 5、GPT-5.5、Gemini 3.1 Pro、GLM-5.2、Kimi K2.6 等)。为防止模型闭门造车,系统统一配备实时联网搜索与网页抓取工具,确保专家在交卷前能查阅最新参考资料。
  2. 裁判模型挑刺:指定一个“裁判”模型对所有专家的回答进行分析,撰写详细报告,指出意见一致处、矛盾点、出彩见解及盲点。
  3. 主笔模型定稿:主笔模型吸收专家优点,排除幻觉,产出逻辑顺畅的高质量回答。为避免延迟,裁判与主笔工作被整合在同一个超级大模型的一次思考中完成。

该架构源于学术界提出的多模型协同技术范式 MoA(Mixture of Agents)。OpenRouter 将其转化为商用 API,提供了两个关键机制:

  • 透明控制权:用户可自定义评审模型、主裁判及模型权重,甚至指定国产模型挑大梁。
  • 动态智能门控:简单问题由便宜模型秒回,仅复杂问题启动多模型协作,以优化成本。

在 Perplexity AI 发布的深度研究基准测试 DRACO 中,Fusion 表现优异。DRACO 包含法律、金融等 10 个领域的 100 道复杂任务,采用负分淘汰制。评测显示:

  • 组合模型在总榜前列占据主导。
  • 同模型融合(如两个 Claude Opus 4.8)也能超越单体性能,甚至超越 Fable 5。
  • 由中端模型组成的“平民专家队”(Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro)逼近 Fable 5 水平。
  • 最强组合 Fable 5 + GPT-5.5 霸榜第一。

关于成本,Fusion 宣称“半价达到 Fable 5 智力”。其收费逻辑为“调用几个模型付几个模型的钱”。省钱的核心在于 Token 价格的不对称性:输入极便宜,输出极昂贵。Fusion 通过支付多份廉价输入费,规避了高昂的输出费。此外,“提示词缓存”技术允许多个专家模型共享缓存数据,大幅降低重复输入成本。然而,若日常任务简单却强行组队,成本反而更高。

尽管概念惊艳,Fusion 目前存在三个主要短板:

  1. 编程场景不实用:反应速度慢,无法适应代码补全等实时需求;处理超长上下文易断片;缺乏编译器验证,拼凑代码可能无法运行。
  2. 速度极慢:需等待所有模型完成及裁判处理,耗时是单一模型的 2-4 倍,不适合实时客服或即时编码。
  3. 数据合规黑箱:请求经过多家不同服务商服务器,数据留存及中间路由层担保透明度不足,存在隐私合规风险。

关键要点

  • 技术原理:Fusion API 基于 MoA 范式,通过“专家并行生成+裁判分析+主笔合成”的流程,将复杂的多模型协作封装为开箱即用的 API。
  • 性能表现:在 DRACO 深度研究基准测试中,中端模型组合(Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro)智力得分误差不到 Fable 5 的 1%;同模型融合亦可超越单体性能。
  • 成本逻辑:利用“廉价输入+昂贵输出”的 Token 价格差异,通过多模型分担输入成本并共享缓存,实现总体成本约为 Fable 5 的一半。
  • 适用边界:适用于复杂深度研究、信息整合场景;不适用于实时代码补全、超长上下文连贯处理及高速度要求的实时交互。
  • 主要风险:延迟高(2-4倍)、代码工程落地难、多路分发带来的数据合规与隐私不确定性。
  • 市场影响:打破了单体模型的定价霸权,推动 AI 能力商品化;为国产模型(如 GLM-5.2、DeepSeek)提供了进入“专家库”的窗口;地缘政治风险促使企业转向多模型依赖以对冲单一供应商风险。

意义与影响

Fusion API 的推出标志着 AI 行业从崇拜“万亿参数单体战神”向“系统工程调度”的转变,其影响深远:

  1. 商业权力重构:打破了 Anthropic、OpenAI 等头部玩家通过单体模型建立的定价护城河。底层模型逐渐像 CPU 算力一样商品化,掌握调度系统的平台(如 OpenRouter)可能成为 AI 时代的“终极入口”,迫使前沿模型重新审视定价策略。
  2. 地缘政治与供应链风险对冲:Claude Fable 5 的突然下架警示了单一模型依赖的风险。Fusion 提供的“拼盘”方案成为一种合规意义上的风险对冲手段。这为国产大模型提供了绝佳机会,无需在所有指标上争第一,只需在 MoA 专家库中占据高性价比位置即可实现商业胜利。
  3. 技术演进瓶颈转移:多模型协作的下限由廉价专家模型拉高,但上限取决于“裁判模型”的综合评审、去幻觉及抗偏见能力。未来竞争焦点将从算力堆叠转向调度算法与裁判模型的质量。

总体而言,Fusion 并非万能药,而是特定场景下的高性价比替代方案。它证明了在算力边际效应递减的背景下,通过精巧的系统调度,组合拳的输出确定性可以超越单打独斗,为 AI 下半场提供了新的技术路径和商业逻辑。

查看原文 →leiphone.com