← 返回信息流
Agent SkillLINUX DO · AI·2 小时前

大模型竞技场Arena推出API中转服务

原标题:宇宙尽头是贩子?大模型竞技场Arena也开始做中转了

速览

大模型竞技场Arena近日低调测试API中转服务,通过智能路由自动选择模型并实现商业化变现。此举将排行榜流量直接转化为收入,但裁判下场卖票引发关于公正性的质疑。目前产品处于研究预览阶段,尚未完全开放注册。

AI 深度解读

背景

Arena(原 LMArena)脱胎于伯克利(Berkeley)的学术项目,凭借「Chatbot Arena」这一「人类投票定胜负」的机制,积累了大量人类偏好数据,成为大模型厂商既爱又恨的「兵器谱」。2025年5月,Arena完成约1亿美元种子轮融资,由 a16z 与加州大学投资公司领投,估值约6亿美元;2026年1月,再融资1.5亿美元,估值升至17亿美元。

然而,作为「裁判」的 Arena 长期面临盈利难题:网站、投票、甚至 direct chat 均免费,仅 API 调用收费。随着投资人对收入故事的期待,Arena 决定将排行榜本身商品化,通过提供 API 服务实现变现。

核心内容

Arena 近日低调测试 Arena API,其核心功能包括聊天补全/Messages 接口、统一密钥管理及按量计费。用户只需在模型名中填写 auto,系统即可根据实时排行榜自动选择模型。这种模式在业内被称为「中转」,俗称「掺水贩子」。

Arena API 的核心卖点是 智能路由(Intelligent Routing)。它利用自身积累的实时排名数据,替用户选择当前表现最佳的模型,无需用户具备专业知识。该服务兼容多种模型,包括 Llama、Claude、Codex、Pi 等。

尽管官方文档强调产品处于「研究预览阶段」,不承诺可用性,且 auto 模式不保证支持函数调用,路由质量也会随时间改进,但其商业意图明确:通过流量分配实现变现。

关键要点

  • 商业模式转变:Arena 从免费的人类偏好数据收集平台,转向通过 API 提供智能路由服务,将「全网最懂模型」的人设直接变现为 token 流水。
  • 智能路由机制:用户无需关心具体模型选择,系统根据 Arena 排行榜的实时排名自动分配请求,实现模型间的无缝切换。
  • 利益冲突风险:Arena 既是模型评分的「裁判」,又是流量分发的「贩子」。其排名直接影响厂商的进账,引发对公正性的质疑。
  • 历史争议:2025年上半年,Cohere 等机构发表论文《排行榜幻觉》,指控 Arena 存在私下测试大厂变体并择优上榜的后门;Llama 4 和文心等刷榜事件也加剧了公众对其公正性的怀疑。
  • 当前状态:API 目前处于限制注册的研究预览阶段,官方对服务稳定性和功能支持持保留态度,但急于通过商业化解决收入问题。

意义与影响

Arena 的 API 服务标志着 AI 创业生态的进一步成熟与异化。正如「宇宙的尽头是编制,互联网的尽头是带货」,AI 领域的尽头似乎正走向「贩子」模式。OpenRouter 已率先探索此路径,而 Arena 带着「裁判」身份入场,使得利益链条更加复杂。

这一举动引发了关于 AI 评测公正性的深刻讨论:当评测机构直接参与流量分配并从中获利时,其排行榜的客观性将受到严峻挑战。尽管 Arena 声称其路由质量会随时间改进,但一边记分一边卖票的模式,可能导致模型排名进一步偏离真实能力,转而反映商业利益博弈的结果。后续发展将取决于 Arena 如何在商业利益与学术公信力之间取得平衡,以及用户和厂商对这种「中转」模式的接受程度。

查看原文 →linux.do