阶跃星辰Step 3.7 Flash登顶Artificial Analysis输出速度榜
速览
大模型评测平台Artificial Analysis最新榜单显示,阶跃星辰开源基座模型Step 3.7 Flash以409 tokens/s的输出速度位列主流模型第一。该模型在端到端响应时长、智能效率及速度价格比等关键指标上均处于领先位置。
AI 深度解读
背景
近期,人工智能领域的竞争焦点正从单纯的模型参数规模比拼,逐渐转向对推理效率、成本控制以及生态整合能力的综合考量。一方面,大模型厂商致力于在保持智能水平的同时大幅提升输出速度并降低价格;另一方面,科技巨头如腾讯、华为、小米等正在加速将AI助手能力嵌入操作系统底层,推动“智能体”(Agent)从概念走向日常应用。在此背景下,阶跃星辰(StepFun)最新开源模型的优异表现,以及微信A2A(Agent-to-Agent)助手能力的落地,成为了观察当前AI产业演进的两个重要切片。
核心内容
1. 阶跃星辰 Step 3.7 Flash 刷新速度纪录 据36氪获悉,大模型评测平台 Artificial Analysis 发布的最新 Output Speed(输出速度)榜单显示,阶跃星辰(StepFun)最新开源基座模型 Step 3.7 Flash 以高达 409 tokens/s 的输出速度,位列主流模型第一。
除了单纯的输出速度,该模型在多个关键性能指标上均处于领先地位:
- 端到端响应时长(End-to-End Response Time): 显著缩短用户等待时间。
- 智能效率(Intelligence vs. Output Speed): 在速度与智能水平之间取得了优异平衡。
- 速度价格比(Output Speed vs. Price): 提供了更具性价比的推理方案。
2. 微信联合手机厂商推出 A2A 助手能力 微信正在与华为、荣耀、小米、OPPO 等多家主流手机厂商合作,推出 A2A(Agent-to-Agent,智能体对智能体)助手能力。该功能允许用户通过手机系统的原生 AI 助手直接发起微信的音视频通话,或向指定好友发送消息。
腾讯客服对此回应称,目前已有多家厂商完成接入。该功能基于 A2A 协作机制运行,并通过双重授权机制保障数据安全与隐私。其核心目的是将微信的高频沟通功能融入手机系统助手,从而为用户提供更便捷的使用体验。
关键要点
- 性能突破: Step 3.7 Flash 以 409 tokens/s 的速度成为 Artificial Analysis 榜单中主流模型的速度冠军。
- 多维领先: 该模型不仅在速度上领先,在端到端响应、智能效率及性价比等综合指标上均表现优异。
- 生态融合: 微信通过与华为、小米、荣耀、OPPO 等厂商合作,将社交功能下沉至手机系统级 AI 助手。
- 技术机制: 微信新功能基于 A2A(Agent-to-Agent)协作机制,强调智能体之间的交互与自动化。
- 安全合规: 腾讯强调通过“双重授权机制”来保障用户的数据安全与隐私,以消除用户对跨应用调用的顾虑。
- 用户体验升级: 无论是模型速度的提升还是系统级助手的接入,最终目标均为降低用户操作门槛,提升交互效率。
意义与影响
1. 大模型竞争进入“效率与性价比”深水区 Step 3.7 Flash 在速度和性价比上的领先,标志着大模型竞争已从单纯的“能力军备竞赛”转向“工程效率竞赛”。对于开发者和企业用户而言,高吞吐、低延迟且低成本的模型意味着更低的部署门槛和更高的商业落地可行性。这也对其它模型厂商提出了更高要求,迫使行业加速优化推理引擎和模型架构,以应对日益激烈的市场竞争。
2. AI 助手从“单点应用”走向“系统级互联” 微信与手机厂商的合作代表了 AI 应用形态的重大转变。传统的 AI 助手往往局限于单一 App 内部,而 A2A 机制打破了应用间的壁垒,实现了系统级智能体之间的协作。这种“手机系统 AI 助手 + 微信”的模式,不仅提升了微信高频功能的使用便捷性,也为其他超级 App 接入系统级 AI 生态提供了范本。
3. 隐私安全成为跨应用 AI 交互的关键门槛 腾讯特别强调“双重授权机制”和隐私保障,反映出在跨应用、跨设备 AI 交互场景中,用户对数据安全的敏感度极高。未来,任何涉及系统级权限调用的 AI 功能,都必须将隐私保护机制作为核心竞争力之一,否则难以获得用户信任和市场接纳。
4. 推动“智能体”(Agent)时代真正落地 无论是模型端的速度优化,还是应用端的 A2A 协作,都在为“智能体”时代的到来铺路。当模型足够快、足够便宜,且能够无缝融入用户日常使用的操作系统和社交网络时,AI 将从“对话工具”进化为真正的“个人助理”,深刻改变人机交互的方式。
