AI 资讯爱范儿·1 小时前

火山引擎发布豆包2.1 Pro与Seedance 2.5，AI视频突破30秒

原标题：刚刚，Seedance 2.5 正式发布，国产视频模型再次捅破天花板

速览

火山引擎在FORCE大会上发布旗舰模型豆包2.1 Pro，其代码与Agent能力跻身全球第一梯队，且成本大幅降低。同时推出视频模型Seedance 2.5，支持30秒长视频生成及原生4K画质，突破现有瓶颈。这些产品标志着AI模型正式跨过「生产质变点」，深入企业核心业务流。

AI 深度解读

背景

在 2026 年火山引擎 FORCE 原动力大会上，火山引擎公布了其大模型业务的惊人增长数据：截至今年 6 月，豆包大模型的日均 token 调用量已达 180 万亿。这一数字相比最初发布时增长了数个数量级，且增长势头未减。在公有云大模型市场，火山引擎的市场份额已提升至 49.5%，意味着每消耗两个 token，就有一个来自火山引擎。

随着“万亿 token 俱乐部”成员从去年的 100 家暴涨至 200 多家，token 正逐渐演变为像水电一样的基础消耗品。企业不再将大模型视为“试试看”的新工具，而是将其深度接入写代码、做视频、跑分析、做客服及决策等核心业务流程。在此背景下，火山引擎发布了以豆包 2.1 Pro 为核心的新一代模型矩阵，旨在突破大模型应用的“生产质变点”。

核心内容

本次发布会的核心在于展示豆包大模型在代码、视频、图像及音频四个维度的全面升级，特别是针对工业级应用场景的能力突破。

1. 豆包 2.1 Pro：代码与 Agent 能力的旗舰突破 豆包 2.1 Pro 被定义为突破“生产质变点”的旗舰模型，其核心特征是代码能力可直接交付并进入企业研发流程。

Coding 能力：在 Terminal Bench 终端编程评测中，2.1 Pro 与 Claude Opus 4.7 基本持平，进入全球第一梯队；在 SciCode 评测中得分 59.8，超越 Opus 4.7；在仓库级评测中拿到 47 分。
硬核案例演示：模型围绕一个 16×16 PE 的微型模型，连续迭代 18 小时、九轮，生成了六个核心模块、1300 多行 RTL 代码（芯片设计中最严谨的环节），并通过了仿真测试、综合检测及手写数字识别验证。这一过程通常需 3 至 5 名资深工程师耗时数周。
Agent 能力：在 OpenAI 的 GDPval 真实经济价值评测中，2.1 Pro 获得国内第一；在 MCP Atlas 评测中全面超过 Opus 4.7。
成本优势：百万 token 输入 6 元、输出 30 元，缓存命中仅 1.2 元，相比 Claude 同系列成本降低近 80%。此外还推出了价格仅为 Pro 一半的 turbo 版本。

2. Seedance 2.5：AI 视频生成的里程碑 继 2.0 版本解锁 15-30 秒视频生成后，Seedance 2.5 带来了三项“全球第一/最多”的升级：

超长时长：单条视频生成长度最高达 30 秒，突破市面上同类模型 15-20 秒的限制，确保镜头表达连贯。
多参考能力：支持 50 个全模态素材联合输入，为全球最多。现场演示中，模型能基于十多位演员的图像资产自行编排。
灵活编辑：支持在整体画面不变的前提下对局部进行修改（如微调背景、更换商品或模特）。演示中成功解决了口红广告中“挑口红”的难题。
专业创作承接：能稳定处理接近 10 万面的复杂 3D 模型（如宇宙飞船白膜）并生成渲染视频，保持主体轮廓和比例稳定。
产业应用：支持自动生成多语言产品视频说明书，为具身智能合成多场景训练数据，为自动驾驶合成极端天气和罕见路况案例。

3. Seedream 5.0 Pro：图像生成的智能交互 作为 Seedream 5.0 Lite 的升级版，5.0 Pro 侧重于智能水平提升：

交互式精准编辑：支持语言描述空间关系或直接标记圈选，模型能识别箭头和高亮块，理解意图并定位元素。支持将草图线稿编辑为符合意图的视觉效果。
多图层分离：支持任意颗粒度的圈选拆分，小到一行字、大到整个版面均可独立输出。具备智能背景填充及递归拆分能力（如将人物拆分为帽子、滑板等），方便二次编辑。
高密度信息呈现：能完整处理复杂图表、多层结构甚至整页 PPT 的信息，并自动优化版面保持审美。
多语言适配：支持英语、西班牙语、阿拉伯语、日语、韩语等 10 余种语言，并自动适应排版习惯。

4. 音频与其他生态整合

Seed-Audio 1.0：支持情绪、口音、背景音、氛围音及拟音特效一次直出，达到影视级成品音效。
产业落地：奔驰中国已将豆包大模型集成进新款纯电车型，提升语音交互的自然度及对用户意图和情绪的解读能力。东风汽车也在探索智能座舱语音交互。
跨模态协作：Seedream 5.0 Pro 与 Seedance 2.5 可组合使用，例如先生成关键阶段图像再转化为高品质科普视频。

关键要点

市场地位：火山引擎在公有云大模型市场份额达 49.5%，日均 token 调用量达 180 万亿，token 已成为基础设施级消耗。
豆包 2.1 Pro 性能：代码能力对标全球顶尖水平（与 Claude Opus 4.7 持平或超越），Agent 能力国内第一，且成本大幅降低（比 Claude 低 80%）。
Seedance 2.5 突破：实现全球最长的 30 秒单条视频生成，支持 50 个全模态参考素材，具备局部灵活编辑能力，并能稳定承接高复杂度 3D 资产生成。
Seedream 5.0 Pro 特性：具备交互式精准编辑、多图层递归分离及高密度信息处理能力，支持多语言自动排版适配。
生产质变点：所有新模型均强调从“玩具”向“生产工具”的转变，能够直接交付进入企业核心研发、营销及决策流程。
战略聚焦：字节跳动 CEO 梁汝波表示，公司正收缩业务宽度，聚焦 AI，并通过火山引擎将内部沉淀的模型能力、工程体系转化为云服务交付给企业。

意义与影响

此次发布标志着国产 AI 模型在“生产质变点”上取得了实质性进展。过去视频模型多局限于 5-10 秒的 UGC 内容，而 Seedance 2.5 将时长扩展至 30 秒并支持 4K 原生画质及复杂编辑，使其能够胜任广告、影视及科普短片等商业级制作。同时，豆包 2.1 Pro 在芯片设计代码生成等硬核领域的表现，证明了 AI 已能处理高严谨性、长周期的专业任务。

从产业角度看，Token 调用量的指数级增长反映了 AI 已深度嵌入企业核心流程。火山引擎通过提供高性价比、高能力的模型 API 及行业解决方案，正在加速 AI 从技术探索向规模化工业应用的转化。随着模型对物理世界理解的加深，其积累的数据和能力正逐步构建起“世界模型”的基础，为具身智能、自动驾驶等前沿领域提供关键的数据补盲和训练支持。字节跳动通过聚焦 AI 并开放火山引擎，确立了其在 AI 基础设施领域的关键出口地位。

查看原文 →ifanr.com

火山引擎发布豆包2.1 Pro与Seedance 2.5，AI视频突破30秒

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐