百度智能云DuMate实测:基于Claude Code项目生成多形态交付物
速览
百度智能云桌面级AI智能体DuMate于3月22日全量上线,旨在解决真实办公工作流中的重复劳动。本次测评针对GitHub开源项目everything-claude-code,要求DuMate完成从项目研究到多形态交付的全过程。测试结果显示,DuMate能够基于统一事实底稿,自动生成Word说明书、PPT大纲、静态网站及Excel统计表,验证了其嵌入真实工作流的能力。
AI 深度解读
背景
在 AI 办公赛道中,大多数产品的逻辑仍停留在“提问-生成-复制”的简单循环:用户在对话框输入需求,AI 返回文本或图表,用户再手动将其搬运至 Word、PPT 等工具中。这种模式让 AI 仅扮演“内容供应商”角色,无法真正嵌入工作流,导致用户付费意愿低、续费率差,难以实现产品市场契合度(PMF)。
百度智能云推出的 DuMate 试图打破这一局限,定位为桌面级 Agent(智能体)。其核心逻辑不再是单纯的问答,而是“看见屏幕、操作软件、处理文件、串联业务系统”,旨在通过感知、执行和交付的全链路闭环,替代需要“操作软件、串联文件、交付结果”的重复劳动。为了验证其是否具备“抗活儿”的能力,雷峰网设计了一项覆盖项目研究、结果整理及多形态交付的复杂测试任务,以评估 DuMate 在真实办公场景中的落地能力。
核心内容
本次测评选取了 GitHub 上 Star 数超过 14 万的开源项目 everything-claude-code 作为测试对象。该项目并非普通应用,而是一套专为 Claude Code、Codex、Cursor 等 AI 编程工具设计的工程化配置系统,旨在解决持久化记忆、规范化流程、自动化检查及持续学习四大痛点。
测试任务要求 DuMate 完成“项目研究 + 多形态交付”,具体包括:
- 统一事实底稿构建:基于 GitHub 仓库及公开网络资料(Guide、Release、博客、社区等),甄别矛盾信息,形成一份标注【已确认】【推断】【待确认】的结构化情报底稿,作为后续所有交付物的唯一事实来源。
- 四形态交付物生成:
- Word 说明书:面向首次接触者,提供完整章节、专业排版建议及可直接预览的 .docx 文件,涵盖架构、组件、部署教程及故障排除。
- Excel 统计表:明确统计口径,统计项目目录、Commands、Skills、Hooks 等组件的数量、路径、作用及备注,提供结构化数据。
- PPT 内容稿:面向计算机专业群体,将书面叙述转化为视觉表达,包含大纲、逐页要点、图示建议及演讲备注。
- 静态网站:生成可本地预览的 HTML/CSS/JS 目录结构,包含首页、核心能力、安装使用、FAQ 等模块,实现信息架构的迁移。
测试结果显示,DuMate 并未停留在黑箱式的对话生成,而是展示了清晰的执行进程:
- 研究先行:先整合内外网信息形成“统一事实底稿”,确保后续多份文档内容的一致性,避免矛盾。
- 真实文件生成:直接输出可归档的 .docx 文件,而非仅提供文本建议;生成可运行的静态网站目录,而非仅给代码片段。
- 链路闭环:从研究、整理到文件生成、展示化输出,DuMate 在多个任务步骤间实现了顺滑衔接,展现了桌面级 Agent 从“单次生成”向“任务闭环”演进的能力。
关键要点
- 产品定位差异:DuMate 强调“做得更多”而非“答得更好”,核心价值在于将 AI 嵌入真实工作流,交付可留存、可复用的最终结果(如 Word、Excel、PPT、网站),而非仅仅提供 API 调用建议或文本摘要。
- 技术能力分层:DuMate 具备三个层次的能力:
- 感知与理解:将自然语言指令映射为具体操作序列。
- 工具调用与执行:对桌面环境有真实感知,能读写文件、操作浏览器、执行代码。
- 结果交付与归档:以正确形态输出结果,确保可留存和复用。
- 测试复杂性:测试任务刻意避开了简单的“写文章”或“做表格”,选择了信息杂乱、多源且需深度理解的 everything-claude-code 项目,要求 AI 具备甄别矛盾信息、构建统一事实底稿的能力,这更接近研发、产品和技术写作人员的日常真实工作。
- 执行透明度:DuMate 提供了可视化的执行过程(如右侧“进程”栏显示当前生成状态),使用户能观察任务进度、已生成文件及后续步骤,增强了用户对 Agent 执行过程的可控性和信任感。
- 一致性保障:通过先生成“统一事实底稿”,再基于同一底稿输出 Word、PPT、Excel 和网站,DuMate 解决了多文档间内容矛盾的行业痛点,体现了“一稿多用”的工程化思维。
- 当前局限:尽管在任务完成度上表现优异,但 DuMate 在 PPT 的视觉设计、网站的交互体验等方面仍有优化空间,目前主要优势在于逻辑闭环和文件生成的完整性,而非最终的美学呈现。
意义与影响
DuMate 的测评结果揭示了 AI 办公赛道的范式转移:从优化“单次生成体验”转向追求“任务闭环能力”。
- 技术分水岭:2025 年至 2026 年上半年,主流 AI 办公产品的竞争焦点将从对话流畅度、低幻觉率转向“任务闭环能力”。让 AI 在真实工作流中跑完全程,已成为留在牌桌上的入场券。
- PMF 的关键:对于订阅制 AI 办公产品,用户流失往往不是因为“用不好”,而是因为“用不起来”。只有当 AI 能真正替代重复性办公劳动,提升 ROI 时,用户付费意愿才会被真正唤起。DuMate 所代表的“感知-规划-执行-交付”模式,有望成为桌面级 AI 办公工具达成 PMF 的关键。
- 护城河构建:实现“闭环”级别的稳定性需要 AI 系统具备更深的桌面环境感知、长记忆规划及灵活交付支持能力。这构成了较高的技术门槛和护城河,使得大多数仍停留在“生成”层的产品难以逾越。
- 行业成熟标志:从“帮你做得更快”到“替你做得更多”,DuMate 的实践表明,AI 办公工具正在从被动的内容提供商进化为主动的“办公搭子”,这标志着 AI 办公赛道正走向真正的成熟。
