AI 资讯雷峰网·4 天前

百度智能云DuMate实测：基于Claude Code项目生成多形态交付物

原标题：百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，效果如何？

速览

百度智能云桌面级AI智能体DuMate于3月22日全量上线，旨在解决真实办公工作流中的重复劳动。本次测评针对GitHub开源项目everything-claude-code，要求DuMate完成从项目研究到多形态交付的全过程。测试结果显示，DuMate能够基于统一事实底稿，自动生成Word说明书、PPT大纲、静态网站及Excel统计表，验证了其嵌入真实工作流的能力。

AI 深度解读

背景

在 AI 办公赛道中，大多数产品的逻辑仍停留在“提问-生成-复制”的简单循环：用户在对话框输入需求，AI 返回文本或图表，用户再手动将其搬运至 Word、PPT 等工具中。这种模式让 AI 仅扮演“内容供应商”角色，无法真正嵌入工作流，导致用户付费意愿低、续费率差，难以实现产品市场契合度（PMF）。

百度智能云推出的 DuMate 试图打破这一局限，定位为桌面级 Agent（智能体）。其核心逻辑不再是单纯的问答，而是“看见屏幕、操作软件、处理文件、串联业务系统”，旨在通过感知、执行和交付的全链路闭环，替代需要“操作软件、串联文件、交付结果”的重复劳动。为了验证其是否具备“抗活儿”的能力，雷峰网设计了一项覆盖项目研究、结果整理及多形态交付的复杂测试任务，以评估 DuMate 在真实办公场景中的落地能力。

核心内容

本次测评选取了 GitHub 上 Star 数超过 14 万的开源项目 everything-claude-code 作为测试对象。该项目并非普通应用，而是一套专为 Claude Code、Codex、Cursor 等 AI 编程工具设计的工程化配置系统，旨在解决持久化记忆、规范化流程、自动化检查及持续学习四大痛点。

测试任务要求 DuMate 完成“项目研究 + 多形态交付”，具体包括：

统一事实底稿构建：基于 GitHub 仓库及公开网络资料（Guide、Release、博客、社区等），甄别矛盾信息，形成一份标注【已确认】【推断】【待确认】的结构化情报底稿，作为后续所有交付物的唯一事实来源。
四形态交付物生成：
- Word 说明书：面向首次接触者，提供完整章节、专业排版建议及可直接预览的 .docx 文件，涵盖架构、组件、部署教程及故障排除。
- Excel 统计表：明确统计口径，统计项目目录、Commands、Skills、Hooks 等组件的数量、路径、作用及备注，提供结构化数据。
- PPT 内容稿：面向计算机专业群体，将书面叙述转化为视觉表达，包含大纲、逐页要点、图示建议及演讲备注。
- 静态网站：生成可本地预览的 HTML/CSS/JS 目录结构，包含首页、核心能力、安装使用、FAQ 等模块，实现信息架构的迁移。

测试结果显示，DuMate 并未停留在黑箱式的对话生成，而是展示了清晰的执行进程：

研究先行：先整合内外网信息形成“统一事实底稿”，确保后续多份文档内容的一致性，避免矛盾。
真实文件生成：直接输出可归档的 .docx 文件，而非仅提供文本建议；生成可运行的静态网站目录，而非仅给代码片段。
链路闭环：从研究、整理到文件生成、展示化输出，DuMate 在多个任务步骤间实现了顺滑衔接，展现了桌面级 Agent 从“单次生成”向“任务闭环”演进的能力。

关键要点

产品定位差异：DuMate 强调“做得更多”而非“答得更好”，核心价值在于将 AI 嵌入真实工作流，交付可留存、可复用的最终结果（如 Word、Excel、PPT、网站），而非仅仅提供 API 调用建议或文本摘要。
技术能力分层：DuMate 具备三个层次的能力：
1. 感知与理解：将自然语言指令映射为具体操作序列。
2. 工具调用与执行：对桌面环境有真实感知，能读写文件、操作浏览器、执行代码。
3. 结果交付与归档：以正确形态输出结果，确保可留存和复用。
测试复杂性：测试任务刻意避开了简单的“写文章”或“做表格”，选择了信息杂乱、多源且需深度理解的 everything-claude-code 项目，要求 AI 具备甄别矛盾信息、构建统一事实底稿的能力，这更接近研发、产品和技术写作人员的日常真实工作。
执行透明度：DuMate 提供了可视化的执行过程（如右侧“进程”栏显示当前生成状态），使用户能观察任务进度、已生成文件及后续步骤，增强了用户对 Agent 执行过程的可控性和信任感。
一致性保障：通过先生成“统一事实底稿”，再基于同一底稿输出 Word、PPT、Excel 和网站，DuMate 解决了多文档间内容矛盾的行业痛点，体现了“一稿多用”的工程化思维。
当前局限：尽管在任务完成度上表现优异，但 DuMate 在 PPT 的视觉设计、网站的交互体验等方面仍有优化空间，目前主要优势在于逻辑闭环和文件生成的完整性，而非最终的美学呈现。

意义与影响

DuMate 的测评结果揭示了 AI 办公赛道的范式转移：从优化“单次生成体验”转向追求“任务闭环能力”。

技术分水岭：2025 年至 2026 年上半年，主流 AI 办公产品的竞争焦点将从对话流畅度、低幻觉率转向“任务闭环能力”。让 AI 在真实工作流中跑完全程，已成为留在牌桌上的入场券。
PMF 的关键：对于订阅制 AI 办公产品，用户流失往往不是因为“用不好”，而是因为“用不起来”。只有当 AI 能真正替代重复性办公劳动，提升 ROI 时，用户付费意愿才会被真正唤起。DuMate 所代表的“感知-规划-执行-交付”模式，有望成为桌面级 AI 办公工具达成 PMF 的关键。
护城河构建：实现“闭环”级别的稳定性需要 AI 系统具备更深的桌面环境感知、长记忆规划及灵活交付支持能力。这构成了较高的技术门槛和护城河，使得大多数仍停留在“生成”层的产品难以逾越。
行业成熟标志：从“帮你做得更快”到“替你做得更多”，DuMate 的实践表明，AI 办公工具正在从被动的内容提供商进化为主动的“办公搭子”，这标志着 AI 办公赛道正走向真正的成熟。

查看原文 →leiphone.com

百度智能云DuMate实测：基于Claude Code项目生成多形态交付物

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐