技术博客arXiv cs.AI·2 小时前

AI智能体重塑知识工作：自主高效且拓展边界

原标题：How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

速览

Perplexity基于Search和Computer产品数据的研究显示，AI智能体正推动知识工作从对话助手向自主执行转变。Computer产品通过自动化任务分解与执行，将用户会话中的自主工作时间从33秒提升至26分钟，满意度显著提高。相比仅使用Search，Computer使任务完成时间从269分钟降至36分钟，预估时间和成本分别降低87%和94%。此外，智能体还拓展了工作范围，促使用户尝试跨职业边界、更高阶认知及复合型的任务。

AI 深度解读

AI Agent 如何重塑知识工作：自主性、效率与范围

背景

随着前沿人工智能（Frontier AI）系统的演进，AI 的角色正在经历从“对话式助手”向“自主执行代理（Autonomous Agents）”的根本性转变。这种转变的核心在于弥合智能与实用性之间的差距：不再仅仅通过对话提供信息，而是能够端到端地（end-to-end）执行复杂任务。

Perplexity 公司近期在 arXiv 上发表了一篇题为《How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope》的研究论文。该研究基于 Perplexity 旗下两款核心产品——Search（搜索产品，主要提供基于检索的对话式回答）和 Computer（计算机产品，具备自主操作能力，可模拟人类在浏览器和操作系统中的操作）——的生产数据，深入探讨了 AI Agent 如何加速并重塑知识工作。

核心内容

这项研究利用自然实验的方法，对比了用户在相同底层任务下，分别使用 Search 和 Computer 两种产品时的行为差异。研究主要围绕以下三个关键实证发现展开：

1. 自主性带来的工作流重构与质量提升

研究选取了初始查询对（initial query pairs）几乎相同的会话作为自然实验样本，以控制任务复杂度变量。数据揭示了两款产品在处理任务时的巨大差异：

自主工作时长差异显著：在使用 Computer 的用户会话中，AI 代理平均执行了 26 分钟的自主工作；相比之下，Search 产品的自主工作时间仅为 33 秒。
任务分解与执行的自动化：Computer 能够自动完成任务的分解和执行，而 Search 用户通常需要手动编排和实施这些步骤。
工作重心的转移：由于 Computer 接管了执行层面的工作，用户的后续查询分布向更高层级的工作转移，例如“验证（verification）”和“扩展（extension）”。用户不再纠结于“如何做”，而是关注“做得对不对”以及“还能做什么”。
执行质量提高：自主性显著提升了执行质量。数据显示，Computer 的“每查询不满意率”比 Search 低 55%。

2. 效率与成本的指数级优化

得益于其自主执行的优势，Computer 在完成任务的速度和成本效益上展现出压倒性的优势：

完成时间大幅缩短：在匹配的任务中，Computer 将任务完成时间从 269 分钟缩短至 36 分钟。
时间与成本降低：与仅配备 Search 的人类用户相比，使用 Computer 估计降低了 87% 的时间成本和 94% 的成本。

3. 工作范围与认知深度的拓展

Computer 不仅改变了工作的速度，还改变了用户尝试工作的“范围（Scope）”。研究发现，使用 Computer 时，用户的行为呈现出以下特征：

跨越职业边界：Computer 的查询更频繁地跨越传统的职业界限，意味着非专业人士也能执行原本属于特定领域专家的任务。
更高阶的认知需求：任务涉及更高阶的认知能力，而非简单的信息检索。
依赖更广泛的专长：任务需要调动更广泛的专业知识储备。
复合任务形式：查询往往以“复合任务（composite tasks）”的形式出现，即将相互依赖的子任务捆绑在一个查询中。
解锁全新活动：Computer 解锁了一些在 Search 使用中几乎不存在的活动类型，即便是在同一批用户群体中也是如此。

关键要点

自主性定义新范式：AI 从“问答助手”进化为“自主代理”，核心区别在于能否端到端执行任务。Perplexity 的 Computer 产品展示了这一转变的实际威力。
人类角色的升维：AI 代理接管了任务分解和执行等低阶工作，迫使人类用户将精力集中在验证结果、扩展思路等高阶认知活动上。
效率与质量的双赢：自主执行不仅将任务完成时间缩短了约 8.5 倍，还将不满意率降低了 55%，证明了自动化执行优于人类手动编排。
成本结构的颠覆：相比仅使用传统搜索辅助的人类工作流，AI Agent 可将估计成本降低 94%，时间成本降低 87%。
工作边界模糊化：AI Agent 使得跨职业、跨领域的复合任务成为可能，降低了专业门槛，扩大了知识工作的覆盖面和深度。

意义与影响

这项研究提供了关于 AI Agent 实际生产力影响的早期实证证据，其意义深远：

重新定义知识工作价值：知识工作的价值重心正从“信息获取与执行”向“判断、验证与战略扩展”转移。未来的核心竞争力可能在于如何有效地向 AI Agent 下达指令以及如何评估其输出。
企业生产力革命：对于企业而言，引入具备自主执行能力的 AI Agent（如 Perplexity Computer）不仅仅是工具升级，更是工作流的重构。它意味着大量重复性、多步骤的知识工作可以被自动化，从而释放人力去处理更具创造性的问题。
技术演进的必然趋势：研究证实，从对话式 AI 向自主 Agent 的过渡是提升 AI 实用性的关键路径。能够自主操作软件、浏览网页、执行代码的 Agent，比单纯生成文本的 LLM 具有更高的实用价值和更低的用户摩擦。
对劳动力市场的潜在冲击：由于 Computer 能够跨越职业边界并处理复合任务，它可能对初级分析师、研究员、数据整理员等依赖信息处理和基础执行的岗位产生深远影响。同时，它也降低了进入某些专业领域的门槛，使得“通才”通过 AI 辅助也能完成专家级任务。

总之，Perplexity 的这项研究清晰地表明，AI Agent 正在通过赋予机器自主执行能力，从根本上加速工作流、提高产出质量、降低成本，并极大地扩展了自动化工作的广度与深度。

查看原文 →arxiv.org