技术博客arXiv cs.CL·14 小时前

TabClaw：支持交互与自我进化的电子表格智能体

原标题：TabClaw: An Interactive and Self-Evolving Agent for Spreadsheet Manipulation and Table Reasoning

速览

TabClaw是一款开源交互式AI智能体，旨在自动化电子表格操作与表格推理任务。它通过暴露可编辑执行计划、并行多表推理及显式共识标记，提升了分析过程的透明度。此外，该智能体具备自我进化能力，能记录用户偏好、提取持久记忆并优化技能，从而在保持工作流可检查性的同时实现个性化分析。

电子表格（Spreadsheets）和表格数据是结构化数据分析中最广泛使用的表现形式。然而，尽管数据可视化技术日益普及，有效的数据分析仍然高度依赖大量的人工操作以及深厚的领域专业知识。

近年来，大型语言模型（LLM）智能体在自动化部分分析流程方面展现出潜力，但在实际应用中仍面临显著瓶颈：

针对上述痛点，本文提出了 TabClaw，一个开源的交互式 AI 智能体，旨在解决电子表格操作和表格推理中的可解释性与个性化问题。

TabClaw 是一个面向电子表格操作和表格推理的开源交互式 AI 智能体。其核心设计理念是将黑盒式的 AI 分析转化为可检查、可编辑且能随用户习惯进化的工作流。

用户只需上传 CSV 或 Excel 文件，并通过自然语言提出需求。TabClaw 的处理流程包含以下关键步骤：

意图澄清：自动识别并澄清用户请求中的模糊意图。
可编辑执行计划：暴露一个可编辑的执行计划（Execution Plan），让用户在代码执行前审查和修改逻辑。
流式 ReAct 循环：以流式输出（Streaming）方式展示基于 ReAct（Reasoning + Acting）范式的工具使用分析循环，增强过程透明度。
专家智能体并行推理：针对多表推理任务，分发专门的专家智能体（Specialist Agents）进行并行处理，提升复杂比较任务的性能。
共识与不确定性标记：在综合最终发现时，明确标记共识部分和不确定性指标，帮助用户评估结果的可信度。

TabClaw 不仅仅是一次性分析工具，它具备持续学习和适应用户偏好的能力：

在电子表格操作和表格推理基准测试中，TabClaw 在可执行任务完成率和推理性能上均有所提升，同时保持了用户工作流的可检查性（Inspectable）。

TabClaw 的提出标志着 AI 辅助数据分析从“自动化执行”向“可解释、可交互、可进化”范式的重要转变。

提升数据分析的可信度：通过暴露中间决策过程和不确定性标记，TabClaw 解决了传统 LLM 在专业领域应用中因“幻觉”或隐性假设导致的结果不可信问题，特别适合需要高严谨性的商业和科研场景。
降低专业门槛：通过自然语言交互和自动化的意图澄清，降低了用户进行复杂表格操作和多表推理的技术门槛。
构建长期价值：其自进化机制使得 AI 智能体不再是孤立的一次性工具，而是能够随着用户习惯成长、积累领域知识的长期助手。这种“越用越聪明”的特性对于高频数据分析场景具有极高的实用价值。
开源生态贡献：作为开源项目，TabClaw 提供的技能蒸馏和包导入机制为构建可复用的数据分析技能库提供了新的思路，有助于推动 AI Agent 在结构化数据领域的标准化和模块化发展。

TabClaw 展示了如何将静态的电子表格和表格数据转化为动态的、可检查的分析工作流，并为未来的个性化 AI 数据分析工具树立了新的标杆。