技术博客arXiv cs.AI·3 小时前

WorkflowView：利用大模型将跨域操作序列抽象为可解释工作流

原标题：Abstracting Cross-Domain Action Sequences into Interpretable Workflows

速览

针对现有方法对噪声敏感且难以跨应用泛化的问题，研究者提出WorkflowView框架。该框架利用大语言模型将底层交互日志抽象为高层活动，在浏览器日志、MOOC学习预测及Word文档工作流分析中表现优异。研究证明基于大模型的抽象是转化行为数据为可解释洞察的有效路径。

来源：arXiv cs.AI 提交日期：2026年6月12日标题：Abstracting Cross-Domain Action Sequences into Interpretable Workflows

在数字化时代，计算机科学与人工智能领域面临着海量用户交互数据的挑战。序列数据或带时间戳的交互日志提供了数字应用程序使用的客观记录。然而，这些原始数据通常具有极高的粒度（granularity）和噪声（noise），往往掩盖了关于人们实际工作方式的重要洞察。

理解这些洞察对于改进数字产品至关重要，因为这种改进必须基于真实的用户交互，而非假设。尽管先前的研究尝试应用深度学习模型将用户动作聚类为高层活动，但这些方法存在明显的局限性：它们对噪声高度敏感，且难以在不同应用程序之间进行泛化。这种“孤岛效应”阻碍了跨平台、跨工具的用户行为分析。

为了解决上述局限性，研究人员提出了 WorkflowView 框架。该框架利用大型语言模型（LLMs）将低层级的动作序列抽象为高层级的活动，从而生成可解释的工作流。

WorkflowView 的核心创新在于利用 LLM 强大的语义理解和推理能力，作为中间层来连接原始的、嘈杂的低层日志与高层的业务逻辑。

研究者在三个截然不同且具有挑战性的序列任务及多样化领域中验证了该方法的有效性和通用性：

零样本任务描述重构（浏览器日志）
- 场景：从浏览器交互日志中重构任务描述，无需任何训练样本（Zero-shot）。
- 结果：实现了极高的语义相似度（$\mu_{sim} = 0.91$）。这表明 LLM 能够准确理解浏览器操作背后的用户意图，即使没有针对特定任务进行过微调。
少样本学生辍学预测（MOOC 交互日志）
- 场景：利用大规模在线开放课程（MOOC）的交互日志预测学生辍学风险。
- 结果：仅使用五个少样本（few-shot）示例，即达到了加权 $F_1$ 分数为 0.90 的高性能。这证明了该方法在小样本情况下的强大泛化能力和数据效率。
隐私保护的 AI 工具集成分析（Microsoft Word 文档工作流）
- 场景：在 Microsoft Word 中分析 AI 工具的集成使用情况。
- 特点：该分析完全匿名化并保护隐私。
- 意义：展示了 WorkflowView 在处理敏感企业数据时的适用性，能够在不泄露用户具体内容的前提下，分析工作流模式和工具使用效率。

LLM 作为抽象器：研究证实，基于 LLM 的抽象是将低层行为数据转化为高层、可解释且可操作洞察的稳健且高效的路径。
跨领域泛化能力：WorkflowView 在浏览器、在线教育平台和企业办公软件（Microsoft Word）等不同领域均表现优异，证明了其通用性。
抗噪性与鲁棒性：相比传统的深度学习聚类方法，基于 LLM 的方法对原始日志中的噪声具有更强的抵抗力。
小样本学习优势：在少样本场景下（如仅需5个示例），该方法仍能保持高精度的预测能力，降低了对大规模标注数据的依赖。
隐私与效率考量：文章讨论了在实际日志基础设施中部署基于 LLM 的推理时的实际考量，包括计算效率和用户隐私保护。通过匿名化处理，WorkflowView 可以在不牺牲隐私的前提下提供深层洞察。

这项工作的主要贡献在于提供了一种新的范式，用于从嘈杂的数字足迹中提取有意义的业务智能。

产品改进的实证基础：通过提供更清晰、更高层级的用户行为视图，产品设计师和开发者可以基于真实的用户工作流而非猜测来优化数字产品。
打破数据孤岛：WorkflowView 的通用性意味着它可以应用于不同的应用程序和领域，使得跨平台的行为分析成为可能，这对于理解用户在复杂数字生态系统中的整体工作模式至关重要。
可解释性 AI 的实践：与许多“黑盒”深度学习模型不同，WorkflowView 生成的可解释工作流使得 AI 的决策过程更加透明，有助于建立用户对自动化分析的信任。
隐私优先的分析框架：在数据隐私法规日益严格的背景下，WorkflowView 展示了如何在保护用户隐私（如通过匿名化和抽象化）的同时，依然能够挖掘出有价值的行为模式，为企业合规地利用用户数据提供了技术路径。

总之，WorkflowView 展示了大型语言模型在理解人类行为序列方面的巨大潜力，为数字产品分析、用户行为研究以及隐私保护型数据分析开辟了一条新的技术路线。