← 返回信息流
技术博客arXiv cs.CL·3 小时前

ReasoningFlow:用有向无环图解析大模型推理轨迹

原标题:ReasoningFlow: Discourse Structures for Understanding LLM Reasoning Traces

速览

针对大推理模型(LRM)产生的回溯和自修正等非线性推理轨迹,研究提出ReasoningFlow框架,将其捕获为细粒度的有向无环图(DAG)。该框架通过手动标注验证了标注模式,并自动分析了涵盖数学、科学等任务的1260条轨迹。研究发现,尽管训练基础不同,LRM的推理结构具有相似性,且错误步骤通常不用于推导最终答案。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org