ReasoningFlow:用有向无环图解析大模型推理轨迹
原标题:ReasoningFlow: Discourse Structures for Understanding LLM Reasoning Traces
速览
针对大推理模型(LRM)产生的回溯和自修正等非线性推理轨迹,研究提出ReasoningFlow框架,将其捕获为细粒度的有向无环图(DAG)。该框架通过手动标注验证了标注模式,并自动分析了涵盖数学、科学等任务的1260条轨迹。研究发现,尽管训练基础不同,LRM的推理结构具有相似性,且错误步骤通常不用于推导最终答案。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
