← 返回信息流
技术博客arXiv cs.AI·4 小时前

双智能体仿真框架:优化电商搜索架构评估

原标题:Iterating Toward Better Search: A Two-Agent Simulation Framework for Evaluating Agentic Search Architectures in E-Commerce

速览

本文提出一种模块化双智能体仿真框架,用于评估对话式购物助手架构。通过固定买家智能体并替换响应者,在2011次对话实验中验证了滚动窗口记忆优于意图提取记忆,且速度提升35%。研究还发现,更换大模型骨干(如从Gemini到Llama)对性能影响有限,而不同前沿LLM评估者在评判标准上存在显著分歧。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org