技术博客arXiv cs.CL·5 小时前

SkillChain实现技能进化闭环，提升电商视觉AI助手效果

原标题：SkillChain: Closing the Loop on Skill Evolution for Image-Based E-Commerce AI Assistants

速览

针对电商视觉AI助手意图复杂、人工难以维护的问题，研究提出SkillChain框架。该框架通过技能创建、路由优化和主体精炼三阶段，实现技能的自动化进化与闭环反馈。在线A/B测试表明，该方法大幅提升了结构合规性、内容质量及用户长期留存率。

随着生成式 AI 技术的成熟，基于图像的 AI 助手（Image-based AI Assistants）已在各大电商平台上实现规模化部署。在这些场景中，用户只需上传一张图片，系统就需要理解其背后可能存在的多种截然不同的用户意图（User Intents）。

例如，同一张商品图片可能对应以下四种完全不同的需求：

每种意图都要求系统具备特定的响应格式、工具调用逻辑以及垂直领域的专业知识。然而，传统的基于大语言模型（LLM）的系统往往缺乏针对特定意图的行为约束，导致系统混淆这些异构模式，难以达到电商领域严格的质量标准。

此外，电商场景下的意图空间具有极高的广度和动态变化特征，依靠人工工程化手段（Manual Engineering）来逐一定义和约束每种意图的行为，在成本和可行性上都是不可行的。因此，亟需一种能够自动化管理“技能”（Skills）生命周期，并实现持续进化的解决方案。

为了解决上述挑战，研究团队提出了 SkillChain 框架。该框架的核心创新在于构建了一个生产环境下的反馈闭环，实现了“技能”（Skills）的自动化进化。SkillChain 将技能的完整生命周期划分为三个关键阶段，通过自动化流程替代人工干预，确保持续优化：

这是技能生命周期的起点。Skill Creator 负责从预定义的任务规范（Task Specs）和历史交互轨迹（Trajectories）中引导生成初始的 Skill。

在用户上传图片后，系统首先需要判断用户的具体意图。Route Optimizer 的核心任务是优化这一路由过程，确保用户意图被准确分配给对应的 Skill。

这是技能进化的核心环节。一旦路由确定，Body Refiner 负责对具体执行该技能的 LLM 主体（Skill Body）进行迭代式精炼。

机制：引入 双路径 LLM-Judge（Dual-path LLM-Judge） 评估机制。系统利用两个独立的 LLM 评估器，从不同维度对技能的输出质量进行打分和反馈。
流程：
1. Skill Body 生成响应。
2. 双路径 Judge 分别评估响应的结构合规性、内容质量等指标。
3. 根据评估反馈，自动调整 Skill Body 的参数或 Prompt，使其更符合电商领域的质量标准。
目标：通过持续的自动化迭代，不断提升技能输出的内容质量和结构规范性，形成“执行-评估-优化”的闭环。

自动化技能生命周期：SkillChain 实现了从技能创建、路由对齐到主体精炼的全流程自动化，摆脱了对人工工程化规则的依赖。
解决意图混淆问题：通过引入 Route Optimizer，有效解决了多意图场景下 LLM 行为模式混淆的问题，确保了不同意图（如搜索 vs. 推荐）的隔离与精准响应。
双路径评估机制：Body Refiner 采用双路径 LLM-Judge 进行迭代优化，显著提升了技能输出的结构合规性和内容质量。
生产级验证：该框架已部署于大规模生产环境的电商图像助手，并经过了一周的在线 A/B 测试验证。
显著的业务指标提升：
- 响应质量：在结构合规性和内容质量方面取得了最显著的改进。
- 用户参与度：在线实验显示，用户参与度（User Engagement）显著提升。
- 内容消费：用户的内容消费时长和深度有所增加。
- 长期留存：用户的长期留存率（Long-term Retention）得到改善。

SkillChain 的提出标志着电商 AI 助手从“静态规则驱动”向“动态技能进化”的重要转变。

可扩展性突破：传统方法难以应对电商海量且动态变化的用户意图。SkillChain 通过自动化闭环，使得系统能够以低成本适应新的意图和场景，解决了规模扩展的瓶颈。
质量与效率的双重提升：通过 LLM-Judge 驱动的迭代优化，系统不仅提高了响应的专业度和准确性，还减少了人工审核和调试的成本。
商业价值转化：在线 A/B 测试证明，技术上的改进直接转化为可衡量的商业指标提升（如留存率和参与度），证明了 AI 助手在电商场景中不仅是技术展示，更是有效的业务增长引擎。
范式参考：SkillChain 为其他需要处理多模态、多意图复杂场景的 AI 应用（如客服、智能导购等）提供了可借鉴的“技能进化”架构范式。