DLLG:动态Logit级门控实现大模型专家高效融合
原标题:DLLG: Dynamic Logit-Level Gating of LLM Experts
速览
该研究提出DLLG(动态Logit级门控)框架,旨在解决现有大模型专家融合方法在适应性与稳定性间的权衡问题。该方法通过轻量级门控模块学习Token级的专家融合权重,无需Token级标签或专家重训练即可将轨迹级正确性链接到生成过程。实验表明,DLLG在多种推理和代码基准测试中均优于强大的路由、启发式集成及参数合并基线,展现出鲁棒且可扩展的专家整合范式。
AI 深度解读
AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org
