技术博客arXiv cs.CL·11 小时前

DLLG：动态Logit级门控实现大模型专家高效融合

原标题：DLLG: Dynamic Logit-Level Gating of LLM Experts

速览

该研究提出DLLG（动态Logit级门控）框架，旨在解决现有大模型专家融合方法在适应性与稳定性间的权衡问题。该方法通过轻量级门控模块学习Token级的专家融合权重，无需Token级标签或专家重训练即可将轨迹级正确性链接到生成过程。实验表明，DLLG在多种推理和代码基准测试中均优于强大的路由、启发式集成及参数合并基线，展现出鲁棒且可扩展的专家整合范式。

AI 深度解读

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）

查看原文 →arxiv.org

DLLG：动态Logit级门控实现大模型专家高效融合

速览

AI 深度解读

相关推荐