技术博客arXiv cs.CL·2 小时前

Grounded Optimization：五层框架降低LLM简历幻觉风险

原标题：Grounded Optimization: A Layered Engineering Framework for Reducing LLM Hallucination in Automated Personal Document Rewriting

速览

Grounded Optimization是基于arXiv论文提出的五层工程框架，用于减少LLM在简历优化中的幻觉问题。该框架包括时序上下文验证、确定性污染检测、结构不变约束、提示词接地和评估代理五层组件。在多LLM、多温度、多配置的消融实验中，防御后总检测幻觉率降至0.04-0.24，时间幻觉减少50-95%。提示词级接地在低温度下可实现零幻觉，但需结合确定性层补强。框架已开源污染分类、评估代码和原始数据，对AI在简历筛选中的可靠应用具有重要意义。

AI 深度解读

背景

近年来，大型语言模型（LLMs）被广泛应用于求职者简历优化服务，帮助求职者针对申请人追踪系统（Applicant Tracking Systems, ATS）进行简历润色。ATS已成为绝大多数企业招聘流程中的标准工具，LLM应用为求职者提供了自动化辅助能力。然而，这种应用引入了与通用文本生成显著不同的幻觉（hallucination）失败模式。这些失败主要表现为：引入过时的技术或工具名称（anachronistic technology injection）、跨领域术语污染（cross-domain terminology contamination）、结构突变（structural mutation）以及内容完全虚构（content fabrication）。这些问题不仅影响简历的真实性和专业性，还可能导致求职者获得误导性信息或被ATS拒录，最终损害求职者的职业机会。

核心内容

为了解决上述问题，研究团队提出了Grounded Optimization，这是一个五层工程化框架，旨在通过多层防御机制系统性降低LLM在自动个人文档重写任务中的幻觉。框架的具体组成如下：

时间上下文验证（temporal context validation）：通过验证输入简历的时间戳、行业发展和工具采用历史，过滤掉任何与当前现实不符的技术提及或信息。这层防御特别针对anachronistic technology injection问题。
确定性污染检测（deterministic contamination detection）：基于预定义的跨领域术语污染分类法（contamination taxonomy），系统扫描并清理简历中可能从其他领域引入的不相关术语或概念，避免术语污染。
结构不变性强制（structural invariant enforcement）：在重写过程中严格保持简历的原始结构不变性，防止任何格式、章节或顺序上的突变，确保重写结果与原始模板一致。
提示级别接地（prompt-level grounding）：在提示词设计中注入特定约束和锚点，让LLM严格遵循真实信息和原简历内容，避免生成超出原始数据的虚构内容。
评估代理（evaluator agent）：作为最终质量检查层，自动检测剩余的幻觉问题，并提供反馈或修正建议。

研究人员在三款主流LLM、四种温度设置（temperature）以及六种层配置组合上进行了消融实验（ablation experiments），使用25份合成简历（synthetic resumes）覆盖14个行业进行测试。未设防的基线（undefended baselines）在每份简历上平均产生2.48至5.36个可检测到的幻觉。独立于活跃防御机制的检测器数据显示：时间相关幻觉（temporal hallucinations）在所有条件下均降低50-95%；整体可检测幻觉率下降至0.04-0.24。值得注意的是，仅靠提示级别接地（prompt-level grounding）在低温度（low temperature）和具备强指令跟随能力的模型上即可实现零可检测幻觉；而当温度升高或模型能力较弱时，提示级别接地效果不足，必须结合确定性层作为补充。

研究团队已公开全部污染分类法、评估代码以及原始数据集，方便后续研究复现和扩展应用。

关键要点

Grounded Optimization采用五层结构：时间上下文验证、确定性污染检测、结构不变性强制、提示级别接地及评估代理，形成闭环防御。
在三款LLM、四种温度设置及六种层配置的消融实验中，未防御基线平均2.48-5.36幻觉/简历；时间幻觉下降50-95%，整体幻觉率降至0.04-0.24。
提示级别接地单独即可在低温度、强指令跟随模型上实现零检测幻觉；更高温度或弱模型需确定性层补充。
研究公开了污染分类法、评估代码及原始数据，支持学术复现与工业应用。

意义与影响

Grounded Optimization为LLM在自动化文档重写领域的应用提供了一种可靠的工程化解决方案，有效缓解了幻觉问题对专业求职工具的信任障碍。该框架的五层设计体现了分层防御的工程哲学，将通用LLM能力与领域特定约束相结合，既保留了模型的灵活性，又强化了可控性。对于求职者而言，这一技术有望显著提升ATS优化简历的准确性与专业性，减少无效反馈并改善匹配率。

从研究层面看，工作不仅填补了LLM在简历重写中的应用空白，还提出了可复用的幻觉检测与防御方法，对后续提示工程、评估代理及多模态文档处理等领域具有启发意义。最终，该研究有助于推动LLM技术在人力资源领域的安全合规应用，助力更多求职者通过可靠工具实现职业发展，同时也为开发者提供了可直接部署的开源框架，进一步推动LLM在专业垂直场景的落地。

查看原文 →arxiv.org

Grounded Optimization：五层框架降低LLM简历幻觉风险

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐