技术博客arXiv cs.CL·3 小时前

PeerCheck框架：利用提示工程与RAG提升大模型学术评审质量

原标题：PeerCheck: Enhancing LLM-Generated Academic Reviews Towards Human-Level Quality

速览

针对传统学术同行评审效率与质量瓶颈，研究提出PeerCheck框架以缩小大模型与人类评审的差异。研究发现大模型侧重理论而人类强调方法实验，通过引入思维链（CoT）显著提升了评审质量。同时揭示了检索增强生成（RAG）在不同模型中的“悖论”现象，为构建更人性化对齐的评审系统提供了重要参考。

AI 正在阅读原文并生成深度解读…（首次约 20–40 秒，之后秒开）