← 返回信息流
技术博客arXiv cs.CL·3 小时前

小实验省钱决策:微预训练的分阶段晋升案例

原标题:Small Experiments, Cheaper Decisions: A Case Study in Staged Promotion for Micro-Pretraining

速览

该研究提出一种可审计的分阶段晋升协议,用于在异构硬件上筛选微预训练配置。通过从2分钟到12小时的阶梯式预算测试,有效识别稳定表现,避免早期小规模实验带来的误导性排名。最终方案在节省GPU时长的同时,确保了模型配置选择的可靠性。

AI 深度解读

AI 正在阅读原文并生成深度解读…(首次约 20–40 秒,之后秒开)
查看原文 →arxiv.org