技术博客arXiv cs.AI·4 小时前

GITCO：通过门控推理时上下文优化提升时间序列预测精度

原标题：GITCO: Gated Inference-Time Context Optimization in TSFMs

速览

针对基于补丁的时间序列基础模型（TSFM）中存在的上下文中毒问题，研究者提出了GITCO框架。该框架包含门控、路由和批评三个组件，能在推理时选择性识别并抑制有害补丁，无需修改模型权重。在TimesFM 2.5上的评估显示，该方法平均降低了1.95%的MASE误差，并捕获了89.9%的改进上限。

基于 Patch（补丁）的时间序列基础模型（Time Series Foundation Models, TSFMs）在零样本预测（Zero-shot Forecasting）任务中展现了巨大的潜力。然而，这类模型面临着一个被称为“上下文中毒”（Context Poisoning）的严峻挑战。

在时间序列数据中，某些结构上异常（Structurally Anomalous）的 Patch 往往会捕获不成比例的注意力机制权重。这种异常的注意力分配并非源于真实的预测信号，而是噪声或异常值导致的干扰。其后果是，这些有害的 Patch 会悄无声息地降低模型的零样本预测质量，导致整体准确率下降。

传统的优化方法通常依赖于修改模型权重（如微调 Fine-tuning），但这需要大量的计算资源和标注数据，且难以在推理阶段动态适应不同的数据分布。因此，业界急需一种能够在推理时（Inference-Time）直接优化输入上下文，而不改变模型参数的高效解决方案。

针对上述痛点，研究团队提出了 GITCO（Gated Inference-Time Context Optimization，门控推理时上下文优化）。这是一种轻量级的框架，旨在通过优化输入上下文而非修改模型权重来提升 TSFMs 的准确性。

GITCO 由三个核心组件构成，它们协同工作以识别并抑制有害 Patch：

这三个组件共同作用，实现了在不更新任何模型参数的情况下，选择性识别并抑制有害 Patch 的目标。

研究团队在 TimesFM 2.5 模型上对 GITCO 进行了广泛评估。实验采用了 K 折交叉验证（K-fold cross-validation），涵盖了 53 个 GIFT-Eval 数据集。

性能提升：GITCO 在 TimesFM 2.5 上实现了平均 1.95% 的 MASE（平均绝对缩放误差）降低。MASE 越低，表示预测误差越小，模型性能越好。
上限捕获率：GITCO 捕获了该改进上限的 89.9%，表明该方法非常接近理论上的最优优化效果。

除了提出 GITCO 框架，研究还引入了“上下文敏感性剖面”这一新属性，用于表征 TSFMs 的特性。

GITCO 的提出为时间序列基础模型的落地应用提供了重要的工程优化思路。

首先，它解决了 TSFMs 在实际部署中面临的鲁棒性问题。通过在不修改模型权重的情况下抑制噪声和异常值的干扰，GITCO 使得基础模型在面对复杂、 noisy 的真实世界数据时，能够保持更高的预测稳定性。这对于金融、医疗、工业监控等对异常值敏感且标注数据稀缺的领域尤为重要。

其次，GITCO 证明了“推理时优化”（Inference-Time Optimization）作为一种轻量级增强手段的有效性。相比于昂贵的微调（Fine-tuning）或重新训练，这种基于输入上下文调整的方法极大地降低了部署成本和维护难度，使得大规模基础模型能够更灵活地适应多样化的下游任务。

最后，引入“上下文敏感性剖面”为未来研究提供了新的分析工具。通过量化模型对不同类型上下文的敏感度，研究人员可以更系统地理解基础模型的局限性，并指导后续模型架构的设计，使其在保持泛化能力的同时，增强对特定数据结构的适应性。