技术博客arXiv cs.AI·1 天前

Low-cost concept-based localized explanations: How far can we get with training-free approaches?

AI 深度解读

背景

可解释人工智能（Explainable AI, XAI）长期面临一个核心困境：模型给出的解释要么过于抽象（如注意力热图），要么需要大量人工标注来验证其语义正确性。概念式可解释AI（Concept-based Explainable AI, C-XAI）试图用人类可理解的语义概念（如"翅膀""轮胎""条纹"）来解释模型决策，但这一方向的发展被一个现实瓶颈所限制——精细化的概念标注数据极度稀缺。为每个图像区域标注"这是鸟喙""那是机翼"需要高昂的人力成本，这严重制约了C-XAI方法的规模化验证与落地。

核心内容

这篇论文探讨了一个务实的问题：能否在不进行任何微调训练的前提下，利用现成的大规模多模态模型，以极低成本完成图像局部区域的概念标注？

研究者聚焦于"概念命名"（Concept Naming, CoNa）任务——给定一个图像中的边界框（bounding-box）区域，让模型为这个区域分配一个语义标签。他们特别关注两个层级：物体级（object-level，如"狗""汽车"）和部件级（part-level，如"车轮""引擎盖"），并在严格的零样本（zero-shot）条件下进行评估，即模型在推理时没有任何针对目标数据集的训练或微调。

为了系统评估这一能力，论文提出了一套可复现的零样本评估协议，包含两种策略：

CoNa（闭集提示）：适用于中等规模词汇表的场景。采用闭集、类别受限的提示方式，即给定一个有限的候选类别列表，让模型从中选择最匹配的标签。这种方式模拟了分类任务中常见的约束条件。
Open-CoNa（开放集嵌入匹配）：适用于大规模标签空间的场景。当候选概念数量庞大时，逐一提示效率低下，该方法改用嵌入相似度（embedding similarity）进行匹配——将区域图像和候选概念文本分别编码到向量空间，通过相似度排序完成命名，避免了枚举所有候选。

实验在四个中规模多模态大模型（MLLMs，参数量7B至32B）上进行，结果显示：在物体级概念命名任务上，模型达到了 62%–88% 的精确匹配准确率，且不同模型在不同数据集上表现出一致的性能趋势。这一结果揭示了一个重要信号：无需任何训练，仅凭现成MLLM的零样本能力，就有可能为C-XAI提供低成本的概念标注来源。

论文同时讨论了当前方法的局限性与失败模式，并发布了一个可复现的评估框架，以支持未来低资源、低成本的C-XAI研究。

关键要点

任务定义：在严格零样本条件下，评估MLLM为图像局部区域（边界框内）分配语义概念标签的能力，覆盖物体级和部件级两个粒度。
双策略评估协议：CoNa（闭集提示，适合小词汇表）和Open-CoNa（嵌入相似度匹配，适合大词汇表），形成互补的评估工具。
核心发现：7B–32B规模的MLLM在物体级概念命名上可达62%–88%准确率，证明训练无关的概念标注具有现实可行性。
研究贡献：提供可复现的评估框架，降低C-XAI研究的标注成本门槛，为后续工作提供基线和工具。
局限与展望：论文坦承当前方法存在失败模式（如对部件级标注的混淆、对相似概念的区分不足等），并指出未来方向。

意义与影响

这项研究的意义在于，它并未追求在概念标注任务上刷新SOTA，而是为C-XAI领域打开了一扇低成本实践的大门。当前，构建可解释AI系统往往依赖昂贵的人工标注或复杂的训练流程，这限制了方法在真实场景中的可扩展性。该工作证明，利用现成MLLM的零样本能力，可以在不牺牲语义质量的前提下，大幅降低概念标注的成本，使更多研究者和中小团队能够参与到C-XAI的研究与验证中来。

从更广泛的视角看，这项工作也呼应了AI领域的一个趋势：当模型规模达到一定程度后，其涌现的零样本能力可以替代部分传统的监督微调流程。这对于那些标注成本极高、数据稀缺的领域（如医疗影像中的细粒度概念、专业领域视觉知识）具有特别的启示意义。当然，62%–88%的准确率距离工业级应用尚有差距，但作为一个概念验证（proof of concept），它已经清晰地展示了"训练无关"路线的潜力与边界，为后续研究提供了有价值的参照系和优化方向。

查看原文 →arxiv.org

Low-cost concept-based localized explanations: How far can we get with training-free approaches?

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐