技术博客arXiv cs.AI·7 小时前

GLARE：基于大模型的图像分类器全局解释自然语言查询接口

原标题：GLARE: A Natural Language Interface for Querying Global Explanations

速览

针对全局解释复杂难用的问题，GLARE系统通过大语言模型作为中介，将用户的自然语言问题转化为针对局部解释数据的结构化SQL查询。该系统支持灵活的数据聚合，并输出带有统计增强和可视化效果的响应，无需用户掌握底层技术细节。评估表明，这种基于大模型的查询方式显著提升了人类中心可解释性AI（XAI）中全局解释的可用性和可访问性。

AI 深度解读

GLARE：基于自然语言接口的全局解释查询系统深度解读

背景

在可解释人工智能（XAI）领域，理解黑盒模型（如计算机视觉模型）的行为至关重要。传统的解释方法通常分为“局部解释”（Local Explanations）和“全局解释”（Global Explanations）。局部解释关注单个预测（例如，为什么这张图片被分类为猫），而全局解释则旨在揭示模型在整个数据集、类别或决策上下文中的整体行为模式。

尽管全局解释对于全面理解模型至关重要，但它们往往以复杂、单一且静态的形式呈现（如复杂的决策树、特征重要性图表或聚合统计量）。这种“单体式”（monolithic）的特性使得用户难以进行灵活的探索。在实际应用中，用户通常不会满足于查看静态的解释 artifact，而是希望针对特定问题（例如，“模型在哪些情况下容易误判红色物体？”）获得针对性的答案。现有的工具往往要求用户具备低层数据表示的专业知识，或者只能提供固定的可视化视图，缺乏交互性和灵活性。

为了解决这一痛点，研究人员提出了 GLARE（Global Explanation Analysis via Natural Language Interface for Explanations，通过自然语言接口查询全局解释），这是一个基于大语言模型（LLM）的交互式界面，旨在让用户通过自然语言直接查询全局解释数据，从而降低使用门槛并提高可用性。

核心内容

GLARE 系统的核心设计理念是将自然语言作为用户与全局解释数据之间的桥梁。该系统专门针对黑盒图像分类器设计，其工作流程和架构如下：

1. 系统架构与中介角色

GLARE 的核心是一个大语言模型（LLM），它充当“中介者”（Mediator）。这个 LLM 并不直接生成解释，而是负责理解用户的自然语言意图，并将其转化为结构化的查询语言。

2. 从自然语言到结构化查询

用户的查询（例如：“统计一下模型在‘狗’类别上置信度低于 0.5 的样本中，哪些背景元素最常见？”）被 LLM 解析。LLM 将这些非结构化文本转换为针对底层局部解释数据的结构化 SQL 查询。

底层数据基础：系统预先计算并存储了局部解释数据（如每个预测的特征重要性、注意力权重等）。
抽象层：通过 SQL 查询，系统可以在不暴露用户底层数据结构和代码的情况下，实现对局部解释数据的灵活聚合和分析。

3. 多模态响应生成

对于每一个查询，GLARE 不仅返回文本结果，还生成三种类型的输出，以支持全面理解：

增强统计信息的自然语言响应：LLM 将查询结果（如计数、平均值、分布）转化为易于理解的文本描述。
局部解释支持：提供具体的样本级解释，以佐证全局统计结果。
意图对齐的可视化：根据用户的问题类型，自动生成最合适的图表或可视化视图，帮助用户直观地看到数据模式。

4. 评估维度

研究团队在多个维度上对 GLARE 进行了评估，以验证其有效性：

意图解释准确性：LLM 是否正确理解了用户的自然语言问题。
查询映射准确率：自然语言到 SQL 查询的转换是否准确无误。
泛化能力：系统在面对未见过的查询类型和新数据集时的表现。
鲁棒性：系统对用户语言错误（如拼写错误、语法不规范）的容忍度。

关键要点

交互范式转变：GLARE 将全局解释从“静态查看”转变为“动态查询”。用户不再被动接受预设的解释视图，而是可以主动提问，获取定制化的洞察。
LLM 作为 SQL 生成器：利用 LLM 的自然语言理解能力，将复杂的 SQL 查询生成过程抽象化，使用户无需掌握数据库查询语言即可访问复杂的局部解释数据聚合结果。
无需暴露底层复杂性：系统设计的关键在于隐藏了局部解释数据的低层表示（low-level representations）。用户只需关注业务逻辑和自然语言问题，系统自动处理数据聚合和查询执行。
综合反馈机制：输出不仅仅是数字或图表，而是结合了“统计摘要 + 文本解释 + 局部证据 + 可视化”的综合反馈，确保解释既宏观又具体，既定量又定性。
实证效果显著：实验结果表明，LLM 中介的查询方式显著提高了全局解释的可访问性（Accessibility）和可用性（Usability），特别是在处理人类中心（Human-centered）的可解释性需求时。

意义与影响

GLARE 的提出对可解释人工智能（XAI）的实践具有重要的推动作用：

降低 XAI 的使用门槛：传统的全局解释工具往往需要数据科学家或机器学习工程师操作，而 GLARE 允许领域专家（如医生、金融分析师）通过自然语言直接探索模型行为，促进了人机协作中的透明度。
解决全局解释的“可用性危机”：全局解释虽然信息量大，但往往难以解读。GLARE 通过交互式查询，帮助用户聚焦于他们关心的特定子集或模式，避免了信息过载。
增强信任与调试能力：通过允许用户针对特定错误模式或边界案例进行查询，GLARE 帮助开发者更有效地调试模型，识别系统性偏差，从而增强对黑盒模型的信任。
推动 LLM 在 XAI 中的应用：该工作展示了 LLM 不仅用于生成文本，还可以作为复杂的查询引擎中介，连接自然语言意图与结构化数据，为未来的智能分析工具提供了新的架构思路。

总之，GLARE 代表了 XAI 工具从“提供解释”向“支持解释性探索”的演进，是构建以人为中心、可交互、可理解的人工智能系统的重要一步。

查看原文 →arxiv.org