AI 资讯雷峰网·4 小时前

ICML 2026观点论文：AI美学对齐正窄化艺术表达

原标题：AI生成的图片正在反向对齐人类的审美？ICML 2026观点论文Spotlight

速览

ICML 2026观点论文《Universal Aesthetic Alignment Narrows Artistic Expression》指出，当前AI图像生成模型普遍追求单一的美学对齐标准，导致艺术表达趋于同质化。研究团队提出六大担忧，包括开发者偏见、个体与群体偏好冲突以及审美框架对现实多样性的压制。该研究呼吁反思算法设计中的价值捕获问题，保护艺术表达的多元性。

AI 深度解读

AI生成的图片正在反向对齐人类的审美？ICML 2026观点论文Spotlight

背景

随着人工智能图像生成技术的飞速发展，模型能力经历了从“生理结构错误”到“符合人类生理结构”，再到“符合人类审美偏好”的显著进化。早期 AI 生成的图片常出现手指数量错误、面部扭曲等不符合常理的现象，而当前的主流模型已能生成结构正确、细节清晰的图像。

在解决了“正确性”问题后，开发者将重心转向了“美学对齐”。ImageReward、HPSv2、HPSv3 等图像质量评估模型被广泛开发并应用于强化学习训练，旨在让 AI 生成的图片更贴合人类的主观偏好。然而，这种对单一、通用审美标准的追求，引发了学术界对于艺术表达多样性的担忧。

UBC（不列颠哥伦比亚大学）和 Weathon Software 的研究团队提出，当前图像生成模型在美学对齐过程中，可能正在削弱艺术表达的多元性，甚至导致用户审美被模型反向同化。该研究成果以观点论文（Position Paper）的形式被 ICML 2026 接收为 Spotlight。

核心内容

本文第一作者郭闻起（UBC 计算机系硕士生）与共同作者钱青云（UBC 计算机系本科生，法学背景）指出，AI 模型普遍追求单一价值对齐的做法存在严重隐患。他们的指导教授包括 UBC 的 Khalad Hasan（人机交互方向）和 Shan Du（计算机视觉与图形学方向）。

研究核心质疑在于：当图像生成模型被强制对齐到开发者预设的“通用审美标准”时，是否正在将艺术表达窄化为色彩艳丽、对比度鲜明、在社交媒体上备受青睐的“网红风”或“糖水片”？这种同质化的输出是否偏离了人类社会中真正的艺术多样性？

作者提出了六个相互关联的担忧，并通过实验验证了当前模型在遵循“反美学”指令时的固执性：

通用审美标准对个性化权利的侵蚀：开发者预设的审美标准可能并非为了服务用户，而是为了规避声誉、法律和市场风险。这种通过算法设计排除非主流风格的做法，剥夺了用户提出异议的权利，导致创造可能性的单一化。
开发者偏见隐性传递：即使开发者无意识引入偏见，其数据选择、标注实践和建模选择也会将狭隘的偏好传递给模型。例如，HPSv3 的标注者多为年轻人，且需通过专家一致性测试，导致结果无法跳出特定预设框架，排斥了多样化审美。
群体偏好对个体偏好的压制：当带有隐性偏见的“普适标准”成为默认服务质量时，群体偏好凌驾于个体意愿之上。模型采用统一框架而非遵从特定用户指令，导致用户美学偏好被反向对齐到模型偏好上，产生审美同质化。
过度美化现实：统一标准下的模型倾向于生成光鲜亮丽、完美无瑕的图像，而忽略了“丑”、小众风格或现实中的黑暗面。这使得生成图像无法代表用户想要的现实，仅呈现理想化的一面。
“正能量过剩”扭曲情感表达：奖励模型系统性惩罚带有消极情绪和风格的图像，给予明亮色彩和积极情绪更高分数。然而，消极情绪在人类认知和社会互动中不可或缺，拒绝消极风格会扭曲情感表达，削弱模型的表现力。
艺术价值单一化与去多元化：将复杂、多维度的美学探索压缩为单一奖励分数是典型的“价值捕获”。这限制了不同风格艺术的出现，压制了人类对多元美学的探讨。

实验验证：

为了验证模型对审美标准的固执程度，作者设计了包含 300 条 prompt 的数据集，基于 COCO 数据集，并引入“反美学”维度（如光线昏暗、颜色冲突、不合比例、负面情绪等），通过 Qwen3 合成反美学图像。

奖励模型测试：测试 HPSv3、HPSv2.1 等主流奖励模型以及 BLIP、CLIP 等图文匹配模型。结果显示，即使面对明确的反美学 prompt，HPSv3 等模型几乎无法正确选出对应的反美学图片；而未经过美学训练的 CLIP 和 BLIP 却能完美识别。这排除了 prompt 过于复杂导致模型无法理解的可能性。
图像生成模型测试：测试经过美学对齐的模型（如 DanceFlux）与未对齐模型（如 Nano Banana）。结果表明，经过美学对齐的模型普遍丧失了生成反美学图片的能力。例如，DanceFlux 在用户明确要求生成模糊昏暗风格时，仍固执地输出同质化的“糖水大片”。相比之下，Nano Banana 虽受用户惊叹于其美学质量，但仍能成功生成反美学图片，且其 HPSv3 分数差异最大。
真实摄影作品测试：从 AVA 数据集中筛选真实反美学摄影作品，让 LLM 生成标题，再用 AI 重新生成“干净”版本。HPSv3 严重偏好 AI 生成的干净版本，即使真实作品更符合艺术表达意图。
情绪表达测试：让 Nano Banana 生成对应开心、愤怒、伤心、恐惧的照片。HPSv3 强烈偏好正面情绪照片，选择负面情绪图片的准确率低于随机猜测。在生成侧，经过美学对齐的模型几乎无法稳定生成负面情绪。例如，当要求生成表现战争残酷的画面时，DanceFlux 生成的废墟中母亲仍带着微笑，削弱了批判性。

关键要点

美学对齐的副作用：当前主流的图像质量评估模型（如 HPSv3, ImageReward）在提升图片“美观度”的同时，严重削弱了模型生成非主流、负面情绪或“反美学”图像的能力。
审美同质化风险：模型倾向于输出色彩艳丽、对比度鲜明、符合社交媒体主流口味的“糖水片”，导致艺术表达趋于单一，边缘化小众风格和复杂情感。
反向对齐现象：用户在使用 AI 生成图像时，其个性化审美需求让位于开发者理解的“通用人类审美”。长期来看，用户可能被迫适应模型输出的单一风格，即“模型反向对齐人类审美”。
偏见来源：通用审美标准并非客观真理，而是包含了标注者（如年轻群体）、开发者偏好以及规避风险的商业考量，具有隐性的狭隘性。
情感表达受限：奖励模型系统性惩罚消极情绪，导致 AI 难以生成表达愤怒、悲伤或批判性的图像，甚至扭曲现实（如战争场景中的微笑），削弱了艺术的社会批判功能。
实验证据：通过构建“反美学”数据集，研究发现经过美学对齐的模型（如 DanceFlux）在遵循反美学指令时表现极差，而未对齐模型（如 Nano Banana）或基础模型（CLIP/BLIP）则能更好地识别和生成此类图像。

意义与影响

该研究对当前 AI 图像生成领域盲目追求“美学对齐”的趋势提出了重要警示。

首先，它揭示了技术中立性的幻觉。所谓的“人类通用审美”并非客观存在，而是由特定数据、标注群体和商业逻辑构建的主观标准。将其固化为算法默认值，实质上是一种算法偏见。

其次，它指出了艺术表达权的让渡危机。当 AI 工具成为艺术创作的主要辅助手段时，如果工具本身预设了单一的美学框架，创作者的想象空间和表达自由将被无形压缩。艺术的核心价值之一在于其多元性和对主流的挑战，而当前的对齐技术正在消解这一核心价值。

最后，该研究呼吁重新审视评估标准。在追求图像质量评估模型（Reward Models）性能的同时，必须引入对多样性、情感复杂性和反主流风格的包容性评估。否则，AI 生成的图像将沦为千篇一律的视觉消费品，而非具有深度和批判性的艺术表达载体。对于开发者而言，需要在“符合大众口味”与“尊重个体差异”之间寻找更平衡的技术路径，避免技术成为审美霸权的推手。

查看原文 →leiphone.com