Agent SkillLINUX DO · AI·2026/1/7

AI能力已非瓶颈，提示词工程成发挥模型潜力的关键

原标题：在AI已经足够强的当下，我们的表达成了限制模型能力的瓶颈

速览

文章指出，在AI能力基本被认可的当下，表达已成为限制模型能力的瓶颈。传统的提示词工程存在信息损耗，用户需通过更精细的沟通策略（如提供正面案例、多轮讨论）来对齐模型意图。掌握提示词工程能显著提升模型表现，对人提出了更高要求。

AI 深度解读

在AI已经足够强的当下，我们的表达成了限制模型能力的瓶颈

背景

回顾过去，人工智能的发展轨迹呈现出明显的阶段性特征。在大约25年前，AI的基础能力尚不足以应对复杂任务，因此行业重心主要集中于提升模型本身的底层能力。然而，随着2025年这一整年AI技术的飞速发展，这一格局发生了根本性转变。2025年被广泛视为“Agent（智能体）元年”，AI的基础能力已得到基本认可，其执行任务的可靠性不再是主要矛盾。

当前的核心矛盾已从“AI能不能做”转移到了“用户能不能说清楚让它做成什么样”。如何精准理解用户需求，成为了制约AI能力发挥的新瓶颈。正如一位行业专家在播客中所指出的，AI对齐（Alignment）的本质难点在于信息在传输过程中的巨大损耗：从人类大脑解码为语言，再到语言被向量化为模型可理解的内容，这一过程中存在大量的信息流失。尽管脑机接口等未来技术可能降低这种损耗，但在当前技术条件下，言语往往无法完全承载用户脑海中完整的信息量。

核心内容

面对上述瓶颈，模型公司和开发者框架做出了诸多努力以缩小“理解差距”。模型公司通过针对人类偏好进行后训练（Post-training），试图让模型能够理解用户未明说的“言外之意”。同时，许多工作流框架如 cc 的 plan 模式、spec kit 等，在执行任务前会主动确认需求，这本质上是一种尝试与用户进行对齐的机制。

然而，即便使用了最先进的模型和最完善的框架，用户仍可能感到AI无法完全理解其意图。这是因为现有的对齐机制主要基于大众平均偏好或内部专家的偏好，往往忽略了用户个体独特的、细微的想象。例如，当用户提示“帮我完成一个背单词的app”时，即使聪明地使用 cc 的 plan 模式，AI也会询问技术栈、目标群体和功能需求。虽然这比直接生成要好，但它依然停留在通用层面。用户脑海中对于该App的独特设想、特色功能或绝对禁忌，并未被充分传递。

因此，提升个人的表达能力，将脑海中具象化的想象尽可能多地传递给AI，成为了解决这一问题的关键。这一过程充满挑战，因为将抽象感觉转化为具体描述非常困难。以写小说为例，作者常发现单纯指出“感觉不对”或“描写不对”效果不佳，AI甚至建议提供正面案例而非负面反馈。此时，作者采取的策略是：发送自己喜欢的片段给AI，让其总结风格，然后在此基础上进行调整。在开发玩具项目时，作者也会先与 Gemini 开启单独对话进行深度讨论。尽管这种沟通方式仍存在信息损耗，但相比直接生成，其收益远大于弊端。

关键要点

矛盾转移：AI发展的主要矛盾已从“能力不足”转变为“表达不清”。2025年作为Agent元年，核心瓶颈在于用户能否清晰描述需求。
信息损耗原理：从大脑思维到语言表达，再到模型向量化的过程中存在巨大的信息损耗，导致言语无法完全承载用户的完整意图。
现有方案的局限：
- 模型公司的后训练和框架（如 cc 的 plan 模式、spec kit）旨在通过确认需求和对齐偏好来减少误差。
- 但这些方案主要基于大众或专家的平均偏好，难以覆盖用户个体独特的、细微的个性化需求。
提升表达的策略：
- 避免使用模糊的通用提示词（如“帮我做一个背单词app”）。
- 尽可能详细地传递脑海中的具体想象，包括特色功能和禁忌点。
- 利用正面案例：当难以描述“不要什么”时，提供“喜欢什么”的正面案例供AI总结和调整。
- 深度对话：对于复杂项目，先与模型（如 Gemini）进行单独的、深入的讨论，以最大化信息传递效率。
提示词工程的本质：提示词工程不仅是编写指令，更是一门关于管理上下文注意力分配、选择合适框架的学问，旨在显著提升模型的实际表现。

意义与影响

这一观点深刻揭示了人机协作关系的新常态：AI不会简单地取代人类，反而对人类提出了更高的要求。在模型能力趋于饱和的背景下，人类的竞争力不再仅仅取决于是否拥有强大的工具，而取决于能否通过精准的表达、清晰的逻辑和独特的创意，将抽象思维转化为机器可执行的具体指令。

这意味着“提示词工程”已超越简单的技术技巧，上升为一种核心的认知与沟通能力。用户需要学习如何更好地管理注意力、构建上下文，并掌握与AI对齐的艺术。未来的AI应用效率，将极大程度地依赖于用户个体的表达能力和思维清晰度。因此，持续学习如何更有效地与AI沟通，将成为数字时代不可或缺的关键技能。

查看原文 →linux.do