AI能力已非瓶颈,提示词工程成发挥模型潜力的关键
速览
文章指出,在AI能力基本被认可的当下,表达已成为限制模型能力的瓶颈。传统的提示词工程存在信息损耗,用户需通过更精细的沟通策略(如提供正面案例、多轮讨论)来对齐模型意图。掌握提示词工程能显著提升模型表现,对人提出了更高要求。
AI 深度解读
在AI已经足够强的当下,我们的表达成了限制模型能力的瓶颈
背景
回顾过去,人工智能的发展轨迹呈现出明显的阶段性特征。在大约25年前,AI的基础能力尚不足以应对复杂任务,因此行业重心主要集中于提升模型本身的底层能力。然而,随着2025年这一整年AI技术的飞速发展,这一格局发生了根本性转变。2025年被广泛视为“Agent(智能体)元年”,AI的基础能力已得到基本认可,其执行任务的可靠性不再是主要矛盾。
当前的核心矛盾已从“AI能不能做”转移到了“用户能不能说清楚让它做成什么样”。如何精准理解用户需求,成为了制约AI能力发挥的新瓶颈。正如一位行业专家在播客中所指出的,AI对齐(Alignment)的本质难点在于信息在传输过程中的巨大损耗:从人类大脑解码为语言,再到语言被向量化为模型可理解的内容,这一过程中存在大量的信息流失。尽管脑机接口等未来技术可能降低这种损耗,但在当前技术条件下,言语往往无法完全承载用户脑海中完整的信息量。
核心内容
面对上述瓶颈,模型公司和开发者框架做出了诸多努力以缩小“理解差距”。模型公司通过针对人类偏好进行后训练(Post-training),试图让模型能够理解用户未明说的“言外之意”。同时,许多工作流框架如 cc 的 plan 模式、spec kit 等,在执行任务前会主动确认需求,这本质上是一种尝试与用户进行对齐的机制。
然而,即便使用了最先进的模型和最完善的框架,用户仍可能感到AI无法完全理解其意图。这是因为现有的对齐机制主要基于大众平均偏好或内部专家的偏好,往往忽略了用户个体独特的、细微的想象。例如,当用户提示“帮我完成一个背单词的app”时,即使聪明地使用 cc 的 plan 模式,AI也会询问技术栈、目标群体和功能需求。虽然这比直接生成要好,但它依然停留在通用层面。用户脑海中对于该App的独特设想、特色功能或绝对禁忌,并未被充分传递。
因此,提升个人的表达能力,将脑海中具象化的想象尽可能多地传递给AI,成为了解决这一问题的关键。这一过程充满挑战,因为将抽象感觉转化为具体描述非常困难。以写小说为例,作者常发现单纯指出“感觉不对”或“描写不对”效果不佳,AI甚至建议提供正面案例而非负面反馈。此时,作者采取的策略是:发送自己喜欢的片段给AI,让其总结风格,然后在此基础上进行调整。在开发玩具项目时,作者也会先与 Gemini 开启单独对话进行深度讨论。尽管这种沟通方式仍存在信息损耗,但相比直接生成,其收益远大于弊端。
关键要点
- 矛盾转移:AI发展的主要矛盾已从“能力不足”转变为“表达不清”。2025年作为Agent元年,核心瓶颈在于用户能否清晰描述需求。
- 信息损耗原理:从大脑思维到语言表达,再到模型向量化的过程中存在巨大的信息损耗,导致言语无法完全承载用户的完整意图。
- 现有方案的局限:
- 模型公司的后训练和框架(如 cc 的 plan 模式、spec kit)旨在通过确认需求和对齐偏好来减少误差。
- 但这些方案主要基于大众或专家的平均偏好,难以覆盖用户个体独特的、细微的个性化需求。
- 提升表达的策略:
- 避免使用模糊的通用提示词(如“帮我做一个背单词app”)。
- 尽可能详细地传递脑海中的具体想象,包括特色功能和禁忌点。
- 利用正面案例:当难以描述“不要什么”时,提供“喜欢什么”的正面案例供AI总结和调整。
- 深度对话:对于复杂项目,先与模型(如 Gemini)进行单独的、深入的讨论,以最大化信息传递效率。
- 提示词工程的本质:提示词工程不仅是编写指令,更是一门关于管理上下文注意力分配、选择合适框架的学问,旨在显著提升模型的实际表现。
意义与影响
这一观点深刻揭示了人机协作关系的新常态:AI不会简单地取代人类,反而对人类提出了更高的要求。在模型能力趋于饱和的背景下,人类的竞争力不再仅仅取决于是否拥有强大的工具,而取决于能否通过精准的表达、清晰的逻辑和独特的创意,将抽象思维转化为机器可执行的具体指令。
这意味着“提示词工程”已超越简单的技术技巧,上升为一种核心的认知与沟通能力。用户需要学习如何更好地管理注意力、构建上下文,并掌握与AI对齐的艺术。未来的AI应用效率,将极大程度地依赖于用户个体的表达能力和思维清晰度。因此,持续学习如何更有效地与AI沟通,将成为数字时代不可或缺的关键技能。
