AI 资讯Hacker News·6 天前

警惕AI黄金路上的致命陷阱

原标题：Avoiding Death on the Yellow Brick Road

速览

文章探讨了在AI技术快速普及的背景下，企业和开发者在追求技术红利时可能面临的严峻挑战。通过剖析“黄金之路”上的潜在危机，旨在提醒业界保持清醒，避免盲目跟风导致不可挽回的损失。这一警示对于确保AI技术的可持续发展和安全落地具有重要意义。

AI 深度解读

避开“黄砖路”：为什么应用层并未死亡

背景

近期，在创始人和潜在员工中流传着一个令人焦虑的问题：是否还有 AI 应用层（Application Layer）值得构建？还是说 OpenAI 和 Anthropic 等基础模型实验室（Labs）即将吞噬一切？

这种焦虑背后反映了一种特定的“AI 精神病”（AI psychosis）。部分观点认为，为了避免成为永久性的“永久底层阶级”，唯一持久的避风港要么是在大型实验室内部，要么是在前沿领域从事机器人技术、硬科技（Hardtech）等“实验室无法触及”的工作。如果认为每一块软件领地都即将被 Codex 或 Claude 直接吸收，或被未来更强大的模型使现有产品变得多余，那么唯一的建议就是“快跑”。

然而，尽管作者自视为 AI 最大主义者之一，并承认实验室确实在侵蚀巨大的应用表面，但“应用层”并非单一的同质化机会。正确的框架应当是区分你是走在“黄砖路”上，还是在奥兹国（Oz）的其他地方。

核心内容

什么是“黄砖路”？

“黄砖路”是我们对实验室正在行走的路径的代称，它们在此投入了非凡的资源。实验室在代码生成、写作或图像创作等问题上具有优势，因为这些问题直接受益于原始模型能力的提升：每一美元投入在预训练和后训练上，都能直接提高产品质量。

对于初创公司而言，“黄砖路”是最显而易见但也最危险的路径。其典型玩法是：

选取一个高性能模型。
接入一些现成的连接器（如 G Drive, Slack, Salesforce, Notion, GitHub）。
在其上方构建某种代理编排层（Agentic orchestration layer）。

这种模式的问题在于，这正是 OpenAI 的 Cowork 和 Codex 正在做的事情。实验室拥有模型本身，这意味着它们拥有更好的利润率、控制权，以及对下游任何人的定价权。更重要的是，它们拥有定义其产品解决能力的架构选择。目前，它们刻意遵循“模型+工具调用”的模式，这恰好满足了黄砖路上低步骤数、水平化工作的需求。

即使初创公司能在技术上超越 Codex 或 Claude Code，实验室也拥有庞大的分发渠道和 AI 领域最大的品牌光环。如果你是一家使用相同连接器、没有子代理或底层配置、且没有分发渠道的 AI 应用公司，你很可能正走在一条通往虚无的道路上。

奥兹国的其他地方

对于初创公司而言，前景并非一片黑暗。在“黄砖路”之外，存在着巨大的机会，初创公司可以清晰地拥有客户并解决复杂问题。

这些企业正在构建代理体验，将模型编织进复杂的工具、自动化和集成（即软件）网络中。这导致大多数此类初创公司默认具有垂直行业属性（Vertical）。它们专注于多步骤、多角色的工作，包括针对特定角色和垂直领域的子代理。这些工作是 Anthropic 和 OpenAI 的水平平台无法触及的，例如：

跨系统收集上下文。
通过多个需要在不同阶段进行审批的人类进行路由。
涉及一个或多个遗留系统。
倾向于需要确定性结果，因为歧义是不可接受的。
有时与有价值的业务结果挂钩。

实验室深知这些问题的价值：这就是为什么它们正在建立自己的外包配置公司，以及为什么整个高端强化学习（Reinforcement Learning）业务阶层得以存在的原因。

为什么“奥兹国”的其他地方不会被“巫师”（实验室）完全掌控

反对意见认为，迄今为止，押注模型/实验室不会改善是一个糟糕的交易。它们可能会变得更好，并最终侵蚀这些应用层企业的市场。

作者认为，尽管实验室肯定会进步，但“奥兹国”的其他地方可以通过以下方式在未来进行防御：

1. 数据与学习飞轮（Data and learning flywheels） 许多内化的知识并不存在于任何训练集中——未书写的行业规范、未记录的標準、存在于从业者头脑中的部落知识。这些都不在公共网络上。没有任何训练算力可以替代身处这些知识实际存在的流程之中。这里存在两个叠加的飞轮：

跨客户飞轮：当你看到更多相同问题的变体时，模式会复合增长。
客户内部飞轮：特定决策背后的原因、未说出的例外情况、公司自己的经验法则，这些只有通过与系统的真实互动才会浮现。

即使客户数据不能跨客户使用，应用公司也能利用跨客户问题类型的模式识别，并以此告知未来问题的正确架构。一家已经让代理经历了一百次法律红线审查、一千次保险核保周期或一万次 SDR（销售开发代表）活动的公司，已经以新进入者无法通过首次启动新代理来复制的方式，内化了问题的形状。

虽然水平代理原则上可以构建相同的学习基础设施，但除了纯粹的关注点外，原因还在于用户体验（UX）：捕获这类知识完全取决于你给用户的工作流界面。垂直参与者可以根据其工作流需求塑造这些界面，而水平工具无法做到这一点。评估集、标记输出和边缘案例分类法可以复合成垂直特定的数据飞轮，为微调提供燃料，这是新进入者在没有 comparable 生产曝光的情况下无法生成的。

2. 管理模型变体与复杂性 实验室内部已经在进行路由——为不同请求使用不同的模型类别，底层使用集成模型。但它们无法做到的是：

跨供应商进行路由。
评估竞争对手的模型以完成特定的子任务。
在模型表现最好的狭窄领域使用开源微调模型。

“奥兹国”的公司会从整个模型市场中为每个子任务选择正确的模型，而不仅仅是其父级实验室发布的模型。此外，它们还承担了没人愿意做的工作：每次新模型发布时，重新运行升级评估、为客户的边缘案例重新校准提示词、在不破坏生产环境的情况下推出。实验室不会代表客户做这些；它们出售你的下一个模型并告诉你去迁移。而“奥兹国”的公司吸收了迁移的成本。客户得到的是可用的最佳情报。

关键要点

区分路径：应用层并未死亡，但需区分“黄砖路”（水平化、通用型、依赖原始模型能力的任务）和“奥兹国的其他地方”（垂直化、复杂、依赖上下文和流程的任务）。
实验室的优势与局限：实验室在代码生成、写作等随模型能力线性提升的任务上具有统治力，拥有定价权和分发优势。但在处理跨系统、多角色审批、遗留系统集成等复杂垂直场景时，通用平台难以胜任。
垂直应用的护城河：
- 数据飞轮：通过长期深耕特定行业，积累未公开的行业规范、部落知识和边缘案例数据，形成竞争对手难以复制的模式识别能力。
- 模型编排能力：垂直应用公司能够跨供应商选择最优模型，处理模型迁移、评估和提示词校准等繁琐工作，为客户提供确定性结果。
战略建议：如果想通过构建 AI 应用致富，应避开“黄砖路”，避免仅做简单的模型包装和通用连接器集成，转而深入垂直行业，解决需要复杂代理编排、多步骤工作和特定领域知识的问题。

意义与影响

这篇文章为 AI 创业者和投资者提供了一个重要的战略纠偏。在“大模型吞噬一切”的恐慌情绪中，它指出了应用层的结构性机会依然存在，但形态已经改变。

从“通用工具”转向“垂直解决方案”：简单的 AI 包装器（Wrapper）公司将面临巨大的生存危机，因为它们无法抵御实验室的直接竞争。真正的价值在于将 AI 深度集成到特定的工作流、遗留系统和行业规范中。
数据资产的重估：在 AI 时代，数据不仅仅是训练素材，更是工作流中的实时反馈和隐性知识。拥有高质量、垂直领域、非公开数据的企业将建立起基于“学习飞轮”的长期壁垒。
工程价值的回归：虽然模型能力在提升，但如何管理模型变体、处理边缘情况、确保生产环境的稳定性以及整合多供应商模型，这些工程化工作变得比以往更重要。这为专注于 AI 基础设施和编排层的公司提供了新的生存空间。
对创业者的启示：创业者不应试图在实验室擅长的领域（如通用代码生成、通用写作）与其竞争，而应寻找那些“实验室无法触及”的复杂、垂直、需要确定性结果的场景，通过深耕行业知识来

查看原文 →a16z.news