← 返回信息流
AI 资讯Hacker News·6 天前

警惕AI黄金路上的致命陷阱

原标题:Avoiding Death on the Yellow Brick Road

速览

文章探讨了在AI技术快速普及的背景下,企业和开发者在追求技术红利时可能面临的严峻挑战。通过剖析“黄金之路”上的潜在危机,旨在提醒业界保持清醒,避免盲目跟风导致不可挽回的损失。这一警示对于确保AI技术的可持续发展和安全落地具有重要意义。

AI 深度解读

避开“黄砖路”:为什么应用层并未死亡

背景

近期,在创始人和潜在员工中流传着一个令人焦虑的问题:是否还有 AI 应用层(Application Layer)值得构建?还是说 OpenAI 和 Anthropic 等基础模型实验室(Labs)即将吞噬一切?

这种焦虑背后反映了一种特定的“AI 精神病”(AI psychosis)。部分观点认为,为了避免成为永久性的“永久底层阶级”,唯一持久的避风港要么是在大型实验室内部,要么是在前沿领域从事机器人技术、硬科技(Hardtech)等“实验室无法触及”的工作。如果认为每一块软件领地都即将被 Codex 或 Claude 直接吸收,或被未来更强大的模型使现有产品变得多余,那么唯一的建议就是“快跑”。

然而,尽管作者自视为 AI 最大主义者之一,并承认实验室确实在侵蚀巨大的应用表面,但“应用层”并非单一的同质化机会。正确的框架应当是区分你是走在“黄砖路”上,还是在奥兹国(Oz)的其他地方。

核心内容

什么是“黄砖路”?

“黄砖路”是我们对实验室正在行走的路径的代称,它们在此投入了非凡的资源。实验室在代码生成、写作或图像创作等问题上具有优势,因为这些问题直接受益于原始模型能力的提升:每一美元投入在预训练和后训练上,都能直接提高产品质量。

对于初创公司而言,“黄砖路”是最显而易见但也最危险的路径。其典型玩法是:

  1. 选取一个高性能模型。
  2. 接入一些现成的连接器(如 G Drive, Slack, Salesforce, Notion, GitHub)。
  3. 在其上方构建某种代理编排层(Agentic orchestration layer)。

这种模式的问题在于,这正是 OpenAI 的 Cowork 和 Codex 正在做的事情。实验室拥有模型本身,这意味着它们拥有更好的利润率、控制权,以及对下游任何人的定价权。更重要的是,它们拥有定义其产品解决能力的架构选择。目前,它们刻意遵循“模型+工具调用”的模式,这恰好满足了黄砖路上低步骤数、水平化工作的需求。

即使初创公司能在技术上超越 Codex 或 Claude Code,实验室也拥有庞大的分发渠道和 AI 领域最大的品牌光环。如果你是一家使用相同连接器、没有子代理或底层配置、且没有分发渠道的 AI 应用公司,你很可能正走在一条通往虚无的道路上。

奥兹国的其他地方

对于初创公司而言,前景并非一片黑暗。在“黄砖路”之外,存在着巨大的机会,初创公司可以清晰地拥有客户并解决复杂问题。

这些企业正在构建代理体验,将模型编织进复杂的工具、自动化和集成(即软件)网络中。这导致大多数此类初创公司默认具有垂直行业属性(Vertical)。它们专注于多步骤、多角色的工作,包括针对特定角色和垂直领域的子代理。这些工作是 Anthropic 和 OpenAI 的水平平台无法触及的,例如:

  • 跨系统收集上下文。
  • 通过多个需要在不同阶段进行审批的人类进行路由。
  • 涉及一个或多个遗留系统。
  • 倾向于需要确定性结果,因为歧义是不可接受的。
  • 有时与有价值的业务结果挂钩。

实验室深知这些问题的价值:这就是为什么它们正在建立自己的外包配置公司,以及为什么整个高端强化学习(Reinforcement Learning)业务阶层得以存在的原因。

为什么“奥兹国”的其他地方不会被“巫师”(实验室)完全掌控

反对意见认为,迄今为止,押注模型/实验室不会改善是一个糟糕的交易。它们可能会变得更好,并最终侵蚀这些应用层企业的市场。

作者认为,尽管实验室肯定会进步,但“奥兹国”的其他地方可以通过以下方式在未来进行防御:

1. 数据与学习飞轮(Data and learning flywheels) 许多内化的知识并不存在于任何训练集中——未书写的行业规范、未记录的標準、存在于从业者头脑中的部落知识。这些都不在公共网络上。没有任何训练算力可以替代身处这些知识实际存在的流程之中。这里存在两个叠加的飞轮:

  • 跨客户飞轮:当你看到更多相同问题的变体时,模式会复合增长。
  • 客户内部飞轮:特定决策背后的原因、未说出的例外情况、公司自己的经验法则,这些只有通过与系统的真实互动才会浮现。

即使客户数据不能跨客户使用,应用公司也能利用跨客户问题类型的模式识别,并以此告知未来问题的正确架构。一家已经让代理经历了一百次法律红线审查、一千次保险核保周期或一万次 SDR(销售开发代表)活动的公司,已经以新进入者无法通过首次启动新代理来复制的方式,内化了问题的形状。

虽然水平代理原则上可以构建相同的学习基础设施,但除了纯粹的关注点外,原因还在于用户体验(UX):捕获这类知识完全取决于你给用户的工作流界面。垂直参与者可以根据其工作流需求塑造这些界面,而水平工具无法做到这一点。评估集、标记输出和边缘案例分类法可以复合成垂直特定的数据飞轮,为微调提供燃料,这是新进入者在没有 comparable 生产曝光的情况下无法生成的。

2. 管理模型变体与复杂性 实验室内部已经在进行路由——为不同请求使用不同的模型类别,底层使用集成模型。但它们无法做到的是:

  • 跨供应商进行路由。
  • 评估竞争对手的模型以完成特定的子任务。
  • 在模型表现最好的狭窄领域使用开源微调模型。

“奥兹国”的公司会从整个模型市场中为每个子任务选择正确的模型,而不仅仅是其父级实验室发布的模型。此外,它们还承担了没人愿意做的工作:每次新模型发布时,重新运行升级评估、为客户的边缘案例重新校准提示词、在不破坏生产环境的情况下推出。实验室不会代表客户做这些;它们出售你的下一个模型并告诉你去迁移。而“奥兹国”的公司吸收了迁移的成本。客户得到的是可用的最佳情报。

关键要点

  • 区分路径:应用层并未死亡,但需区分“黄砖路”(水平化、通用型、依赖原始模型能力的任务)和“奥兹国的其他地方”(垂直化、复杂、依赖上下文和流程的任务)。
  • 实验室的优势与局限:实验室在代码生成、写作等随模型能力线性提升的任务上具有统治力,拥有定价权和分发优势。但在处理跨系统、多角色审批、遗留系统集成等复杂垂直场景时,通用平台难以胜任。
  • 垂直应用的护城河
    • 数据飞轮:通过长期深耕特定行业,积累未公开的行业规范、部落知识和边缘案例数据,形成竞争对手难以复制的模式识别能力。
    • 模型编排能力:垂直应用公司能够跨供应商选择最优模型,处理模型迁移、评估和提示词校准等繁琐工作,为客户提供确定性结果。
  • 战略建议:如果想通过构建 AI 应用致富,应避开“黄砖路”,避免仅做简单的模型包装和通用连接器集成,转而深入垂直行业,解决需要复杂代理编排、多步骤工作和特定领域知识的问题。

意义与影响

这篇文章为 AI 创业者和投资者提供了一个重要的战略纠偏。在“大模型吞噬一切”的恐慌情绪中,它指出了应用层的结构性机会依然存在,但形态已经改变。

  1. 从“通用工具”转向“垂直解决方案”:简单的 AI 包装器(Wrapper)公司将面临巨大的生存危机,因为它们无法抵御实验室的直接竞争。真正的价值在于将 AI 深度集成到特定的工作流、遗留系统和行业规范中。
  2. 数据资产的重估:在 AI 时代,数据不仅仅是训练素材,更是工作流中的实时反馈和隐性知识。拥有高质量、垂直领域、非公开数据的企业将建立起基于“学习飞轮”的长期壁垒。
  3. 工程价值的回归:虽然模型能力在提升,但如何管理模型变体、处理边缘情况、确保生产环境的稳定性以及整合多供应商模型,这些工程化工作变得比以往更重要。这为专注于 AI 基础设施和编排层的公司提供了新的生存空间。
  4. 对创业者的启示:创业者不应试图在实验室擅长的领域(如通用代码生成、通用写作)与其竞争,而应寻找那些“实验室无法触及”的复杂、垂直、需要确定性结果的场景,通过深耕行业知识来
查看原文 →a16z.news