老黄Token经济学翻车,微软亚马逊纷纷跳车
速览
随着AI Token经济模式的红利消退,市场热度开始降温。微软和亚马逊等科技巨头纷纷调整策略,减少对英伟达硬件的依赖,标志着行业进入新阶段。这一变化反映了算力需求结构的转变及成本控制的紧迫性。
AI 深度解读
背景
近期,随着企业级 AI 应用的深入,一种被称为“Token 经济学”的投入产出逻辑正面临严峻挑战。过去两年,科技巨头和初创企业普遍信奉“多用 AI 即提升效率”的理念,甚至出现为了冲榜而疯狂刷 Token 的现象。然而,随着真实账单的曝光,这种狂热正在降温。
据 Axios 报道,一家未具名的企业因未设置 Anthropic 企业授权用量上限,单月烧掉 5 亿美元(约合人民币 34 亿元)的 Claude 账单。这一事件引发了对 AI 成本控制的广泛反思。与此同时,微软、亚马逊、Uber 等科技大厂相继调整内部 AI 策略,从鼓励“多用”转向“精用”。这一转变标志着 AI 应用从“粗放式扩张”进入“精细化运营”阶段,Token 消耗不再等同于生产力,企业开始认真计算每一个 Token 背后的 ROI(投资回报率)。
核心内容
1. 天价账单引发行业震动 Axios 披露,一家全球顶级企业因疏忽,在一个月内消耗了价值 5 亿美元的 Claude API 费用。按 Anthropic 约 470 亿美元的年化收入(ARR)计算,该公司单月贡献了 Anthropic 近八分之一的收入。尽管公司身份保密,但 X 平台上猜测指向亚马逊。巧合的是,《金融时报》同期披露,亚马逊已取消内部 AI 使用排行榜,因为员工为冲榜执行大量无价值任务。这两则新闻共同揭示了企业从“担心员工不用 AI”到“担心 AI 用得太滥”的心态转变。
2. 科技大厂纷纷“跳车”或收缩
- 微软:宣布在 6 月 30 日前取消 Experiences + Devices 部门(涵盖 Windows、Microsoft 365、Teams 等)的大部分 Claude Code 授权,要求工程师迁移至自家 GitHub Copilot CLI。官方理由是 Claude Code 已完成“学习与探索”阶段,团队应回归“Eat Your Own Dog Food”(使用自家产品)。
- Uber:CTO Praveen Neppalli Naga 透露,公司工程师仅用 4 个月就烧完了全年 Claude Code 预算。COO Andrew Macdonald 公开指出,AI Token 消耗与最终发布的有价值产品之间不存在明显的线性关系。
- Meta:此前内部建立 Claude 使用排行榜并单月消耗数十亿 Token,如今逐渐收紧激励措施,从鼓励“多用、多刷”转向关注实际产出。
- 多邻国:曾计划将 AI 使用情况纳入绩效考核,但在员工质疑“是否必须为了使用 AI 而使用 AI”后撤回决定。CEO 路易斯·冯·安表示,感觉团队不是在为实际结果负责,而是在强推并不总是适合的东西。
3. 自研模型与成本控制的崛起
- DeepSeek:其 V4 模型在技术报告中被定位为内部日常使用的 Agentic Coding 模型,体验优于 Claude Sonnet 4.5,交付质量接近 Opus 4.6。对于拥有自研模型的公司,使用自家模型显然更具经济性。
- 米哈游:郑银河分享案例,某 Agent 项目上线首晚烧掉 200 万元 Token 费用。这一“学费”让企业意识到,Token 本身不是价值,完成任务、交付产品、创造收入才是。
4. “黄氏 Token 经济学”的反思 今年 3 月,黄仁勋在《All-In Podcast》中背书其 Token 经济学逻辑:如果年薪 50 万美元的工程师每年消耗的 Token 不到 25 万美元,应深感担忧。这一观点曾被视为圭臬,认为多烧 Token 是购买生产力。然而,随着微软、Uber 等公司用脚投票,Hacker News 上的讨论认为,过去将 Token 消耗量等同于 AI 采用率和生产力的“Tokenmaxxing”文化正在终结。
关键要点
- 从“量”到“质”的转变:企业不再单纯追求 Token 消耗量,而是关注谁能用更少的 Token 完成更多任务,AI 第一次真正变成了财务问题。
- Tokenmaxxing 文化的终结:过去将“烧了多少 Token”作为 AI 采用率衡量指标的做法被证伪。问题不在于 AI 本身,而在于企业误将消耗量当成了目标。
- 精细化运营成为主流:未来的 AI 应用将侧重于更高效的 Agent 工作流、廉价模型处理简单任务、昂贵模型负责关键决策,以及更严格的预算和权限管理。
- 自研模型优势凸显:DeepSeek 等案例表明,对于拥有自研能力的公司,使用自家模型在成本和性能平衡上更具优势。
- ROI 成为核心指标:Uber 和 Meta 的案例表明,AI 投入与产出之间并非线性关系,企业开始认真计算每一个 Token 背后的实际商业价值。
意义与影响
这一系列事件标志着 AI 行业进入了一个新的成熟阶段。首先,AI 应用的泡沫正在破裂,理性回归。企业不再盲目迷信“多用即多效”,而是开始审视 AI 工具的实际效能和成本效益。其次,技术选型将更加务实。微软转向 GitHub Copilot、Uber 削减 Claude 预算,反映出企业倾向于选择性价比更高、或与自身生态更契合的解决方案,而非单纯追逐最热门的模型。
此外,“Tokenmaxxing”文化的消退将重塑 AI 开发流程。开发者和管理者将更注重工作流的优化,例如通过更高效的 Agent 设计、合理的模型分层(廉价模型处理日常,昂贵模型处理关键决策)来降低成本。最后,这一趋势可能加速自研模型和垂直领域专用模型的发展,因为对于大型企业而言,拥有可控成本和技术自主权比单纯依赖第三方 API 更具战略意义。正如 Hacker News 上的观点所言,这并非 AI 热潮退去,而是行业从“先用再说”的野蛮生长,迈向“精细运营”的理性繁荣。
