AI 资讯Hacker News·2 小时前

当前大模型成本不可持续

原标题：Why current LLM costs are not sustainable

速览

本文探讨了大型语言模型（LLM）当前面临的成本挑战。高昂的推理费用使得现有的商业模型难以维持长期盈利。这一趋势对AI行业的可持续发展构成了严峻考验。

AI 深度解读

当前大语言模型的成本不可持续：深度解读

背景

人工智能（AI）行业正面临一场严峻的成本危机。尽管 AI 技术在编程、数据解读、演示文稿制作以及应用和网站设计等领域极大地提升了效率，但高昂的使用成本正在成为企业和个人用户的沉重负担。

近期，多家科技巨头因 AI 支出失控而采取紧急措施。例如，Uber 在短短 4 个月内就耗尽了全年的 AI 预算；Microsoft、Salesforce 和 Github 等公司也相继出台政策，限制员工的 AI 使用以控制支出。与此同时，前沿 AI 实验室（Frontier AI Labs）推出的模型虽然性能卓越，但定价极高。以 OpenRouter 平台为例，GPT 5.5 的输入 token 成本为每百万个 5 美元，输出 token 为每百万个 30 美元。据作者实测，仅修复 50 个文件中的 TypeScript 类型错误，就花费了 54 美元。

这种“性能提升伴随价格飙升”的模式是否可持续？作者认为，随着模型性能进入平台期、开源权重模型的崛起、芯片与架构的优化、零切换成本的出现以及本地模型能力的增强，当前高昂的 AI 定价体系注定无法长期维持。

核心内容

作者从五个维度深入剖析了导致 AI 成本不可持续的根本原因，并预测了价格下降的趋势。

1. 模型性能进入平台期（Model Performance Plateau）

尽管每次模型发布都能带来性能提升，但边际效益正在递减。除非出现全新的技术突破，否则基于现有学习机制和推理能力的扩展空间有限。

数据瓶颈：大多数 AI 实验室已经消化了数字和印刷媒体中几乎所有可用的训练数据。进一步改进训练数据集的难度极大。
价格逻辑失效：目前模型涨价的主要理由是“性能更好”。然而，当模型性能不再发生质的飞跃，且训练数据和方法趋于同质化时，市场竞争将迫使价格下降。
实例佐证：Claude Opus 4.8 的价格与 Claude Opus 4.7 相同，这表明在性能提升有限的情况下，厂商已难以通过涨价来覆盖成本或获取超额利润。

2. 开源权重模型的崛起（Open Weight Model Releases）

OpenAI 在 2022 年推出 ChatGPT 时拥有巨大领先优势，但这一优势正在逐渐缩小。Anthropic 在 2025-2026 年间曾占据榜首，而近期如 GLM-5.2 这样的开源权重模型在编程基准测试中甚至超越了 GPT 和 Opus。

成本对比：GLM-5.2 的成本仅为 GPT 5.5 的十分之一。
商业模式差异：前沿 AI 实验室的高价不仅包含推理成本，还涵盖了模型架构研究、数据收集与策展、高昂的训练费用（数千万甚至上亿美元）、员工薪酬以及市场营销成本。
开源优势：一旦模型权重开源，任何推理提供商都可以轻松托管并仅对推理成本进行小幅加价。这种模式远低于运营一家前沿 AI 实验室的成本，从而大幅拉低了市场价格。

3. 芯片与模型架构的优化（Chip and Model Improvements）

AI 专用硬件和软件架构的进步正在显著降低推理成本。

专用芯片：Cerebras、Groq、Google 等公司意识到普通 GPU 已无法满足需求，转而开发专用硅片。虽然专用芯片设计昂贵，但一旦架构成熟，大规模量产将使推理成本大幅下降。例如，TPU 的成本比 Nvidia H100 GPU 低 30%-70%。
架构创新：模型架构也在不断进化。从基础的缓存技术到混合专家模型（MoE），这些改进在保持相同准确率的同时，显著提高了模型速度并降低了计算资源消耗。

4. 零切换成本（Zero Switching Costs）

传统软件（如 Windows OS、MS Office、Adobe Suite）和企业级 SaaS（如 Salesforce、Hubspot、Figma）拥有强大的护城河，因为替换它们需要数月时间。然而，AI 模型不具备这种粘性。

即时切换：随着更多 AI 实验室进入市场以及开源模型的普及，用户可以在几秒钟内切换模型提供商。OpenRouter.ai 等 AI 网关提供商使得这种切换变得极其容易，甚至可以通过编程实现动态切换。
价格崩溃风险：零切换成本意味着消费者可以毫无时间成本地转向性能更好或价格更低的模型。这种激烈的竞争将迅速导致价格崩盘。

5. 本地模型的普及（Local Models）

这是作者认为最重要且最具颠覆性的因素。目前，绝大多数用户依赖云端托管模型，因为本地模型要么体积过大难以部署，要么速度过慢无法使用。

硬件进步：随着芯片技术的进步，未来 4-5 年内，新芯片将能够高效地在本地运行模型。同时，内存（RAM）价格的必然下降将使在电脑和智能手机上部署模型变得轻而易举。
操作系统集成：作者预测，大多数操作系统将提供部署模型的方式，并提供接口供本地应用连接模型。
云端角色的转变：届时，云端模型将仅用于处理最复杂的任务，而代码自动补全、校对和事实核查等简单任务将在本地完成。用户将不再需要支付每月 20 美元或 200 美元的订阅费。

关键要点

成本危机已现：Uber、Microsoft 等企业因 AI 支出过高而采取限制措施，表明当前成本结构对使用者而言不可持续。
性能边际递减：模型性能提升幅度变小，训练数据接近饱和，导致“高性能=高价格”的逻辑难以为继。
开源打破垄断：开源权重模型（如 GLM-5.2）以极低价格提供媲美甚至超越前沿模型的性能，迫使市场重新定价。
硬件与架构降本：专用芯片（如 TPU）和新型模型架构（如 MoE）正在大幅降低每 token 的推理成本。
切换成本为零：AI 模型之间缺乏传统软件的粘性，用户可瞬间切换提供商，加剧价格竞争。
本地化是终局：随着硬件进步，本地模型将承担大部分日常任务，云端模型退居幕后，用户订阅费将大幅降低甚至消失。

意义与影响

这一趋势对 AI 行业的商业生态和用户行为将产生深远影响：

商业模式重构：前沿 AI 实验室必须重新审视其定价策略。单纯依靠“闭源+高性能”的高溢价模式将面临巨大压力，可能需要通过提供独特的数据服务、企业级安全合规或复杂任务处理来维持竞争力。
市场竞争加剧：开源模型和专用芯片提供商的崛起将打破少数几家大厂对 AI 算力和模型的垄断，促成一个更加多元、竞争激烈的市场格局。
用户成本大幅降低：对于企业和开发者而言，AI 的使用门槛将显著降低。本地模型的普及意味着数据隐私性的提升（数据无需上传云端）以及长期成本的节约。
技术民主化：零切换成本和开源模型的普及使得中小企业和个人开发者能够以极低的成本获得顶级 AI 能力，加速 AI 技术在各行各业的渗透和应用创新。

总之，虽然作者做出了大胆预测，但技术发展的内在逻辑——性能趋同、成本下降、竞争加剧——指向了一个明确的方向：AI 的成本压力将迫使价格回归理性，最终让消费者受益。

查看原文 →aditya.patadia.org