开源大模型为何如此廉价
速览
文章深入分析了当前开源大模型(Open Weight Models)价格急剧下降的趋势。这种“难以忍受的廉价”不仅降低了企业部署AI的门槛,也加剧了模型市场的竞争。这一现象标志着AI基础设施正从封闭走向开放,重塑了行业生态。
AI 深度解读
开源权重的“难以忍受的廉价”:AI 定价策略与竞争格局的深度解读
背景
近期,在 Hacker News 社区引发热议的一篇技术评论文章《The Unbearable Cheapness of Open Weight Models》(开源权重的“难以忍受的廉价”),直击当前人工智能行业最敏感的神经——模型定价权与开源生态的未来。
作者通过实际部署 Hermes 进行网络研究测试的经历,对比了 DeepSeek V4 与 Anthropic(Claude 开发者)及 OpenAI(GPT 开发者)等“前沿(Frontier)”模型的价格差异。这一对比不仅揭示了算力成本结构的巨大鸿沟,更引发了对科技巨头如何通过制造“稀缺性”来维持高利润、以及开源模型是否会被政治化监管所限制的深层担忧。
核心内容
1. 价格鸿沟:前沿模型 vs. 开源模型
作者在测试 DeepSeek V4 时发现,其基于 Token 的定价与 Anthropic 和 OpenAI 的前沿模型相比存在惊人差距。仅从 Token 数量计算,前者的价格几乎是后者的 50 倍之高。如果考虑到复杂推理任务中产生的额外 Token 消耗(即“思考”过程),这种成本差异将进一步扩大。
这种极端的价差引发了一个核心疑问:Anthropic 和 OpenAI 是否将自己逼入了一个高成本的死角?面对 DeepSeek 或小米 Mimo 等极具性价比的竞争者,它们是否有能力将价格下调 20 到 50 倍以维持市场竞争力?
2. 稀缺性制造:AI 行业的“奢侈品化”
文章深入探讨了为何开源权重模型(Open Weight)如此便宜,以及闭源巨头如何维持高价。
- 开源模型的低成本来源:作者推测,这可能是因为开源模型吸引了数百名用户在不同硬件上进行压力测试和优化,从而降低了边际成本;或者是作为“亏损领导者(loss leaders)”以牺牲利润换取市场份额。
- 闭源巨头的策略:为了维持高溢价,Anthropic 和 OpenAI 采取了类似奢侈品品牌的策略——制造稀缺性。它们将“前沿”模型的使用权限设在高墙之后,通过高端品牌定位和排他性访问,将 AI 服务转化为富人和企业的身份象征,而非广泛分发的大众商品。
3. 政治化风险:利用“中国恐惧”限制竞争
作者表达了对一种趋势的担忧:美国政府和行业巨头可能会利用对中国的恐惧情绪,推动立法禁止或限制开源权重模型的使用。
- 逻辑链条:当市场竞争导致价格过低时,巨头可能寻求政府干预,以“国家安全”或“技术封锁”为名,限制竞争对手(特别是来自中国或开源社区)的访问权限,从而人为制造稀缺性,保护其高利润模式。
- 现状观察:作者指出,这种担忧在过去几个月里似乎得到了验证,每周都有迹象支持这一观点。
4. 美国开源生态的衰退与“真开源”的希望
文章批评了美国在开源精神上的退步。曾经作为开源运动先锋的美国,如今在开源权重模型的发布上显得停滞不前:
- Google:Gemma 4 预计于 2026 年 4 月发布(注:原文时间点可能基于未来预测或特定语境,此处忠实引用原文表述)。
- Meta:Llama 系列近期未有重大版本更新。
- OpenAI:上次发布开源权重 GPT 模型是在 2025 年。
- Anthropic:据作者所知,从未发布过任何开源权重模型。
相比之下,真正的开源(True Open Source)不仅仅是模型权重的开放,还包括训练数据管道的开放。Allen AI 的 OLMo 项目被视为这一方向的典范,用户可直接下载模型,尽管其数据截止时间为 2024 年 12 月,略显滞后。
5. 未来展望:NSF 与 Nvidia 的合作
展望未来,美国国家科学基金会(NSF)与 Nvidia 合作,支持 Allen AI 开发完全开放的 AI 系统。这一合作旨在推动真正意义上从数据到模型的全链路开源,为开源社区注入新的活力。
6. 技术附录:iOS 与 Android 应用的技术栈
文章最后附带了一个技术彩蛋,建议读者通过 SDK 路径深入探究 Claude 和 ChatGPT 移动端应用的技术架构,包括具体的 SDK 使用和未映射的路径细节。
关键要点
- 价格悬殊:DeepSeek V4 等开源/低成本模型的价格仅为 Anthropic 和 OpenAI 前沿模型的 1/50 甚至更低,凸显了闭源巨头的定价溢价。
- 奢侈品策略:Anthropic 和 OpenAI 通过限制访问权限和品牌营销,将 AI 服务“奢侈品化”,以维持高利润而非通过规模效应降低价格。
- 监管风险:作者担忧美国巨头可能利用地缘政治紧张局势(特别是针对中国),游说政府限制开源权重模型的传播,以消除低价竞争威胁。
- 美国开源停滞:相比过去,美国主要科技公司(Google, Meta, OpenAI)在开源权重模型发布上趋于保守,而 Anthropic 甚至完全未涉足开源。
- 真开源的定义:真正的开源应包括训练数据管道的开放,Allen AI 的 OLMo 是这一领域的先行者。
- 新合作动向:NSF 与 Nvidia 的合作标志着美国官方机构开始支持完全开放的 AI 开发,这可能成为扭转开源颓势的关键力量。
意义与影响
这篇文章不仅仅是对价格差异的抱怨,更是对 AI 行业权力结构变化的深刻洞察。
首先,它揭示了**“开源 vs. 闭源”不仅是技术路线之争,更是经济模式之争**。闭源巨头试图通过构建围墙花园(Walled Garden)来维持垄断利润,而开源社区则通过协作优化降低成本,推动 AI 的大众化。
其次,文章提出了一个极具警示意义的观点:AI 竞争可能从技术层面延伸至政策层面。如果开源模型被视为对现有商业模式的威胁,我们可能会看到更多以“安全”或“主权”为名的监管壁垒。这对全球 AI 生态的健康发展构成了潜在威胁。
最后,NSF 与 Nvidia 的合作以及 Allen AI 等机构的努力,表明美国内部仍存在推动真正开源的力量。这为开源社区提供了希望,但也提醒我们,要在巨头垄断和政治干预的双重压力下,构建一个可持续、完全透明的 AI 基础设施,仍需长期的努力和国际协作。
