AI 资讯TechCrunch AI·7 天前

通用计算押注：SambaNova 会是下一个 Cerebras 吗？

原标题：Has the hunt for AI compute uncovered the next Cerebras?

速览

通用计算（General Compute）看好 SambaNova 的发展潜力，认为其有望成为继 Cerebras 之后的下一个突破性芯片制造商。这一押注反映了市场对于 AI 算力硬件领域新晋领军者的关注。SambaNova 作为 AI 芯片领域的关键玩家，其技术突破和市场表现备受瞩目。

AI 深度解读

AI算力新战场：General Compute 押注 SambaNova，能否成为下一个 Cerebras？

背景

随着人工智能模型对算力需求的爆炸式增长，AI 基础设施行业正面临两大核心障碍：一是如何获取合适的芯片，二是如何将这些芯片快速部署到数据中心以产生收入。尽管 GPU 的需求持续高涨，但业界逐渐达成共识：GPU 并非推理阶段（即模型运行并响应用户，而非训练阶段）的最佳选择。

在此背景下，一家名为 General Compute 的新兴“推理新云”（inference neocloud）公司脱颖而出。该公司专注于出租 AI 推理算力，旨在解决上述痛点。近期，General Compute 在由 FUSE VC 领投，Carya Venture Partners 和 Village Global Ventures 参投的情况下，完成了 1500 万美元的种子轮融资，投后估值达 6000 万美元。其创始人兼 CEO Finn Puklowski 和技术总监兼 CTO Jason Goodison 通过选择特定的芯片架构和部署策略，揭示了 AI 生态系统的未来走向。

核心内容

General Compute 的战略核心在于对“正确芯片”和“部署地点”的独特选择，这使其在 NVIDIA、Groq 和 Cerebras 等巨头之外开辟了一条差异化路径。

1. 芯片选择的战略转向：从 GPU 到 SambaNova 虽然 NVIDIA 的 GPU 在训练阶段占据主导地位，但在推理阶段，计算需求截然不同。近期 NVIDIA 以 200 亿美元收购 Groq 的交易，以及 Cerebras 上周高达 570 亿美元的 IPO，均指向了专用推理芯片的重要性。然而，由于 Groq 和 Cerebras 产能紧张，General Compute 将目光投向了另一家被硅谷主流话语略微边缘化的芯片制造商——SambaNova（由英特尔支持）。

SambaNova 今年将发布新一代芯片，其架构具有更高的灵活性，并拥有更大的内存以在推理计算中存储上下文。据 SambaNova 声称，其新芯片不仅优于 GPU，甚至超越了 Groq 或 Cerebras 等其他专用芯片。General Compute 的 CEO Finn Puklowski 指出，新芯片的推理速度可达每秒 600 至 700 个 token，而 GPU 仅为每秒约 250 个 token。目前，General Compute 已订购价值 3 亿美元的 SambaNova SN50 芯片，并承诺成为首家部署这些芯片的新云服务商。

2. 解决部署难题：空气冷却与现有基础设施兼容 除了芯片性能，General Compute 还解决了第二个关键问题：在哪里部署这些芯片。SambaNova 的芯片采用空气冷却而非水冷，且功耗更低。这意味着它们可以直接安装在现有的数据中心设施中，无需进行昂贵的新型基础设施投资。

为了最大化利用这一优势，General Compute 正在积极寻求“ colocatio n”（共址）合作。这不仅限于传统的数据中心提供商，还包括那些因比特币挖矿成本高于收益而急于转型的加密货币矿工，帮助其重新利用现有基础设施。

3. 市场验证与投资逻辑 General Compute 上周正式推出云服务，并宣称其在运行开源大语言模型 MiniMax 2.7 时速度最快。风险投资人 Joe Hasselmann（曾于 2021 年投资 Groq，现管理专注于 AI 领域的 Evercrest Capital Partners 基金）是 General Compute 的首批投资者之一。

Hasselmann 认为，General Compute 与 SambaNova 的合作关系，类似于 CoreWeave 与 NVIDIA 的关系，也类似于 Groq 将其芯片制造与其前身为云服务的业务相结合的模式。他指出：“他们需要一个健康的客户组合，这些客户会将芯片部署在高增长环境中。General Compute 在押注 SambaNova，而 SambaNova 也在押注 General Compute。”

4. 未来愿景：代理（Agent）时代的极速需求 推理云的出现隐含了对多模型、多代理（Agent）世界的押注。在这一世界中，没有单一提供商能占据主导地位，推理的速度和成本成为关键竞争变量。本周 OpenRouter 完成 1.13 亿美元 B 轮融资，也反映了市场对于能够优化 token 支出、提供多模型访问能力的平台的需求。

Puklowski 强调，速度对于价格和能力至关重要。他计划将编码代理的长耗时任务（如一小时）缩短至 5 到 10 分钟，并使需要快速推理以进行有效对话的音频客服代理更具经济性。Puklowski 表示：“如果你使用 ChatGPT，每秒 50 个 token 的速度已经远超人类阅读速度。但现在，随着代理与代理之间的交互增加，代理代表我们阅读或查询数据库，它们需要更快的速度。”

关键要点

融资与估值：General Compute 完成 1500 万美元种子轮融资，投后估值 6000 万美元，由 FUSE VC 领投。
差异化芯片策略：避开产能紧张的 Groq 和 Cerebras，选择英特尔支持的 SambaNova 作为核心芯片供应商，特别是其即将发布的新一代芯片。
性能优势：SambaNova 新芯片声称推理速度达每秒 600-700 tokens，显著高于 GPU 的约 250 tokens，且优于其他专用推理芯片。
基础设施兼容性：SambaNova 芯片采用空气冷却、低功耗，可直接部署于现有数据中心，无需新建水冷等昂贵基础设施。
灵活的合作模式：不仅与传统数据中心合作，还积极对接寻求转型的加密货币矿工，实现基础设施的再利用。
市场定位：专注于 AI 推理阶段（Inference），服务于多模型、多代理（Agent）交互的高增长场景，强调速度和成本效率。
生态互信：投资者视其为“芯片制造商+云服务”模式的典型案例，强调芯片厂商与云服务商之间的双向押注和共生关系。

意义与影响

General Compute 的崛起标志着 AI 基础设施行业正在从“训练算力军备竞赛”向“推理算力精细化运营”转型。

首先，专用芯片的崛起正在重塑硬件格局。随着推理需求超过训练需求，以 SambaNova、Groq 和 Cerebras 为代表的专用推理芯片厂商获得了前所未有的关注。General Compute 对 SambaNova 的押注，证明了市场正在寻找 NVIDIA GPU 之外的替代方案，以解决推理阶段的延迟和成本问题。

其次，“新云”模式降低了 AI 部署门槛。通过利用空气冷却芯片和现有数据中心（包括转型中的矿场），General Compute 展示了如何在不进行巨额基础设施投资的情况下快速扩展算力。这种模式对于希望快速进入 AI 应用层但缺乏重资产投入能力的开发者和企业具有极大的吸引力。

最后，代理（Agent）经济对算力的新要求。随着 AI 从单轮对话转向多代理协作和自主任务执行，对低延迟和高吞吐量的需求呈指数级增长。General Compute 提出的将小时级任务缩短至分钟级的愿景，切中了未来 AI 应用的核心痛点。这表明，未来的 AI 竞争不仅在于模型的大小，更在于谁能以最低的成本、最快的速度提供推理服务。

总之，General Compute 的案例表明，AI 生态系统的价值正沿着供应链向更垂直、更高效的环节转移。对于投资者和行业参与者而言，关注那些能够解决推理效率瓶颈、并灵活整合现有基础设施的新兴平台，将是捕捉下一波 AI 红利关键。

查看原文 →techcrunch.com