通用计算押注:SambaNova 会是下一个 Cerebras 吗?
速览
通用计算(General Compute)看好 SambaNova 的发展潜力,认为其有望成为继 Cerebras 之后的下一个突破性芯片制造商。这一押注反映了市场对于 AI 算力硬件领域新晋领军者的关注。SambaNova 作为 AI 芯片领域的关键玩家,其技术突破和市场表现备受瞩目。
AI 深度解读
AI算力新战场:General Compute 押注 SambaNova,能否成为下一个 Cerebras?
背景
随着人工智能模型对算力需求的爆炸式增长,AI 基础设施行业正面临两大核心障碍:一是如何获取合适的芯片,二是如何将这些芯片快速部署到数据中心以产生收入。尽管 GPU 的需求持续高涨,但业界逐渐达成共识:GPU 并非推理阶段(即模型运行并响应用户,而非训练阶段)的最佳选择。
在此背景下,一家名为 General Compute 的新兴“推理新云”(inference neocloud)公司脱颖而出。该公司专注于出租 AI 推理算力,旨在解决上述痛点。近期,General Compute 在由 FUSE VC 领投,Carya Venture Partners 和 Village Global Ventures 参投的情况下,完成了 1500 万美元的种子轮融资,投后估值达 6000 万美元。其创始人兼 CEO Finn Puklowski 和技术总监兼 CTO Jason Goodison 通过选择特定的芯片架构和部署策略,揭示了 AI 生态系统的未来走向。
核心内容
General Compute 的战略核心在于对“正确芯片”和“部署地点”的独特选择,这使其在 NVIDIA、Groq 和 Cerebras 等巨头之外开辟了一条差异化路径。
1. 芯片选择的战略转向:从 GPU 到 SambaNova 虽然 NVIDIA 的 GPU 在训练阶段占据主导地位,但在推理阶段,计算需求截然不同。近期 NVIDIA 以 200 亿美元收购 Groq 的交易,以及 Cerebras 上周高达 570 亿美元的 IPO,均指向了专用推理芯片的重要性。然而,由于 Groq 和 Cerebras 产能紧张,General Compute 将目光投向了另一家被硅谷主流话语略微边缘化的芯片制造商——SambaNova(由英特尔支持)。
SambaNova 今年将发布新一代芯片,其架构具有更高的灵活性,并拥有更大的内存以在推理计算中存储上下文。据 SambaNova 声称,其新芯片不仅优于 GPU,甚至超越了 Groq 或 Cerebras 等其他专用芯片。General Compute 的 CEO Finn Puklowski 指出,新芯片的推理速度可达每秒 600 至 700 个 token,而 GPU 仅为每秒约 250 个 token。目前,General Compute 已订购价值 3 亿美元的 SambaNova SN50 芯片,并承诺成为首家部署这些芯片的新云服务商。
2. 解决部署难题:空气冷却与现有基础设施兼容 除了芯片性能,General Compute 还解决了第二个关键问题:在哪里部署这些芯片。SambaNova 的芯片采用空气冷却而非水冷,且功耗更低。这意味着它们可以直接安装在现有的数据中心设施中,无需进行昂贵的新型基础设施投资。
为了最大化利用这一优势,General Compute 正在积极寻求“ colocatio n”(共址)合作。这不仅限于传统的数据中心提供商,还包括那些因比特币挖矿成本高于收益而急于转型的加密货币矿工,帮助其重新利用现有基础设施。
3. 市场验证与投资逻辑 General Compute 上周正式推出云服务,并宣称其在运行开源大语言模型 MiniMax 2.7 时速度最快。风险投资人 Joe Hasselmann(曾于 2021 年投资 Groq,现管理专注于 AI 领域的 Evercrest Capital Partners 基金)是 General Compute 的首批投资者之一。
Hasselmann 认为,General Compute 与 SambaNova 的合作关系,类似于 CoreWeave 与 NVIDIA 的关系,也类似于 Groq 将其芯片制造与其前身为云服务的业务相结合的模式。他指出:“他们需要一个健康的客户组合,这些客户会将芯片部署在高增长环境中。General Compute 在押注 SambaNova,而 SambaNova 也在押注 General Compute。”
4. 未来愿景:代理(Agent)时代的极速需求 推理云的出现隐含了对多模型、多代理(Agent)世界的押注。在这一世界中,没有单一提供商能占据主导地位,推理的速度和成本成为关键竞争变量。本周 OpenRouter 完成 1.13 亿美元 B 轮融资,也反映了市场对于能够优化 token 支出、提供多模型访问能力的平台的需求。
Puklowski 强调,速度对于价格和能力至关重要。他计划将编码代理的长耗时任务(如一小时)缩短至 5 到 10 分钟,并使需要快速推理以进行有效对话的音频客服代理更具经济性。Puklowski 表示:“如果你使用 ChatGPT,每秒 50 个 token 的速度已经远超人类阅读速度。但现在,随着代理与代理之间的交互增加,代理代表我们阅读或查询数据库,它们需要更快的速度。”
关键要点
- 融资与估值:General Compute 完成 1500 万美元种子轮融资,投后估值 6000 万美元,由 FUSE VC 领投。
- 差异化芯片策略:避开产能紧张的 Groq 和 Cerebras,选择英特尔支持的 SambaNova 作为核心芯片供应商,特别是其即将发布的新一代芯片。
- 性能优势:SambaNova 新芯片声称推理速度达每秒 600-700 tokens,显著高于 GPU 的约 250 tokens,且优于其他专用推理芯片。
- 基础设施兼容性:SambaNova 芯片采用空气冷却、低功耗,可直接部署于现有数据中心,无需新建水冷等昂贵基础设施。
- 灵活的合作模式:不仅与传统数据中心合作,还积极对接寻求转型的加密货币矿工,实现基础设施的再利用。
- 市场定位:专注于 AI 推理阶段(Inference),服务于多模型、多代理(Agent)交互的高增长场景,强调速度和成本效率。
- 生态互信:投资者视其为“芯片制造商+云服务”模式的典型案例,强调芯片厂商与云服务商之间的双向押注和共生关系。
意义与影响
General Compute 的崛起标志着 AI 基础设施行业正在从“训练算力军备竞赛”向“推理算力精细化运营”转型。
首先,专用芯片的崛起正在重塑硬件格局。随着推理需求超过训练需求,以 SambaNova、Groq 和 Cerebras 为代表的专用推理芯片厂商获得了前所未有的关注。General Compute 对 SambaNova 的押注,证明了市场正在寻找 NVIDIA GPU 之外的替代方案,以解决推理阶段的延迟和成本问题。
其次,“新云”模式降低了 AI 部署门槛。通过利用空气冷却芯片和现有数据中心(包括转型中的矿场),General Compute 展示了如何在不进行巨额基础设施投资的情况下快速扩展算力。这种模式对于希望快速进入 AI 应用层但缺乏重资产投入能力的开发者和企业具有极大的吸引力。
最后,代理(Agent)经济对算力的新要求。随着 AI 从单轮对话转向多代理协作和自主任务执行,对低延迟和高吞吐量的需求呈指数级增长。General Compute 提出的将小时级任务缩短至分钟级的愿景,切中了未来 AI 应用的核心痛点。这表明,未来的 AI 竞争不仅在于模型的大小,更在于谁能以最低的成本、最快的速度提供推理服务。
总之,General Compute 的案例表明,AI 生态系统的价值正沿着供应链向更垂直、更高效的环节转移。对于投资者和行业参与者而言,关注那些能够解决推理效率瓶颈、并灵活整合现有基础设施的新兴平台,将是捕捉下一波 AI 红利关键。
