← 返回信息流
AI 资讯TechCrunch AI·1 小时前

OpenAI发布首款自研芯片Jalapeño,由Broadcom代工

原标题:OpenAI unveils its first custom chip, built by Broadcom

速览

OpenAI正式发布了其首款定制芯片Jalapeño,该芯片由Broadcom代工制造。这款处理器是专门为满足OpenAI推理系统的独特需求而设计的。此举标志着OpenAI在硬件基础设施领域迈出了重要一步,旨在优化其大模型的推理性能。

AI 深度解读

背景

在人工智能基础设施竞争日益激烈的背景下,科技巨头们正试图通过垂直整合来降低对通用硬件的依赖。此前,Google 和 Amazon 等公司已通过构建定制化的“AI 加速器”(即专为加速机器学习工作负载而设计的硅片)来减少对 Nvidia GPU 的依赖。OpenAI 的芯片计划虽长期处于传闻之中,但其与 Broadcom(博通)的合作关系已于今年 10 月正式公布。

OpenAI 总裁 Greg Brockman 在 Broadcom 合作宣布后不久,在其内部播客中阐述了公司的芯片开发理念。他指出,OpenAI 对自身的计算工作负载有着深刻的理解,一直在寻找那些未被充分服务的特定工作负载,并思考如何构建能够加速可能性的专用硬件。这一战略转变标志着 OpenAI 不再仅仅是一家模型开发商,而是开始深入到底层基础设施的设计中。

核心内容

OpenAI 正式发布了其首款定制推理处理器,命名为 Jalapeño(哈雷尼奥辣椒)。这款处理器是由 OpenAI 与 Broadcom 合作设计和制造的,专门针对 OpenAI 推理系统的独特需求进行了优化。

关于 Jalapeño 的开发与性能,关键信息如下:

  • AI 辅助开发:OpenAI 表示,其自身的 AI 模型参与了该芯片的开发过程。
  • 性能表现:尽管芯片仍在测试阶段,但早期结果显示,其每瓦特性能(performance-per-watt)显著优于当前最先进的替代方案。
  • 应用场景:Jalapeño 专为推理(Inference)任务设计,即响应用户指令运行预构建 AI 模型的过程。OpenAI 特别强调了该芯片在运行实时编码模型时的低运营成本优势。
  • 硬件分工:虽然 Jalapeño 专注于推理,但像预训练(pre-training)这样对性能要求极高的任务,预计仍将继续依赖 Nvidia 的硬件。
  • 垂直整合战略:OpenAI 在公告中强调,公司不仅在开发前沿模型或在其之上构建产品,还在设计其底层基础设施。这包括芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验。由于 OpenAI 贯穿整个技术栈,每一层都可以围绕同一个目标进行优化:使模型对用户来说更快、更可靠且更负担得起。

关键要点

  • 首款定制芯片发布:OpenAI 推出首款定制推理处理器 Jalapeño,由 Broadcom 协助制造,旨在降低对 Nvidia GPU 的依赖并优化推理成本。
  • 推理优化为核心:Jalapeño 专为推理阶段设计,特别是在实时编码等场景下,能够显著降低运营成本。预训练等高负载任务仍主要依赖 Nvidia 硬件。
  • 能效比优势:早期测试数据显示,Jalapeño 在每瓦特性能方面优于当前市场主流的最先进替代方案,这对降低大规模部署的电费和维护成本至关重要。
  • 全栈优化策略:OpenAI 采取从芯片架构到产品体验的全栈优化模式。通过打通芯片、内存、网络、调度等底层环节,实现模型速度、可靠性和经济性的全面提升。
  • AI 辅助硬件设计:OpenAI 利用其自身的 AI 模型参与芯片开发,体现了“AI 设计 AI 基础设施”的闭环逻辑。

意义与影响

Jalapeño 的发布不仅是 OpenAI 硬件战略的重大突破,也反映了整个 AI 行业经济模型的关键转折点。

首先,推理成本的优化将成为 AI 经济学的核心。随着 AI 应用从训练阶段转向大规模部署和实时交互,推理成本在总运营成本中的占比日益增加。通过定制芯片降低推理的每瓦特成本和单位计算成本,将直接改善 OpenAI 的利润率,使其更具商业可持续性。

其次,垂直整合成为行业趋势。OpenAI 的做法与 Google(TPU)和 Amazon(Trainium/Inferentia)类似,表明头部 AI 公司正试图通过控制底层硬件来摆脱对单一供应商(如 Nvidia)的过度依赖,从而在供应链安全和成本控制上获得更大主动权。

最后,全栈优化定义了未来的竞争力。OpenAI 强调其不仅关注模型层,还深入芯片架构、内存系统和调度算法。这种跨层级的协同优化能力,意味着未来的 AI 竞争不仅是算法参数的竞争,更是整个技术栈效率的竞争。对于用户而言,这将带来更快、更稳定且更便宜的 AI 服务体验。

查看原文 →techcrunch.com