← 返回信息流
AI 资讯量子位·6 天前

比亚迪发布4nm自研AI芯片,制程对标英伟达,算力超越特斯拉

原标题:4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

速览

比亚迪正式推出采用4nm制程的自研AI芯片,其制造工艺直接对标英伟达最新水平。该芯片算力表现强劲,据称已超越特斯拉相关芯片,旨在为智能驾驶系统提供更强算力支持。此举标志着比亚迪在核心自动驾驶硬件领域实现重大突破,进一步巩固其技术壁垒。

AI 深度解读

背景

在自动驾驶与人工智能深度融合的当下,车载计算芯片已成为决定智能汽车性能上限的核心基础设施。长期以来,该领域由英伟达(NVIDIA)等通用 GPU 巨头主导,其凭借 CUDA 生态和先发优势占据了绝大多数市场份额。然而,随着 L2+ 及更高级别自动驾驶对算力能效比、实时响应速度以及供应链自主可控要求的提升,单纯依赖通用 GPU 的“堆料”模式逐渐显露出局限性。

比亚迪(BYD)作为全球新能源汽车销量领军者,长期以来被外界视为“电动化”领域的强者,而在智能化底层算力方面多依赖外部供应商。然而,随着垂直整合战略的深入,比亚迪自研芯片已成为行业内的“公开秘密”。近日,比亚迪正式发布其首款自研车规级 4 纳米智驾芯片——璇玑 A3。这款芯片不仅在制程工艺上对齐了英伟达 Thor 等顶级产品,更在技术路线上选择了不同于通用 GPU 的专用 NPU(神经网络处理器)架构。这一举动标志着比亚迪正式加入全球极少数具备全栈自研智驾芯片能力的车企行列,也引发了关于“通用 GPU vs 专用 NPU”路线之争的新一轮行业关注。

核心内容

比亚迪发布的璇玑 A3 芯片,是中国首款完全自主完成研发、设计、测试的车规级 4 纳米智驾芯片。其核心定位并非单纯比拼理论算力峰值,而是通过专用架构优化,追求极高的算力利用率和能效比,以支撑高阶自动驾驶及未来的具身智能需求。

1. 制程与硬件规格 璇玑 A3 采用 4 纳米车规级制程。王传福指出,车规级 4 纳米的技术难度大致相当于消费电子领域的 2 纳米。这是因为车规级芯片必须在先进制程上引入大量的冗余设计、容错电路,并使用更昂贵的材料及特定工艺步骤,以确保极端环境下的安全性与稳定性。

  • CPU:16 核,算力达 420K DMIPS,负责全局调度、逻辑决策,可同时处理智驾、座舱及车身控制任务。
  • 内存带宽:273GB/s,配合自研总线,支持纳秒级低延迟数据调度。
  • 组合算力:三颗芯片组合后总算力超过 2100 TOPS,对标英伟达 Thor 所在的 T0 梯队。

2. 技术路线:专用 NPU vs 通用 GPU 璇玑 A3 的核心差异在于其采用了专为 AI 推理设计的 NPU 架构,而非从图形渲染衍生而来的通用 GPU 架构。

  • 架构逻辑:GPU 如同“多面手老师傅”,擅长并行处理海量相似任务,生态成熟但存在架构妥协;NPU 如同“流水线工人”,将矩阵乘法、卷积等 AI 常用算子直接硬化,去除了图形渲染和通用计算的冗余逻辑。
  • 能效优势:得益于专用架构,璇玑 A3 的单位算力功耗比同级通用 GPU 产品低 20%,这意味着在相同计算任务下发热更少、系统更稳定。
  • 算力利用率:通过针对比亚迪自研算法的深度定制,璇玑 A3 的算力资源利用率提升了 100%。这意味着同样的理论算力(TOPS),在实际运行中能跑出两倍的有效性能。

3. 实际体验与安全兜底 专用 NPU 带来的低延迟特性直接提升了城市领航等复杂场景下的驾驶体验。实测显示,搭载璇玑 A3 的车辆在深圳坪山老街等复杂场景中,面对突发电动车、窄道掉头等情况时,反应表现为“丝滑”而非“机械”。

  • 延迟压缩:人类反应时间约 300-500 毫秒,普通智驾系统约 100 毫秒,而璇玑 A3 可进一步缩短这一窗口。多出几十毫秒的响应时间,往往决定了刹停与碰撞的区别。
  • 安全承诺:基于对底层技术架构的信心,王传福在发布会上承诺,在城市领航期间,若因辅助驾驶导致交通事故,比亚迪将全额赔付应由本车承担的经济损失,且不设上限。

4. 全栈自研与量产能力 璇玑 A3 实现了从设计、制造到测试的全链路自主可控,并已进入规模化量产阶段。比亚迪拥有 5 座晶圆制造工厂、7000 人的芯片研发团队以及覆盖 13 大类 567 款车规级芯片的产品矩阵。这种从电池、电控到整车架构再到智驾芯片的全栈自研能力,使其在智能化普及上具备独特的成本与迭代优势。

关键要点

  • 制程突破:璇玑 A3 是全球车载 AI 计算芯片中与英伟达 Thor 同处 T0 梯队的产品,采用 4 纳米车规级制程,领跑中国玩家阵营。
  • 能效领先:相比通用 GPU 架构,璇玑 A3 单位算力功耗降低 20%,结合自研算法使算力利用率提升 100%,实现了“实际有效算力”的翻倍。
  • 架构差异:放弃通用 GPU 路线,选择专用 NPU 架构。通过硬化 AI 算子,去除冗余逻辑,以更少的晶体管实现更高的实际计算效率和更低的功耗。
  • 低延迟高安全:原生支持 Transformer 大模型,配合自研总线实现纳秒级数据调度,显著降低感知到决策的延迟,提升复杂路况下的安全性。
  • 全栈闭环:比亚迪成为继特斯拉、华为之后,少数具备从芯片设计、制造、封装到测试全流程大规模量产能力的车企。
  • 用户利好:全系可选装城市领航功能,选装价仅 12000 元;官方提供事故全额赔付兜底;算法 OTA 迭代不再受制于外部供应商。
  • 泛化潜力:璇玑 A3 的设计兼顾泛化能力,其低延迟、高能效特性不仅适用于自动驾驶,也为机器人、无人机等“物理 AI”场景提供了潜在的通用计算平台基础。

意义与影响

璇玑 A3 的发布不仅是比亚迪技术实力的展示,更对 AI 汽车产业及更广泛的物理 AI 领域产生深远影响。

1. 重塑智驾芯片竞争格局 璇玑 A3 的出现打破了英伟达在高端智驾芯片领域的绝对垄断地位。它证明了专用 NPU 路线在车载场景下的可行性与优越性,特别是在能效比和实时性方面。这促使行业重新审视“算力信仰”,从单纯追求 TOPS 数值转向关注实际有效算力和系统级优化。

2. 推动“物理 AI”基础设施竞赛 比亚迪将璇玑 A3 定义为“整车智能即具身智能”的核心载体。随着人工智能从数字世界向物理世界延伸,具备实时感知、推理和决策能力的计算平台成为关键。璇玑 A3 在物理 AI 场景中的超大规模验证(依托比亚迪数百万辆车的销量),为机器人、工业自动化等领域提供了经过真实世界检验的底层计算范式。

3. 加速智能化普及与成本下降 通过全栈自研和规模化量产,比亚迪有能力将高阶智驾功能以更低的价格提供给消费者(如 12000 元的选装价)。这种“大力出奇迹”后的成本优势,有助于加速 L2+ 及更高级别自动驾驶在大众市场的普及。

4. 确立中国车企的技术话语权 璇玑 A3 是中国车企在智驾芯片最高制程领域推出的可与国际巨头正面对话的量产产品。它标志着中国车企在智能化底层技术上从“跟随”走向“并行”甚至“引领”,为后续在具身智能时代的全球竞争奠定了硬件基础。

5. 定义物理 AI 时代的计算单元 回顾历史,PC 时代的标准是 x86 CPU,移动互联网时代是 ARM SoC,AI 初期是 GPU。璇玑 A3 的推出暗示着物理 AI 时代可能需要一种新的标准计算单元——一种兼顾高能效、低延迟、高稳定性的专用 AI 加速器。比亚迪正试图通过璇玑 A3 和真实数据,给出这一时代的答案。

查看原文 →qbitai.com