太初元碁分享国产AI算力实践助力Token服务落地
速览
太初元碁在AIEC 2026大会上分享了国产AI算力的实践经验。其核心目标是助力Token服务更好地落地生根。这一分享展示了国产算力在支持AI应用方面的进展。
AI 深度解读
背景
6月16日,由清华大学全球产业研究院主办的“人工智能 + 生态大会(AIEC 2026)”在北京中关村展示中心举行。本次大会汇聚了国内AI领域的头部企业、科研机构及行业专家,核心议题聚焦于智能体(Agentic AI)发展、算力底座建设以及产业生态共建,旨在探索人工智能规模化落地的路径。
作为国产AI算力的代表企业,太初元碁受邀参会。其首席架构师夏忠谋在大会上发表了题为“太初元碁国产AI算力Token服务实践”的主题演讲,深入剖析了国产算力在规模化部署与Token服务商业化落地方面的实践经验与行业洞察。
核心内容
夏忠谋在演讲中指出,当前国产算力在落地过程中主要面临三大核心难题,并针对性地提出了太初元碁的全维度解决方案。
面临的三大挑战
- 大规模集群服务能力瓶颈:目前国产算力主要应用于推理和微调场景,在千卡、万卡级别的预训练集群方面,仍需在单卡性能、互联带宽、软件生态及大规模运维等方面实现突破。
- Agentic AI 架构适配难题:随着Agentic AI时代的到来,CPU在规划、调度等交互计算中的占比显著提升,这对传统的CPU/GPU配比架构提出了新的挑战。
- 生态迁移壁垒:主流框架和算子库深度绑定CUDA生态,导致模型向国产算力迁移时流程复杂、开发成本高、周期长,成为阻碍国产算力普及的关键卡点。
太初元碁的解决方案
针对上述痛点,太初元碁依托多年高性能计算积淀,从以下三个维度推出解决方案:
- 集群能力:延续大规模并行计算技术经验,保障超算集群的稳定运行与高效加速比。团队曾三次斩获高性能计算领域国际最高奖项“戈登・贝尔奖”,深耕千万核级大规模并行计算。目前,其千卡集群能力已追平国际水平,万卡及十万卡集群技术正在加速突破。
- 架构创新:自研片上融合的异构众核架构。该架构在单芯片内融合通用计算、数据处理及加速计算核心,实现片上协同计算,大幅降低I/O损耗,显著提升CPU与GPU的协同效率及硬件利用率,完美适配智能体的复杂算力需求。
- 生态兼容:提供多元化开发范式及丰富工具组件,支持PyTorch、vLLM等主流框架的代码快速迁移。目前,该方案可满足80%-90%的主流场景适配需求。
落地实践与案例
目前,太初元碁已在郑州、盐城、延安、蠡湖未来城等地建成投运多个算力节点,总算力规模达数千PFlops。其中,河南空港智算中心超1300P智能算力已正式对外提供Token服务。
通过“算力厂商 + ISV + 终端客户”的三方协同模式,太初元碁打造了多个标杆案例:
- 政务领域:为地方卫健委搭建智能社保审核系统,依托 Qwen3-32B 模型实现医保数据的高效审核与风险排查。
- 企业服务:携手清华大学打造代码生成“数字员工”,将软件开发效率提升30%-50%。
- 其他领域:落地数据合成、智能运维巡检、智能化测试、AI实训平台等项目,全面覆盖科研、教育培训等多个领域。
关键要点
- 国产算力现状:主要应用于推理和微调,预训练集群的大规模部署仍面临性能、互联及运维瓶颈。
- 新架构需求:Agentic AI 时代对CPU算力占比提出更高要求,传统异构架构需适配新的交互计算模式。
- 迁移痛点:CUDA生态绑定导致模型迁移成本高、周期长,是国产算力普及的主要障碍。
- 技术突破:太初元碁千卡集群能力已达国际水平,自研异构众核架构有效提升了硬件利用率。
- 生态兼容:通过工具链优化,实现了对PyTorch、vLLM等主流框架的高比例(80%-90%)适配。
- 商业化落地:河南空港智算中心已提供Token服务,并在社保审核、代码生成等场景取得显著成效。
- 市场判断:国内超八成应用场景对延迟敏感度较低,国产算力凭借高性价比和自主可控优势,具备承接主流Token服务的能力。
意义与影响
太初元碁在AIEC 2026上的分享,不仅展示了国产算力在硬件集群、架构设计及软件生态上的实质性进展,更验证了国产算力在商业化落地中的可行性。
首先,通过解决大规模集群和生态迁移两大痛点,太初元碁为国产算力从“可用”向“好用”跨越提供了技术范本,有助于降低行业整体迁移成本。其次,其在政务、科研及企业服务领域的标杆案例,证明了国产算力在真实业务场景中能够提升效率(如代码生成效率提升30%-50%),具备替代进口算力的潜力。
最后,夏忠谋关于“高延迟不敏感场景可优先采用国产算力”的判断,为国产AI算力的市场切入提供了清晰策略。未来,随着太初元碁持续完善产业生态,有望进一步加速我国人工智能产业的自主可控与高质量发展。
