← 返回信息流
AI 资讯量子位·2 小时前

国产医疗AI突破死循环,多项关键测评超越GPT-5.5

原标题:困住医疗AI的死循环,终于有国产玩家跑通了

速览

国产医疗AI企业成功突破了行业长期存在的死循环困境。在多项关键的医疗专业测评中,该模型表现卓越,甚至超越了GPT-5.5。这一突破标志着国产AI在垂直医疗领域取得了实质性进展,具有重要的行业意义。

AI 深度解读

背景

在通用大模型格局日益清晰的当下,头部厂商占据了绝大多数市场份额,形成“强者恒强”的马太效应。然而,医疗AI赛道却呈现出一种反常现象:尽管过去几年涌入上百家创业公司,论文与评测榜单层出不穷,但行业并未出现明显的头部效应,整体渗透率仍不足10%~20%。

这一困境的核心在于 Sam Altman 所指出的“Context Gap”(语境/上下文差距)以及 a16z 强调的“没有正确 Context 的 AI Agent 基本无用”。医疗行业长期卡在一个结构性死结中:数据、模型、场景三者的闭环断裂

具体表现为:

  1. 数据层面:虽然原始医疗数据丰富,但缺乏专业标准化治理,导致大量数据无法转化为有效的训练素材(Context)。高质量医学治理资源稀缺且难以规模化。
  2. 场景层面:多数产品停留在“问答助手”阶段,未能深度嵌入医生工作流。由于无法获取诊疗过程中的核心决策数据(如诊断逻辑、用药调整、康复结果),模型迭代缺乏真实临床数据的“燃料”。

这导致了一个死循环:产品进不了临床 → 拿不到真实诊疗数据 → 模型迭代缺乏燃料 → 产品更进不去。行业急需有玩家打破这一僵局。

核心内容

文章指出,讯飞医疗发布的星火医疗大模型 V3.5 成功跑通了这一死循环,其核心逻辑在于构建了一套“场景→数据→治理→模型→更广场景”的自强化循环体系。

1. 评测表现与落地能力 星火医疗大模型 V3.5 在多项关键测评中表现优异,综合实力在 IDC《中国医疗大模型技术评估,2026》中位居行业第一,15项核心指标中12项领跑。在 MedBench 智能体评测中得分98.9分登顶,并在医疗知识问答、诊断治疗推荐等关键临床任务上超越 GPT-5.5 最高推理档(Extra High)。

更重要的是,其评测成绩与临床价值实现了“对账”:

  • 病历生成:在多家头部三甲医院应用中,医生采纳率达91%,病历书写时间缩短52%。
  • 影像辅助:X线、MR报告生成的医生采纳率达75%,质控达到专家会诊水准。
  • 其他场景:病历内涵质控、智能用药审核、跨专科辅助诊断、居民端体检报告解读及慢病管理等刚需场景均已落地。

2. 如何积累 Context:十年深耕的全域覆盖 讯飞医疗的 Context 并非短期堆砌,而是通过十年时间构建壁垒:

  • 全域场景覆盖:从基层卫生院到三甲医院,再到影像云平台。覆盖全国806个区县、7.7万余家基层医疗机构,累计辅助诊断超12亿次;携手600多家等级医院(含50余家百强医院)。
  • 全链路数据沉淀:产品贯穿患者“咨询→首诊→诊疗→康复”的全生命周期,沉淀出从居民端到医院端的完整 Context 链。目前拥有16亿人次脱敏医疗语音数据、12亿次真实诊疗数据,每日新增超220万份跨模态样本。

3. 核心壁垒:专业治理与国产算力

  • 数据治理:不同于外包模式,讯飞医疗由全职医学专家团队主导数据治理,将原始数据转化为高质量的 Context。
  • 国产化算力底座:星火医疗大模型 V3.5 基于昇腾 910B 全国产算力底座训练,率先在国产平台上跑通 DSA(动态稀疏注意力)和 MTP(多 Token 预测)技术,使推理吞吐量提升4.5倍。在医疗敏感行业,国产算力合规已成为重要的准入门槛。

4. 闭环逻辑 最终形成的飞轮为:场景深入进入 → 数据自然沉淀 → 专业治理转化为 Context → 模型能力增强 → 反哺更深场景。这种闭环使得后来者难以在短时间内复制全部要件。

关键要点

  • 行业痛点:医疗AI长期受困于“数据有但不可用、场景广但难嵌入”的死循环,导致智能无法转化为实际的临床 Context。
  • 破局关键:Context 的不平等性。智能本身趋于同质化,但基于真实场景、经过专业治理的 Context 具有极高的壁垒和不可复制性。
  • 讯飞医疗的优势
    • 数据规模与质量:拥有16亿人次语音及12亿次诊疗数据,且由全职医学团队治理,非简单外包。
    • 场景深度:覆盖全国7.7万+基层机构及600+等级医院,实现从居民端到医院端的全链路嵌入。
    • 技术合规:基于昇腾 910B 国产算力,满足医疗行业对数据安全和合规的高要求。
  • 临床实效:星火医疗大模型 V3.5 在真实诊室中获得医生91%的病历采纳率,证明了其从“实验室指标”到“临床实用”的跨越。
  • 马太效应显现:行业正从“比谁更聪明”转向“比谁更早跑通闭环”。资源将向已跑通数据、场景、算力闭环的玩家集中,未跑通者空间将被压缩。

意义与影响

讯飞医疗星火医疗大模型 V3.5 的落地,标志着医疗AI行业从“通用模型+轻量适配”阶段进入“垂直闭环+深度嵌入”阶段。

  1. 行业分层加速:随着 Context 壁垒的形成,医疗AI行业的马太效应开始显现。拥有真实临床数据、医院合作深度及医学人才密度的头部玩家将获得更多资源,而仅停留在通用模型层面的玩家将面临生存空间压缩。
  2. 验证了“Context 驱动”路径:证明了在严肃医疗领域,单纯依靠算法提升或公开语料训练无法解决临床决策问题,必须通过长期深耕场景、积累高质量 Context 才能建立核心竞争力。
  3. 国产化算力在垂直领域的示范:基于昇腾 910B 的成功训练与部署,为医疗等敏感行业提供了符合合规要求的国产化技术解决方案,推动了国产算力在高端AI应用中的落地。
  4. 重塑医生工作流:通过高采纳率证明,AI 不再是辅助工具,而是深度嵌入诊疗流程的基础设施,有望显著提升医疗效率并降低医生负担。

这一案例表明,大模型的下半场竞争,本质上是 Context 积累速度与质量的竞争。

查看原文 →qbitai.com