AI 资讯量子位·2 小时前

国产医疗AI突破死循环，多项关键测评超越GPT-5.5

原标题：困住医疗AI的死循环，终于有国产玩家跑通了

速览

国产医疗AI企业成功突破了行业长期存在的死循环困境。在多项关键的医疗专业测评中，该模型表现卓越，甚至超越了GPT-5.5。这一突破标志着国产AI在垂直医疗领域取得了实质性进展，具有重要的行业意义。

AI 深度解读

背景

在通用大模型格局日益清晰的当下，头部厂商占据了绝大多数市场份额，形成“强者恒强”的马太效应。然而，医疗AI赛道却呈现出一种反常现象：尽管过去几年涌入上百家创业公司，论文与评测榜单层出不穷，但行业并未出现明显的头部效应，整体渗透率仍不足10%～20%。

这一困境的核心在于 Sam Altman 所指出的“Context Gap”（语境/上下文差距）以及 a16z 强调的“没有正确 Context 的 AI Agent 基本无用”。医疗行业长期卡在一个结构性死结中：数据、模型、场景三者的闭环断裂。

具体表现为：

数据层面：虽然原始医疗数据丰富，但缺乏专业标准化治理，导致大量数据无法转化为有效的训练素材（Context）。高质量医学治理资源稀缺且难以规模化。
场景层面：多数产品停留在“问答助手”阶段，未能深度嵌入医生工作流。由于无法获取诊疗过程中的核心决策数据（如诊断逻辑、用药调整、康复结果），模型迭代缺乏真实临床数据的“燃料”。

这导致了一个死循环：产品进不了临床 → 拿不到真实诊疗数据 → 模型迭代缺乏燃料 → 产品更进不去。行业急需有玩家打破这一僵局。

核心内容

文章指出，讯飞医疗发布的星火医疗大模型 V3.5 成功跑通了这一死循环，其核心逻辑在于构建了一套“场景→数据→治理→模型→更广场景”的自强化循环体系。

1. 评测表现与落地能力 星火医疗大模型 V3.5 在多项关键测评中表现优异，综合实力在 IDC《中国医疗大模型技术评估，2026》中位居行业第一，15项核心指标中12项领跑。在 MedBench 智能体评测中得分98.9分登顶，并在医疗知识问答、诊断治疗推荐等关键临床任务上超越 GPT-5.5 最高推理档（Extra High）。

更重要的是，其评测成绩与临床价值实现了“对账”：

病历生成：在多家头部三甲医院应用中，医生采纳率达91%，病历书写时间缩短52%。
影像辅助：X线、MR报告生成的医生采纳率达75%，质控达到专家会诊水准。
其他场景：病历内涵质控、智能用药审核、跨专科辅助诊断、居民端体检报告解读及慢病管理等刚需场景均已落地。

2. 如何积累 Context：十年深耕的全域覆盖 讯飞医疗的 Context 并非短期堆砌，而是通过十年时间构建壁垒：

全域场景覆盖：从基层卫生院到三甲医院，再到影像云平台。覆盖全国806个区县、7.7万余家基层医疗机构，累计辅助诊断超12亿次；携手600多家等级医院（含50余家百强医院）。
全链路数据沉淀：产品贯穿患者“咨询→首诊→诊疗→康复”的全生命周期，沉淀出从居民端到医院端的完整 Context 链。目前拥有16亿人次脱敏医疗语音数据、12亿次真实诊疗数据，每日新增超220万份跨模态样本。

3. 核心壁垒：专业治理与国产算力

数据治理：不同于外包模式，讯飞医疗由全职医学专家团队主导数据治理，将原始数据转化为高质量的 Context。
国产化算力底座：星火医疗大模型 V3.5 基于昇腾 910B 全国产算力底座训练，率先在国产平台上跑通 DSA（动态稀疏注意力）和 MTP（多 Token 预测）技术，使推理吞吐量提升4.5倍。在医疗敏感行业，国产算力合规已成为重要的准入门槛。

4. 闭环逻辑 最终形成的飞轮为：场景深入进入 → 数据自然沉淀 → 专业治理转化为 Context → 模型能力增强 → 反哺更深场景。这种闭环使得后来者难以在短时间内复制全部要件。

关键要点

行业痛点：医疗AI长期受困于“数据有但不可用、场景广但难嵌入”的死循环，导致智能无法转化为实际的临床 Context。
破局关键：Context 的不平等性。智能本身趋于同质化，但基于真实场景、经过专业治理的 Context 具有极高的壁垒和不可复制性。
讯飞医疗的优势：
- 数据规模与质量：拥有16亿人次语音及12亿次诊疗数据，且由全职医学团队治理，非简单外包。
- 场景深度：覆盖全国7.7万+基层机构及600+等级医院，实现从居民端到医院端的全链路嵌入。
- 技术合规：基于昇腾 910B 国产算力，满足医疗行业对数据安全和合规的高要求。
临床实效：星火医疗大模型 V3.5 在真实诊室中获得医生91%的病历采纳率，证明了其从“实验室指标”到“临床实用”的跨越。
马太效应显现：行业正从“比谁更聪明”转向“比谁更早跑通闭环”。资源将向已跑通数据、场景、算力闭环的玩家集中，未跑通者空间将被压缩。

意义与影响

讯飞医疗星火医疗大模型 V3.5 的落地，标志着医疗AI行业从“通用模型+轻量适配”阶段进入“垂直闭环+深度嵌入”阶段。

行业分层加速：随着 Context 壁垒的形成，医疗AI行业的马太效应开始显现。拥有真实临床数据、医院合作深度及医学人才密度的头部玩家将获得更多资源，而仅停留在通用模型层面的玩家将面临生存空间压缩。
验证了“Context 驱动”路径：证明了在严肃医疗领域，单纯依靠算法提升或公开语料训练无法解决临床决策问题，必须通过长期深耕场景、积累高质量 Context 才能建立核心竞争力。
国产化算力在垂直领域的示范：基于昇腾 910B 的成功训练与部署，为医疗等敏感行业提供了符合合规要求的国产化技术解决方案，推动了国产算力在高端AI应用中的落地。
重塑医生工作流：通过高采纳率证明，AI 不再是辅助工具，而是深度嵌入诊疗流程的基础设施，有望显著提升医疗效率并降低医生负担。

这一案例表明，大模型的下半场竞争，本质上是 Context 积累速度与质量的竞争。

查看原文 →qbitai.com

国产医疗AI突破死循环，多项关键测评超越GPT-5.5

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐