← 返回信息流
AI 资讯ReadHub 科技日报·1 小时前

百川发布医疗大模型Baichuan-M4,HealthBench三项榜单第一

原标题:百川发布新一代医疗增强大模型 M4

速览

百川智能与清华大学研究团队联合发布了新一代医疗增强大模型Baichuan-M4。该模型在HealthBench及其Hard、Professional三个专业榜单上均位列第一,展现了卓越的医疗领域专业能力。这一成果标志着国产大模型在垂直医疗场景下的技术突破。

AI 深度解读

背景

在人工智能技术加速渗透垂直行业的背景下,医疗领域因其对准确性、安全性及专业深度极高的要求,成为大模型落地的核心战场之一。百川智能(Baichuan)作为国内头部大模型厂商,近年来持续深耕医疗垂直场景,此前已陆续发布了 M2 Plus、M3 及 M3 Plus 等迭代版本,并在多项基准测试中取得优异成绩。

此次发布的 Baichuan-M4 是百川智能与清华大学研究团队联合推出的新一代医疗增强大模型。该产品的推出,不仅标志着百川在医疗大模型技术路线上的进一步演进,也反映了产学研合作在推动 AI 医疗专业化方面的深化。从时间线来看,百川在 2025 年至 2026 年间密集发布医疗模型,显示出其在这一细分赛道上的持续投入与快速迭代策略。

核心内容

百川智能与清华大学研究团队联合发布了新一代医疗增强大模型 Baichuan-M4。该模型的核心亮点在于其在权威医疗基准测试中的卓越表现。

根据官方信息,Baichuan-M4 在 HealthBench 及其细分榜单——Hard(高难度)和 Professional(专业级)三个榜单上均位列第一。HealthBench 是评估大模型医疗能力的重要基准测试平台,涵盖从基础医学知识到复杂临床推理的多维度考核。Baichuan-M4 在 Hard 和 Professional 子榜单上的夺冠,表明该模型在处理高难度医学问题及具备专业级医疗推理能力方面达到了行业领先水平。

此次发布延续了百川智能在医疗大模型领域的迭代节奏。回顾过往,百川智能曾发布循证增强医疗大模型 M2 Plus(2025年8月),并宣称其开源大模型医疗能力登顶世界第一(2025年3月);随后发布 M3(2025年10月,性能超越 GPT-5)及 M3 Plus(2026年1月)。Baichuan-M4 的推出,是这一系列迭代中的最新成果,旨在通过更强的专业能力解决医疗场景中的复杂痛点。

关键要点

  • 联合研发:Baichuan-M4 由百川智能与清华大学研究团队联合发布,体现了“企业+顶尖高校”的产学研合作模式。
  • 榜单成绩:该模型在 HealthBench 基准测试中表现优异,具体在 HealthBench 主榜单、Hard(高难度)榜单以及 Professional(专业级)榜单上均位列第一。
  • 技术定位:作为“新一代医疗增强大模型”,Baichuan-M4 旨在提升模型在医疗领域的专业推理能力和准确性,应对高难度的临床或学术问题。
  • 迭代脉络:这是百川智能继 M2 Plus、M3、M3 Plus 之后的又一重要版本,显示了其在医疗垂直大模型领域的持续技术积累和产品迭代能力。
  • 行业背景:当前 AI 医疗赛道竞争激烈,多家机构(如华为、中国科学院香港创新研究院、北京儿童医院等)均在布局医疗大模型,百川通过高频迭代和基准测试领先来巩固其市场地位。

意义与影响

Baichuan-M4 的发布及其在 HealthBench 榜单上的全面领先,具有多重行业意义:

  1. 验证了垂直领域大模型的专业深度:在 Hard 和 Professional 榜单上的第一,证明了通用大模型或早期医疗模型在解决复杂、高难度医学问题时仍存在局限,而经过专门增强和迭代的垂直模型(如 Baichuan-M4)能够提供更可靠的专业支持。
  2. 强化了百川智能在 AI 医疗领域的领先地位:通过连续发布 M2 Plus、M3、M3 Plus 至 M4,百川智能构建了清晰的医疗大模型产品矩阵,并在基准测试中持续保持领先,有助于其在医疗信息化、辅助诊断、医学研究等 B 端市场建立竞争优势。
  3. 推动了产学研深度融合:与清华大学研究团队的联合发布,不仅提升了模型的技术权威性,也为医疗 AI 的基础研究与应用落地提供了新的合作范式,有助于加速科研成果向实际医疗场景的转化。
  4. 回应行业痛点:正如百川智能此前所言,医疗行业存在四大痛点,AI+ 医疗的增量主要在“院外”。Baichuan-M4 等高性能模型的推出,有望在院外健康管理、患者咨询、药物研发辅助等环节提供更高质量的服务,推动 AI 医疗从“可用”向“好用”、“专业可用”迈进。
查看原文 →readhub.cn