← 返回信息流
AI 资讯ReadHub 科技日报·3 小时前

百川智能发布M4模型,实现真人医生式主动问诊

原标题:百川智能发布 M4 模型,实现「真人医生」式主动问诊

速览

百川智能推出新一代医疗增强大模型Baichuan-M4,在HealthBench评测中斩获榜首,表现超越GPT-5.5。该模型核心突破在于交互模式,具备主动追问能力并引入全病程记忆,显著提升问诊效率与诊断准确性。同时,其证据锚定技术使医学结论引用精度达90.0%,标志着大模型在医疗领域从知识储备向诊疗决策支持跨越。

AI 深度解读

背景

随着人工智能技术在垂直领域的深入应用,医疗行业正迎来从“知识储备”向“诊疗决策支持”转型的关键节点。百川智能(Baichuan Intelligence)近期发布了新一代医疗增强大模型 Baichuan-M4,标志着其在医疗 AI 赛道的又一次重要技术迭代。

此次发布的背景建立百川智能在医疗大模型领域的持续投入之上。回顾其发展路径,百川智能早在 2026 年 1 月便推出了循证增强医疗大模型 M3 Plus,并在同年 1 月发布了性能超越 GPT-5.2 的医疗模型 M3。随着技术的积累,百川智能致力于解决医疗行业存在的四大痛点,特别是聚焦于“院外”增量市场。此次 M4 模型的推出,不仅是对前代产品性能的升级,更是对其在 HealthBench 医疗评测中表现优异的技术验证,旨在通过更拟人化的交互和更严谨的循证能力,推动“AI+ 医疗”的普惠化应用。

核心内容

Baichuan-M4 的核心突破在于交互模式的根本性变革,旨在模拟真人医生的诊疗逻辑。传统的大模型多处于被动回答状态,而 M4 具备主动追问能力。这种“主动问诊”机制能够根据患者的初步描述,像真人医生一样进行多轮深入挖掘,从而显著提升问诊效率与诊断的准确性。

在记忆与上下文处理方面,M4 引入了「全病程记忆」功能。该功能能够深度整合患者的历史医疗信息,使得模型在处理长上下文临床数据时,其记忆性能较上一代产品有显著提升,从而为医生提供更连贯、全面的患者画像。

此外,M4 引入了「证据锚定」技术,这是其区别于其他大模型的关键特征之一。该技术确保医学结论能够精确对应到权威医学论文或临床指南的具体段落。据官方数据,其循证引用精度高达 90.0%,这一指标大幅领先于同类大模型,极大地增强了医疗建议的可信度和可追溯性。

在性能评估方面,Baichuan-M4 在 HealthBench 医疗评测中表现卓越,斩获主榜单及 Hard、Professional 两个子榜单的榜首。官方宣称其医疗专业能力展现出超越 GPT-5.5 的水平,尽管这一对比需结合具体评测语境理解,但无疑确立了其在当前主流大模型中的领先地位。

关键要点

  • 交互模式革新:具备主动追问能力,模拟真人医生诊疗逻辑,提升问诊效率与诊断准确性。
  • 长上下文记忆增强:推出「全病程记忆」功能,深度整合患者历史信息,临床记忆性能较上一代显著提升。
  • 高精度循证引用:引入「证据锚定」技术,医学结论可精确对应权威文献段落,循证引用精度达 90.0%,大幅领先同类模型。
  • 评测成绩优异:在 HealthBench 医疗评测中包揽主榜单及 Hard、Professional 子榜单榜首。
  • 性能对标:官方数据显示其医疗专业能力超越 GPT-5.5。
  • 技术演进脉络:继 M3、M3 Plus 之后,百川智能持续降低事实性幻觉率(此前 M3 发布时降至 3.3%),此次 M4 进一步巩固其在医疗垂直领域的优势。

意义与影响

Baichuan-M4 的发布标志着大模型在医疗领域的应用实现了从单纯的知识检索向复杂的诊疗决策支持的跨越。这一转变对于缓解医疗资源分布不均具有深远意义。通过提供可靠的诊断参考,M4 有望为医疗资源稀缺地区的医生提供强有力的辅助,缩小城乡及区域间的医疗水平差距。

此外,M4 的高精度循证能力和拟人化交互体验,为“AI+ 医疗”的普惠化应用提供了新的范本。它不仅提升了医生工作的效率,也通过更精准的诊断支持,让精准医疗变得更加触手可及。随着百川智能在医疗方向的持续专注,此次发布有望进一步推动整个医疗行业的智能化转型,加速 AI 技术在临床实践中的落地与普及。

查看原文 →readhub.cn