← 返回信息流
AI 资讯量子位·4 小时前

2026智源大会开幕:推动AI、物理世界和生命科学三体互动

原标题:2026智源大会开幕:推动AI、物理世界和生命科学“三体互动”

速览

2026智源大会正式开幕,旨在推动人工智能、物理世界和生命科学三大领域的深度融合与互动。该大会致力于探索跨学科合作,促进AI技术在更广泛科学领域的应用与创新。

AI 深度解读

背景

2026年6月12日,第八届“北京智源大会”(BAAI Conference 2026)在中关村国际创新中心正式开幕。作为由智源研究院(BAAI)主办的AI领域顶级学术盛会,本届大会以“技术前沿、国际视野、青年人才”为核心特色,旨在汇聚全球顶尖研究者,分享前沿成果并探讨人工智能的下一步演进方向。

本届大会的主题聚焦于推动AI、物理世界和生命科学之间的“三体互动”。大会汇聚了30余位30岁以下的青年科学家、40余位AI企业CEO及首席科学家,以及200余位顶尖专家学者。参会机构包括Meta、英伟达、哈佛、MIT等全球顶尖科技企业与高校,以及阿里、腾讯、小米、生数科技、面壁智能、清华、北大、人大等中国AI行业核心创新力量。

开幕式由智源研究院理事长黄铁军主持。智源研究院院长王仲远发布了2026年研究进展报告,重点介绍了智源在基座大模型、智能体(Agent)及基础软硬件生态领域的最新探索。自2018年成立以来,智源研究院已发布“悟道”和“悟界”系列大模型,构建了自底向上的全栈大模型开源技术体系,累计开源模型超200个,全球下载量超10亿次。

核心内容

本届大会的核心内容围绕智源研究院在基座大模型、智能体及基础软硬件生态三大领域的最新突破展开,特别是发布了“悟界”系列大模型的最新进展,标志着人工智能从“预测下一个词元”向“预测下一个物理状态”的范式跃迁。

1. 基座大模型:从数字世界迈向物理世界

智源研究院认为,人工智能正沿着从大语言模型向多模态大模型,再向世界模型(World Models)演进的方向加速发展。现有世界模型技术主要分为四类:以语言为中心(如VLM/VLA)、以像素为中心(如Sora/Seedance)、以三维结构为中心(如3D重建/World Labs Marble)以及以视觉表征为中心(如JEPA系列)。智源提出的“悟界·Physis”旨在通过“预测下一物理状态”打破这些局限,构建真正理解物理规律的世界基座模型。

  • 悟界·Emu3.5:2025年10月发布,仅基于“预测下一个词元”范式,实现了大规模文本、图像和视频的统一学习与生成。该成果于2026年1月刊发于《Nature》正刊,创造了国产多模态大模型的多项纪录。其从“预测下一个词元”扩展至跨视觉与语言序列的“下一状态预测”,内置时空关系与因果逻辑建模能力。
  • 悟界·Brainμ1.0:全球首个理解与生成统一的多模态神经科学大模型。它将人类、猕猴、小鼠的跨物种脑信号(EEG, fMRI, MEG等)统一编码为标准Token,并与语言、图像等通用模态对齐。配合全球最大AI-Ready神经科学数据平台BrainToken,该模型已辅助“记忆-睡眠”调控机制研究成果登刊《Science》。
  • 悟界·OpenComplex2.5:面向药物发现的下一代AI驱动模型,重点解决固有无序蛋白(IDP)动态构象解析难题。它覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤,以单一模型赋能创新药物研发全链路。
  • 悟界·Physis-v0.1:全球首个通用世界基座模型。它采用物理隐空间表征替代传统像素预测,支持视频、深度、3D点云、力触反馈等全模态信息压缩为标准化隐空间物理状态。具备物理一致性、动作因果性、长程可推演性和通用泛化性四大核心能力,适用于严肃工业、具身智能等场景。

2. 智能体:从模型应用到自主系统

针对具身智能面临的硬件、数据、模型能力及落地挑战,智源构建了自底向上的全栈具身智能技术体系,并推出了多款垂直领域智能体。

  • 悟界·RoboBrain Orca:以“预测下一个物理状态”为核心构建的具身大脑。它融合大量Ego-centric交互数据,强化世界模型的具身表征,实现“想、看、动”三位一体,支撑机器人在物流、酒店等真实环境中的长期自主作业。
  • BAAI Cardiac Agent:全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院超3万条影像-文本配对数据,复刻专家团队协作诊疗流程,诊断精确度达到顶尖心血管医生水平(AUC超0.93)。
  • AREX:面向科学发现的自主研究智能体。致力于推动AI从模仿学习向自主学习跨越,降低科研全流程对人类参与的依赖,服务于文献调研、实验设计至论文撰写的全流程。
  • SoulAgent:面向个人用户的专属智能体。采用自研架构,Token成本节省30%,资源占用降低80%。具备用户画像自进化能力,提供长期记忆留存与高私密安全服务。
  • 风险发现智能体:首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环,主动模拟攻击者行为以识别生物安全脆弱性,将风险防控从“事后补救”转为“事前演练”。

3. 基础软硬件生态:FlagOS 2.1

智源与开源社区共建了众智FlagOS,旨在简化“M款模型与N款芯片”的适配难题。

  • 广泛兼容性:FlagOS 2.1支持18家芯片厂商的32款芯片,覆盖NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM等多种架构,是全球覆盖芯片数量最多的计算系统软件栈。
  • 性能优化:算子总数超600个,支持统一编译器和通信库。FlagCX通信库已实现全球AI芯片通信的ITU国际标准与国家标准“双立项”。
  • 生态成果:生态成员超80家,全球下载量超37.5万次,触及开发者5.6万人。支持DeepSeek、Qwen、MiniCPM等90%以上主流开源大模型的多芯片部署,并实现DAY 0即多芯适配。

4. 顶级专家观点

  • Whitfield Diffie(图灵奖得主):在《Security For AI Agents, Security Against AI Agents》报告中,指出当前对智能体的限制(Confinement)不足。他主张开发形式化方法以提升程序可靠性,并强调AI在验证大规模程序(如编译器、操作系统)中的潜力。
  • Andrew Barto(图灵奖得主):在《Rediscovering Reinforcement Learning》报告中,将强化学习本质归结为“控制、搜索与联想记忆”的三位一体。他回顾了强化学习与神经网络的起源,指出深度强化学习与大脑奖励系统的结合指明了下一轮进展方向,并警示奖励信号设计中的“反常实例化”风险。

关键要点

  • 范式跃迁:人工智能正从“预测下一个词元”演进为“预测下一个物理状态”,世界模型成为下一代大模型的核心技术路线。
  • 悟界系列发布
    • Emu3.5:实现文本、图像、视频统一理解与生成,成果登刊《Nature》。
    • Brainμ1.0:全球首个多模态神经科学大模型,成果登刊《Science》,解决脑科学数据孤岛问题。
    • OpenComplex2.5:覆盖药物研发全链路的AI驱动模型,精准解析IDP构象。
    • Physis-v0.1:全球首个通用世界基座模型,以物理隐空间表征实现跨场景物理规律强化学习。
  • 具身智能突破:推出悟界·RoboBrain Orca,通过预测物理状态提升具身智能的少样本和跨场景泛化能力,实现“认知—预测—行动”闭环。
  • 智能体矩阵:发布了涵盖心脏诊断(BAAI Cardiac Agent)、科学发现(
查看原文 →qbitai.com