AI 资讯量子位·4 小时前

2026智源大会开幕：推动AI、物理世界和生命科学三体互动

原标题：2026智源大会开幕：推动AI、物理世界和生命科学“三体互动”

速览

2026智源大会正式开幕，旨在推动人工智能、物理世界和生命科学三大领域的深度融合与互动。该大会致力于探索跨学科合作，促进AI技术在更广泛科学领域的应用与创新。

AI 深度解读

背景

2026年6月12日，第八届“北京智源大会”（BAAI Conference 2026）在中关村国际创新中心正式开幕。作为由智源研究院（BAAI）主办的AI领域顶级学术盛会，本届大会以“技术前沿、国际视野、青年人才”为核心特色，旨在汇聚全球顶尖研究者，分享前沿成果并探讨人工智能的下一步演进方向。

本届大会的主题聚焦于推动AI、物理世界和生命科学之间的“三体互动”。大会汇聚了30余位30岁以下的青年科学家、40余位AI企业CEO及首席科学家，以及200余位顶尖专家学者。参会机构包括Meta、英伟达、哈佛、MIT等全球顶尖科技企业与高校，以及阿里、腾讯、小米、生数科技、面壁智能、清华、北大、人大等中国AI行业核心创新力量。

开幕式由智源研究院理事长黄铁军主持。智源研究院院长王仲远发布了2026年研究进展报告，重点介绍了智源在基座大模型、智能体（Agent）及基础软硬件生态领域的最新探索。自2018年成立以来，智源研究院已发布“悟道”和“悟界”系列大模型，构建了自底向上的全栈大模型开源技术体系，累计开源模型超200个，全球下载量超10亿次。

核心内容

本届大会的核心内容围绕智源研究院在基座大模型、智能体及基础软硬件生态三大领域的最新突破展开，特别是发布了“悟界”系列大模型的最新进展，标志着人工智能从“预测下一个词元”向“预测下一个物理状态”的范式跃迁。

1. 基座大模型：从数字世界迈向物理世界

智源研究院认为，人工智能正沿着从大语言模型向多模态大模型，再向世界模型（World Models）演进的方向加速发展。现有世界模型技术主要分为四类：以语言为中心（如VLM/VLA）、以像素为中心（如Sora/Seedance）、以三维结构为中心（如3D重建/World Labs Marble）以及以视觉表征为中心（如JEPA系列）。智源提出的“悟界·Physis”旨在通过“预测下一物理状态”打破这些局限，构建真正理解物理规律的世界基座模型。

悟界·Emu3.5：2025年10月发布，仅基于“预测下一个词元”范式，实现了大规模文本、图像和视频的统一学习与生成。该成果于2026年1月刊发于《Nature》正刊，创造了国产多模态大模型的多项纪录。其从“预测下一个词元”扩展至跨视觉与语言序列的“下一状态预测”，内置时空关系与因果逻辑建模能力。
悟界·Brainμ1.0：全球首个理解与生成统一的多模态神经科学大模型。它将人类、猕猴、小鼠的跨物种脑信号（EEG, fMRI, MEG等）统一编码为标准Token，并与语言、图像等通用模态对齐。配合全球最大AI-Ready神经科学数据平台BrainToken，该模型已辅助“记忆-睡眠”调控机制研究成果登刊《Science》。
悟界·OpenComplex2.5：面向药物发现的下一代AI驱动模型，重点解决固有无序蛋白（IDP）动态构象解析难题。它覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤，以单一模型赋能创新药物研发全链路。
悟界·Physis-v0.1：全球首个通用世界基座模型。它采用物理隐空间表征替代传统像素预测，支持视频、深度、3D点云、力触反馈等全模态信息压缩为标准化隐空间物理状态。具备物理一致性、动作因果性、长程可推演性和通用泛化性四大核心能力，适用于严肃工业、具身智能等场景。

2. 智能体：从模型应用到自主系统

针对具身智能面临的硬件、数据、模型能力及落地挑战，智源构建了自底向上的全栈具身智能技术体系，并推出了多款垂直领域智能体。

悟界·RoboBrain Orca：以“预测下一个物理状态”为核心构建的具身大脑。它融合大量Ego-centric交互数据，强化世界模型的具身表征，实现“想、看、动”三位一体，支撑机器人在物流、酒店等真实环境中的长期自主作业。
BAAI Cardiac Agent：全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院超3万条影像-文本配对数据，复刻专家团队协作诊疗流程，诊断精确度达到顶尖心血管医生水平（AUC超0.93）。
AREX：面向科学发现的自主研究智能体。致力于推动AI从模仿学习向自主学习跨越，降低科研全流程对人类参与的依赖，服务于文献调研、实验设计至论文撰写的全流程。
SoulAgent：面向个人用户的专属智能体。采用自研架构，Token成本节省30%，资源占用降低80%。具备用户画像自进化能力，提供长期记忆留存与高私密安全服务。
风险发现智能体：首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环，主动模拟攻击者行为以识别生物安全脆弱性，将风险防控从“事后补救”转为“事前演练”。

3. 基础软硬件生态：FlagOS 2.1

智源与开源社区共建了众智FlagOS，旨在简化“M款模型与N款芯片”的适配难题。

广泛兼容性：FlagOS 2.1支持18家芯片厂商的32款芯片，覆盖NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM等多种架构，是全球覆盖芯片数量最多的计算系统软件栈。
性能优化：算子总数超600个，支持统一编译器和通信库。FlagCX通信库已实现全球AI芯片通信的ITU国际标准与国家标准“双立项”。
生态成果：生态成员超80家，全球下载量超37.5万次，触及开发者5.6万人。支持DeepSeek、Qwen、MiniCPM等90%以上主流开源大模型的多芯片部署，并实现DAY 0即多芯适配。

4. 顶级专家观点

Whitfield Diffie（图灵奖得主）：在《Security For AI Agents, Security Against AI Agents》报告中，指出当前对智能体的限制（Confinement）不足。他主张开发形式化方法以提升程序可靠性，并强调AI在验证大规模程序（如编译器、操作系统）中的潜力。
Andrew Barto（图灵奖得主）：在《Rediscovering Reinforcement Learning》报告中，将强化学习本质归结为“控制、搜索与联想记忆”的三位一体。他回顾了强化学习与神经网络的起源，指出深度强化学习与大脑奖励系统的结合指明了下一轮进展方向，并警示奖励信号设计中的“反常实例化”风险。

关键要点

范式跃迁：人工智能正从“预测下一个词元”演进为“预测下一个物理状态”，世界模型成为下一代大模型的核心技术路线。
悟界系列发布：
- Emu3.5：实现文本、图像、视频统一理解与生成，成果登刊《Nature》。
- Brainμ1.0：全球首个多模态神经科学大模型，成果登刊《Science》，解决脑科学数据孤岛问题。
- OpenComplex2.5：覆盖药物研发全链路的AI驱动模型，精准解析IDP构象。
- Physis-v0.1：全球首个通用世界基座模型，以物理隐空间表征实现跨场景物理规律强化学习。
具身智能突破：推出悟界·RoboBrain Orca，通过预测物理状态提升具身智能的少样本和跨场景泛化能力，实现“认知—预测—行动”闭环。
智能体矩阵：发布了涵盖心脏诊断（BAAI Cardiac Agent）、科学发现（

查看原文 →qbitai.com