AI 资讯雷峰网·4 小时前

2026北京智源大会开幕发布悟界系列模型

原标题：2026北京智源大会开幕 | 从“悟道”到“悟界”，智源研究院推动人工智能、物理世界和生命科学“三体互动”

速览

2026年6月12日，第八届北京智源大会在中关村开幕，汇聚全球顶尖学者与企业代表。大会发布悟界·Physis-v0.1全球首个通用世界基座模型，以及悟界·Brainμ1.0等多模态大模型成果。智源研究院强调AI正从预测词元向预测物理状态演进，加速数字与物理世界融合。

AI 深度解读

背景

2026年6月12日，第八届“北京智源大会”（Beijing AI Brain Conference）在中关村国际创新中心正式开幕。作为由智源研究院（Beijing Academy of Artificial Intelligence, BAAI）主办的AI领域顶级学术盛会，本届大会以“技术前沿、国际视野、青年人才”为核心特色，旨在汇聚全球顶尖研究者、产业领袖及青年才俊，共同探讨人工智能的前沿趋势与实践落地。

本届大会汇聚了包括图灵奖得主Whitfield Diffie和强化学习奠基人Andrew Barto在内的20余位全球顶尖专家，以及30余位30岁以下青年科学家、40余位AI企业CEO与首席科学家。参会机构涵盖Meta、英伟达、哈佛、MIT等国际顶尖科技企业与高校，以及阿里、腾讯、小米、清华、北大等中国AI行业核心力量。大会聚焦世界模型、通用智能体、具身智能、AI安全、AI Native教育、Token经济与OPC、智能计算底层架构等前沿方向，标志着中国AI产业在世界模型与Agent领域最具代表性的创新力量首次集中同台交流。

核心内容

本届大会的核心议题围绕智源研究院提出的从“悟道”到“悟界”的技术演进路径展开，重点展示了智源在基座大模型、智能体及基础软硬件生态三大领域的最新科研成果，并深入探讨了人工智能从数字世界迈向物理世界的范式变革。

1. 基座大模型：从“预测词元”到“预测物理状态”

智源研究院指出，人工智能正经历从大语言模型向多模态大模型，再向世界模型演进的加速过程。现有世界模型技术主要分为四类：以语言为中心（如VLM/VLA）、以像素为中心（如Sora/Seedance）、以三维结构为中心（如World Labs Marble）以及以视觉表征为中心（如JEPA系列）。智源认为，真正的世界模型应以“预测下一物理状态”为核心，具备感知、理解、推理真实物理世界时空规律的能力，并支持全模态数据与主动交互。

在此背景下，智源发布了“悟界”系列大模型的最新成果：

悟界·Emu3.5：基于“预测下一个词元”范式，实现了大规模文本、图像和视频的统一学习与生成。该成果于2025年1月刊发于《Nature》正刊，是国产多模态大模型的重要突破，打破了传统多模态技术的模态孤岛，内置时空关系与物理演化规律建模能力。
悟界·Brainμ1.0：全球首个理解与生成统一的多模态神经科学大模型。它将人类、猕猴、小鼠等跨物种的EEG、fMRI等全模态脑信号统一编码为标准Token，并与语言、图像等通用模态对齐。配合全球最大最全的AI-Ready神经科学数据集BrainToken（总量突破万亿级别），该模型已辅助“记忆-睡眠”调控机制研究成果登刊《Science》，并用于辅助筛查阿尔兹海默症等疾病。
悟界·OpenComplex2.5：面向药物发现的AI驱动模型，重点解决固有无序蛋白（IDP）动态构象解析难题。它通过端到端全原子分布建模，覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤，赋能创新药物研发全链路。
悟界·Physis-v0.1：全球首个通用世界基座模型。它采用物理隐空间表征替代传统像素预测，统一转化为标准化隐空间物理状态（Latent State）。该模型支持50+复杂物理场景长程推理，具备物理一致性、动作因果性、长程可推演性和通用泛化性四大核心能力，旨在解决主流AI模型不懂物理规则、推演可信度低的问题，广泛应用于严肃工业、具身智能等领域。

2. 智能体：从“模型应用”走向“智能系统”

针对具身智能面临的硬件不成熟、数据短缺等挑战，智源构建了自底向上的全栈具身智能技术体系，并发布了多款面向特定场景的智能体（Agent）：

悟界·RoboBrain Orca：以“预测下一个物理状态”为核心的具身大脑。它融合大量Ego-centric交互数据，强化世界模型的具身表征，实现“想、看、动”三位一体，支持机器人在物流、酒店等真实环境中的长期自主作业。
BAAI Cardiac Agent：全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院超3万条影像-文本配对数据，复刻专家团队协作诊疗流程，实现心脏疾病诊断精确度达到顶尖医生水平（AUC超0.93）。
AREX：面向科学发现的自主研究智能体。致力于推动AI从模仿学习向自主学习跨越，覆盖文献调研、实验设计、结果论证等全流程，降低科研对人类参与的依赖。
SoulAgent：面向个人用户的专属智能体。采用自研架构，实现Token成本节省30%、资源占用降低80%。基于用户画像和技能自进化，提供长期记忆留存与高私密安全的个性化服务。
有害蛋白风险发现智能体：首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环，主动模拟攻击者行为以识别生物安全脆弱性，将风险防控从“事后补救”转为“事前演练”。

3. 基础软硬件生态：FlagOS 2.1全面升级

为解决“M款模型与N款芯片”的适配难题，智源牵头打造统一智算系统软件栈众智FlagOS。本届大会发布FlagOS 2.1，支持18家芯片厂商的32款芯片，是全球覆盖芯片数量最多的计算系统软件栈。

广泛兼容：覆盖NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM等多种架构，支持90%以上主流开源大模型（如DeepSeek、Qwen、MiniCPM等）的多芯片部署，实现DAY 0即适配最新模型。
性能优化：算子总数超600个，拓展Triton-TLE语言能力，极致优化关键算子性能。FlagCX通信库统一连通10款芯片，并实现ITU国际标准与国家标准“双立项”。
生态建设：生态成员超80家，全球下载量超37.5万次。同时发布FlagRelease（高速镜像）、FlagCICD（多芯片开源集成测试发版平台）及FlagQuantum（高性能量子电路模拟框架），推动“量智融合”。

关键要点

范式跃迁：人工智能正从“预测下一个词元”演进到“预测下一个物理状态”，世界模型成为下一代大模型的核心技术路线。
悟界系列发布：
- Emu3.5：原生多模态世界模型，统一文本、图像、视频理解与生成，刊发于《Nature》。
- Brainμ1.0：全球首个多模态神经科学大模型，统一脑信号Token化，辅助《Science》级科研突破。
- OpenComplex2.5：AI驱动药物发现模型，精准解析固有无序蛋白（IDP）构象。
- Physis-v0.1：全球首个通用世界基座模型，以物理隐空间表征实现全场景物理交互与推理。
具身智能突破：发布悟界·RoboBrain Orca，实现从Next Token/Frame Action Prediction向Next Physical State Prediction的升级，赋予机器人“认知—预测—行动”完整链路能力。
智能体矩阵：推出BAAI Cardiac Agent（医疗诊断）、AREX（科学发现）、SoulAgent（个人助理）及生物安全风控智能体，覆盖多领域垂直应用。
FlagOS 2.1生态：支持18家厂商32款芯片，算子超600个，实现多模型多芯片统一接入，显著降低适配成本，提升推理效率。
安全与可信：图灵奖得主Whitfield Diffie强调需通过形式化方法提升智能体安全性，解决Confinement（限制）不足的问题；Andrew Barto重申

查看原文 →leiphone.com

2026北京智源大会开幕 发布悟界系列模型

速览