← 返回信息流
AI 资讯雷峰网·4 小时前

2026北京智源大会开幕 发布悟界系列模型

原标题:2026北京智源大会开幕 | 从“悟道”到“悟界”,智源研究院推动人工智能、物理世界和生命科学“三体互动”

速览

2026年6月12日,第八届北京智源大会在中关村开幕,汇聚全球顶尖学者与企业代表。大会发布悟界·Physis-v0.1全球首个通用世界基座模型,以及悟界·Brainμ1.0等多模态大模型成果。智源研究院强调AI正从预测词元向预测物理状态演进,加速数字与物理世界融合。

AI 深度解读

背景

2026年6月12日,第八届“北京智源大会”(Beijing AI Brain Conference)在中关村国际创新中心正式开幕。作为由智源研究院(Beijing Academy of Artificial Intelligence, BAAI)主办的AI领域顶级学术盛会,本届大会以“技术前沿、国际视野、青年人才”为核心特色,旨在汇聚全球顶尖研究者、产业领袖及青年才俊,共同探讨人工智能的前沿趋势与实践落地。

本届大会汇聚了包括图灵奖得主Whitfield Diffie和强化学习奠基人Andrew Barto在内的20余位全球顶尖专家,以及30余位30岁以下青年科学家、40余位AI企业CEO与首席科学家。参会机构涵盖Meta、英伟达、哈佛、MIT等国际顶尖科技企业与高校,以及阿里、腾讯、小米、清华、北大等中国AI行业核心力量。大会聚焦世界模型、通用智能体、具身智能、AI安全、AI Native教育、Token经济与OPC、智能计算底层架构等前沿方向,标志着中国AI产业在世界模型与Agent领域最具代表性的创新力量首次集中同台交流。

核心内容

本届大会的核心议题围绕智源研究院提出的从“悟道”到“悟界”的技术演进路径展开,重点展示了智源在基座大模型、智能体及基础软硬件生态三大领域的最新科研成果,并深入探讨了人工智能从数字世界迈向物理世界的范式变革。

1. 基座大模型:从“预测词元”到“预测物理状态”

智源研究院指出,人工智能正经历从大语言模型向多模态大模型,再向世界模型演进的加速过程。现有世界模型技术主要分为四类:以语言为中心(如VLM/VLA)、以像素为中心(如Sora/Seedance)、以三维结构为中心(如World Labs Marble)以及以视觉表征为中心(如JEPA系列)。智源认为,真正的世界模型应以“预测下一物理状态”为核心,具备感知、理解、推理真实物理世界时空规律的能力,并支持全模态数据与主动交互。

在此背景下,智源发布了“悟界”系列大模型的最新成果:

  • 悟界·Emu3.5:基于“预测下一个词元”范式,实现了大规模文本、图像和视频的统一学习与生成。该成果于2025年1月刊发于《Nature》正刊,是国产多模态大模型的重要突破,打破了传统多模态技术的模态孤岛,内置时空关系与物理演化规律建模能力。
  • 悟界·Brainμ1.0:全球首个理解与生成统一的多模态神经科学大模型。它将人类、猕猴、小鼠等跨物种的EEG、fMRI等全模态脑信号统一编码为标准Token,并与语言、图像等通用模态对齐。配合全球最大最全的AI-Ready神经科学数据集BrainToken(总量突破万亿级别),该模型已辅助“记忆-睡眠”调控机制研究成果登刊《Science》,并用于辅助筛查阿尔兹海默症等疾病。
  • 悟界·OpenComplex2.5:面向药物发现的AI驱动模型,重点解决固有无序蛋白(IDP)动态构象解析难题。它通过端到端全原子分布建模,覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤,赋能创新药物研发全链路。
  • 悟界·Physis-v0.1:全球首个通用世界基座模型。它采用物理隐空间表征替代传统像素预测,统一转化为标准化隐空间物理状态(Latent State)。该模型支持50+复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性和通用泛化性四大核心能力,旨在解决主流AI模型不懂物理规则、推演可信度低的问题,广泛应用于严肃工业、具身智能等领域。

2. 智能体:从“模型应用”走向“智能系统”

针对具身智能面临的硬件不成熟、数据短缺等挑战,智源构建了自底向上的全栈具身智能技术体系,并发布了多款面向特定场景的智能体(Agent):

  • 悟界·RoboBrain Orca:以“预测下一个物理状态”为核心的具身大脑。它融合大量Ego-centric交互数据,强化世界模型的具身表征,实现“想、看、动”三位一体,支持机器人在物流、酒店等真实环境中的长期自主作业。
  • BAAI Cardiac Agent:全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院超3万条影像-文本配对数据,复刻专家团队协作诊疗流程,实现心脏疾病诊断精确度达到顶尖医生水平(AUC超0.93)。
  • AREX:面向科学发现的自主研究智能体。致力于推动AI从模仿学习向自主学习跨越,覆盖文献调研、实验设计、结果论证等全流程,降低科研对人类参与的依赖。
  • SoulAgent:面向个人用户的专属智能体。采用自研架构,实现Token成本节省30%、资源占用降低80%。基于用户画像和技能自进化,提供长期记忆留存与高私密安全的个性化服务。
  • 有害蛋白风险发现智能体:首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环,主动模拟攻击者行为以识别生物安全脆弱性,将风险防控从“事后补救”转为“事前演练”。

3. 基础软硬件生态:FlagOS 2.1全面升级

为解决“M款模型与N款芯片”的适配难题,智源牵头打造统一智算系统软件栈众智FlagOS。本届大会发布FlagOS 2.1,支持18家芯片厂商的32款芯片,是全球覆盖芯片数量最多的计算系统软件栈。

  • 广泛兼容:覆盖NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM等多种架构,支持90%以上主流开源大模型(如DeepSeek、Qwen、MiniCPM等)的多芯片部署,实现DAY 0即适配最新模型。
  • 性能优化:算子总数超600个,拓展Triton-TLE语言能力,极致优化关键算子性能。FlagCX通信库统一连通10款芯片,并实现ITU国际标准与国家标准“双立项”。
  • 生态建设:生态成员超80家,全球下载量超37.5万次。同时发布FlagRelease(高速镜像)、FlagCICD(多芯片开源集成测试发版平台)及FlagQuantum(高性能量子电路模拟框架),推动“量智融合”。

关键要点

  • 范式跃迁:人工智能正从“预测下一个词元”演进到“预测下一个物理状态”,世界模型成为下一代大模型的核心技术路线。
  • 悟界系列发布
    • Emu3.5:原生多模态世界模型,统一文本、图像、视频理解与生成,刊发于《Nature》。
    • Brainμ1.0:全球首个多模态神经科学大模型,统一脑信号Token化,辅助《Science》级科研突破。
    • OpenComplex2.5:AI驱动药物发现模型,精准解析固有无序蛋白(IDP)构象。
    • Physis-v0.1:全球首个通用世界基座模型,以物理隐空间表征实现全场景物理交互与推理。
  • 具身智能突破:发布悟界·RoboBrain Orca,实现从Next Token/Frame Action Prediction向Next Physical State Prediction的升级,赋予机器人“认知—预测—行动”完整链路能力。
  • 智能体矩阵:推出BAAI Cardiac Agent(医疗诊断)、AREX(科学发现)、SoulAgent(个人助理)及生物安全风控智能体,覆盖多领域垂直应用。
  • FlagOS 2.1生态:支持18家厂商32款芯片,算子超600个,实现多模型多芯片统一接入,显著降低适配成本,提升推理效率。
  • 安全与可信:图灵奖得主Whitfield Diffie强调需通过形式化方法提升智能体安全性,解决Confinement(限制)不足的问题;Andrew Barto重申
查看原文 →leiphone.com