亚马逊王晓野:Token昂贵因训练数据含垃圾,世界模型迈向多智能体仿真
速览
亚马逊王晓野在AIGC2026大会上指出,大模型Token成本高昂的根本原因在于训练数据中存在大量低质量信息。他进一步探讨了世界模型技术的发展方向,强调其正逐步迈向多智能体交互仿真领域。这一趋势有望通过提升数据效率和模拟能力,推动AI在复杂场景下的应用落地。
AI 深度解读
跨越Agent落地鸿沟:从模型到企业级AI Agent落地
背景
2026中国AIGC产业峰会由量子位主办,汇聚了近20位产业代表,线下观众超千人,线上直播观看量近400万。在峰会期间,亚马逊云科技(Amazon Web Services, AWS)产品技术部技术总监王晓野发表了题为《跨越Agent落地鸿沟:从模型到企业级AI Agent落地》的主题演讲。
当前,AI应用呈现出多极化发展趋势:AI生成内容(AIGC)日益前沿,基础模型能力持续进化,具身智能从动态控制转向感知与行动反馈,而Agent(智能体)则被视为离企业真正落地更近、最值得重点讨论的方向。
尽管“全民养龙虾”(指个人用户部署本地AI Agent)成为热点,但企业级应用面临着截然不同的挑战。数据显示,87%的企业宣称已大规模部署AI,但真正从中获得生产价值的仅占10%。个人环境下的Demo与生产环境中的大规模、高可用、安全可信的分布式Agent运行,存在巨大的工程复杂度鸿沟。
核心内容
王晓野指出,要让Agent从Demo走向生产,企业需要跨越四大鸿沟,并构建五层核心能力。
企业级Agent落地的四大鸿沟
- 模型选择与响应速度:企业需具备灵活选择模型的能力,以应对快速变化的模型市场及性价比考量,并能及时响应模型迭代。
- 构建复杂度:个人用户可在Mac mini上运行Agent并随时重启,而企业环境要求数千个Agent在分布式系统中安全、可信、不中断地稳定运行,涉及自动重启、数据可信处理等高阶工程问题。
- 使用门槛:虽然Agent对工程师的门槛低于传统IT系统,但对营销、HR等业务人员而言,使用门槛依然存在,需要更友好的交互方式。
- 人才缺口:具备端到端推动Agent落地能力的人才稀缺,企业平台部门亟需将AI能力赋能给整个组织。
企业Agent落地的五层能力架构
亚马逊云科技提出,企业IT平台和技术决策者需关注以下五层能力,以搭建从Demo到生产的桥梁:
1. AI Agent所需的算力
Agent场景更强调推理算力而非训练算力。通用芯片无法在所有场景提供最优性价比,因此需要针对规划、执行、Workflow等不同负载进行优化。亚马逊云科技通过自研芯片(如Graviton CPU、Trainium AI芯片)提供面向具体场景的最优性价比计算能力。
2. 模型
企业需要模型选择的自由,避免被单一模型绑定。Amazon Bedrock平台不断扩充模型能力,包括引入智谱GLM、MiniMax等中国优秀模型。同时,Bedrock基于20多年云计算积累,通过VPC等技术确保企业数据隐私,防止数据被中间路由工具截取。
3. 数据和知识
传统数据平台服务于人,而今天的数据平台必须服务于AI Agent。Agent对数据的调用频率极高,且涉及数十亿规模的调用。
- 记忆管理:需解决记忆的共享、隔离与并存问题,防止不同Agent间记忆串台。
- 生命周期管理:长期记忆中若包含错误、老旧或矛盾信息,会影响Agent判断,因此需对记忆进行有效的生命周期管理。
- Token效率:Token昂贵往往不是因为单价高,而是因为喂给模型的信息过多太杂。优化信息抽取、避免将大量Skills一股脑扔给模型,是全链路可观测性的重要部分。
- 数据基座理念:坚持面向AI-ready且可信(端到端加密、业务意义可解读)、卓越的数据底层引擎(如支持大规模向量检索的S3 Vectors)、以及开放的数据架构(如基于Iceberg的S3 Tables,避免厂商锁定)。
4. Agentic平台(Harness)
AI不只是大模型,拿掉模型后剩下的生产级管控能力称为Harness。亚马逊云科技通过Amazon Bedrock AgentCore提供这一层能力。
- 让Agent跑起来:提供Runtime(自动横向扩展)、Memory(上下文管理)、Code Interpreter和Browser(调用浏览器、操控代码)。
- 接入企业数据与系统:通过Identity和Gateway集成CRM、ERP等现有系统,继承员工真实权限,确保Agent代表具体员工执行任务而非拥有无限权限。
- 管控与观测:通过Policy(策略)、Evaluation(评估)和Observability(可观测性)设置执行边界,评估结果并监控全过程。
- OpenAI联合发布:Bedrock与OpenAI合作推出Managed Agent,结合OpenAI的前沿模型与最佳实践Harness,以及AWS的安全基础设施,为企业提供开箱即用的Agent构建能力。
5. Agent应用
- Coding Agent:已被认为较为成熟。
- Working Agent:被视为下一个爆发点。针对员工希望Agent个性化助手与企业希望安全管控之间的矛盾,亚马逊云科技推出Quick产品。Quick能汇聚CRM、邮件等多平台任务,主动建议行动,打破工作边界,并通过沉淀个人知识图谱,使决策越来越贴合用户习惯。
关键要点
- 部署与价值的落差:87%的企业已大规模部署AI,但仅10%真正获得生产价值。Demo容易,生产环境落地难。
- 个人与企业环境的差异:个人“养龙虾”与企业在分布式环境中运行数千个Agent,在安全性、稳定性、可信度上存在维度级的工程复杂度差异。
- 算力优化是关键:推理算力需求突出,需通过自研芯片(Graviton, Trainium)针对不同负载提供最优性价比。
- 数据平台需AI-Ready:传统数据平台服务于人,新平台需服务于Agent,重点解决记忆共享/隔离、生命周期管理、Token使用效率及全链路可观测性。
- Harness决定生产级能力:Amazon Bedrock AgentCore提供运行时扩展、记忆管理、系统集成、权限继承及策略管控,是连接模型与业务应用的关键。
- 开放与灵活:Bedrock支持接入LangChain、CrewAI等开源框架,并兼容OpenAI的Managed Agent,避免厂商锁定。
- Working Agent兴起:Quick等个性化Agent产品通过主动提醒、任务执行和个人知识图谱沉淀,正在重塑个人工作方式,解决个性化需求与企业管控之间的矛盾。
意义与影响
王晓野的演讲揭示了AI Agent从概念验证走向企业生产环境的核心痛点与解决方案。其核心观点在于,AI的竞争焦点已从单纯的模型能力转向了围绕模型的工程化、平台化能力(Harness)以及数据基础设施的适配性。
- 重新定义企业AI架构:企业不能再仅依赖大模型,必须构建包含算力优化、模型路由、AI就绪数据平台、生产级Harness及应用层的完整架构。
- 数据治理的新挑战:Agent的引入使得数据平台不仅要存储数据,更要管理记忆的动态生命周期、权限隔离及Token效率,这对传统数据治理提出了全新要求。
- 生产力范式的转变:正如Matt Garman所言,过去30年个人生产力未被真正颠覆,而Working Agent的出现标志着工作方式正在发生根本性变化。Quick等产品展示了AI如何从“辅助工具”进化为“主动助手”。
- 生态合作的深化:通过与OpenAI等头部厂商的合作,亚马逊云科技展示了云厂商如何通过整合前沿模型与自身安全基础设施,降低企业采用AI的门槛,加速Agent时代的到来。
这一框架为正在探索AI落地的企业提供了清晰的路线图,强调了在追求模型能力的同时,必须夯实底层基础设施与工程管控能力,才能真正释放AI的生产力价值。
