亚马逊王晓野:Token贵因数据垃圾多,企业落地才是难点
速览
亚马逊王晓野在AIGC2026活动中指出,Token成本高昂的根本原因在于输入模型的数据质量低下,充斥着大量“垃圾”信息。他同时强调,制作AI Demo并非难事,真正的挑战在于如何让模型在企业生产环境中稳定、高效地运行。这一观点揭示了当前AI应用从演示走向规模化商用所面临的核心痛点。
AI 深度解读
跨越Agent落地鸿沟:从Demo到企业级生产的工程现实
背景
在2026中国AIGC产业峰会上,亚马逊云科技(Amazon Web Services, AWS)产品技术部技术总监王晓野指出,尽管AI技术迭代迅速,但企业级落地仍面临巨大的“工程鸿沟”。数据显示,87%的企业宣称已大规模部署AI,但真正从中获得生产价值的仅占10%。
当前,个人用户层面(如“养龙虾”等Agent应用)的繁荣掩盖了企业级应用的复杂性。个人环境下的Demo演示与数千个Agent在企业分布式环境中安全、可信、不间断地稳定运行,存在本质的维度差异。企业IT决策者需要从算力、模型、数据、Harness(驾驭/管控平台)及应用五个层面,构建从Demo走向生产环境的完整桥梁。
核心内容
王晓野的演讲围绕企业级Agent落地的四大鸿沟及亚马逊云科技提出的五层能力架构展开,详细阐述了如何将AI从概念验证转化为生产价值。
企业级Agent落地的四大鸿沟
- 模型选择与响应速度:企业需应对模型能力的快速迭代,在多个模型间灵活切换以平衡性价比与性能。
- 构建复杂度:个人用户可在Mac mini上随时重启Agent,而企业环境要求分布式系统具备高可用性、自动重启能力及数据处理的可靠性,工程复杂度呈指数级上升。
- 使用门槛:虽然对工程师而言门槛降低,但营销、HR等非技术岗位的业务人员仍难以直接使用自主性Agent(如Hermes或“龙虾”)。
- 人才缺口:具备端到端推动Agent落地能力的平台型人才严重不足,企业需通过平台赋能组织。
五层能力架构:从Demo到生产
亚马逊云科技认为,企业需关注以下五层能力,以支撑Agent的生产级落地:
1. AI基础设施层(算力优化) Agent场景更强调推理算力而非训练算力。由于不同负载(规划型、执行型、Workflow型)对性能需求不同,通用芯片无法提供最优性价比。亚马逊云科技通过自研芯片(如Graviton Arm CPU、Trainium AI芯片)提供面向具体场景的最优计算能力,帮助企业在推理成本上实现降本增效。
2. 模型层(选择与保护) 企业不应被绑定在单一模型上。Amazon Bedrock平台通过整合前沿模型(包括智谱GLM、MiniMax等中国本土模型)提供多样化选择。同时,基于AWS 20多年的云计算信任积累,通过VPC等技术确保企业数据在路由过程中不被中间工具截取,保障隐私与安全。
3. 数据与知识层(AI-Ready平台) 传统数据平台服务于人,而AI-Ready数据平台需服务于AI Agent。这一层面临三大挑战:
- 记忆管理:需解决数千个Agent间的记忆共享、隔离与并存,防止“记忆串台”。
- 生命周期管理:长期记忆中若包含错误或过时信息会干扰判断,需对记忆进行有效的生命周期治理。
- Token使用效率:Token昂贵往往不是因为单价,而是因为喂给模型的信息过多、过杂(如一次性抛出数千个skills)。通过优化信息抽取和全链路可观测性,可显著降低Token消耗。
此外,该层还强调数据可信(端到端加密、业务意义可解读)、卓越的数据底层引擎(如支持大规模向量检索的S3 Vectors)以及开放架构(如基于Iceberg的S3 Tables,避免厂商锁定)。
4. Harness层(生产级管控平台) “Harness”指代将模型转化为完整应用所需的生产级能力,包括控制、管控、安全与可靠性。亚马逊云科技通过Amazon Bedrock AgentCore提供这一能力:
- 让Agent跑起来:提供自动横向扩展的Runtime、Memory管理、Code Interpreter及Browser能力。
- 集成企业系统:通过Identity和Gateway,让Agent继承员工在CRM、ERP等系统中的真实权限,而非拥有无限管理权限。
- 管控与观测:通过Policy设置边界,通过Evaluation评估结果,通过Observability实现全链路可观测。
该层保持开放,可集成LangChain、CrewAI等开源框架。近期,AWS还与OpenAI联合发布,提供由OpenAI模型及最佳实践Harness支持的Managed Agent,以及可用的Coding Agent Codex。
5. Agent应用层(工作场景落地) 除了成熟的Coding Agent,Working Agent被视为下一个爆发点。针对员工希望个性化便捷与企业希望安全管控之间的矛盾,亚马逊云科技推出了Quick等深度个性化产品。Quick能汇聚多平台任务,主动建议行动(如预约会议),打破工作边界获取外部数据,并随使用沉淀个人知识图谱,实现“像日常小助手一样”的体验。
关键要点
- 落地悖论:87%的企业宣称AI大规模部署,但仅10%获得实际生产价值。Demo与生产环境之间存在巨大的工程鸿沟。
- Token成本真相:Token昂贵的主要原因往往是输入信息冗余(喂给模型垃圾太多),而非单价本身。优化信息提取和全链路观测是降本关键。
- Harness至关重要:AI不仅是模型,拿掉模型后剩下的生产级管控、安全、稳定性要求(即Harness)才是企业落地的核心壁垒。
- 数据平台范式转移:数据平台需从“服务人”转向“服务AI Agent”,重点解决记忆共享/隔离、生命周期管理及AI-Ready的数据引擎能力。
- 权限继承机制:企业级Agent不应拥有无限权限,而应通过Gateway继承具体员工在现有系统(如CRM/ERP)中的真实权限,确保执行安全。
- 混合策略:企业可同时使用开放的Bedrock AgentCore和联合发布的OpenAI Managed Agent,根据业务需求灵活选择,并统一在AWS的安全基础设施下运行。
- 生产力颠覆:过去30年个人生产力软件未发生本质变化,但Working Agent的出现正在重构工作方式,预计2028-2030年超过15%的企业日常决策将由Agent自主完成。
意义与影响
此次演讲揭示了AIGC从“技术狂热”转向“工程务实”的关键节点。对于企业而言,单纯引入大模型已不足以产生商业价值,必须构建包含算力优化、数据治理、生产级Harness在内的完整基础设施。
- 重塑IT架构重心:企业IT投入将从单纯的模型API调用,转向对底层数据引擎、向量存储、权限管理及可观测性的深度建设。
- 定义新的竞争壁垒:谁能更好地解决Agent的记忆隔离、权限继承和成本控制问题,谁就能率先跨越从Demo到生产的鸿沟。
- 推动工作流重构:随着Working Agent和Quick类产品的成熟,员工的工作方式将从“人操作软件”转向“人与Agent协作”,个人知识图谱和自动化工作流将成为新的生产力核心。
- 生态开放与整合:通过Bedrock AgentCore的开放性及与OpenAI等厂商的合作,云厂商正在构建一个既兼容开源生态又提供企业级安全管控的中间层,加速AI应用的重构与普及。
