← 返回信息流
AI 资讯The Verge AI·2 小时前3 源报道

OpenAI发布GPT-5.6系列模型

原标题:OpenAI unveils GPT-5.6 amid US AI regulatory drama

速览

OpenAI在特朗普政府要求下推迟发布后,迅速推出GPT-5.6系列模型。该系列包含旗舰版Sol、中端版Terra及高性价比版Luna,擅长编程、网络安全及长程智能体任务。其中Sol模型定价为每百万token输入5美元、输出30美元。

AI 深度解读

OpenAI 在美方监管风波中发布 GPT-5.6:安全、定价与政治博弈

背景

在特朗普政府要求 OpenAI 推迟其下一代模型发布的消息传出不到 24 小时后,该模型便已问世。周五,OpenAI 正式发布了其新模型套件 GPT-5.6 的有限预览版。此次发布正值美国人工智能监管环境充满戏剧性变化的时期,政府方面对模型发布节奏进行了直接干预,而 OpenAI 则在合规与快速迭代之间寻求平衡。

核心内容

1. 模型阵容与定位 GPT-5.6 套件包含三个主要模型,分别针对不同的使用场景:

  • Sol:旗舰级模型,代表最高性能。
  • Terra:中端模型,专为“高吞吐量工作负载”设计。
  • Luna:主打“快速且经济实惠”的日常使用模型。

OpenAI 表示,该模型套件在编程、网络安全和生物学领域表现尤为出色,并且在执行长周期代理 AI(agentic AI)任务时具备极强的专注力。

2. 定价策略与竞争对比 在成本方面,GPT-5.6 展现了激进的定价策略:

  • Sol 模型:每百万 token 输入价格为 $5,输出价格为 $30。这一价格几乎只有 Anthropic 的 Claude Fable 5 模型(输入 $10 / 输出 $50)的一半。
  • Terra 模型:成本仅为 Sol 的一半。
  • Luna 模型:成本低于 Terra 的一半。

此外,Sol 模型还推出了两种新增模式:

  • “Max”模式:用于更深层次的推理。
  • “Ultra”模式:用于利用子代理(sub-agents)。这一功能让人联想到 OpenClaw,也可能暗示了 OpenClaw 创始人 Peter Steinberger 在加入 OpenAI 后的工作成果。

3. 安全框架与监管回应 鉴于华盛顿特区当前的安全焦虑,OpenAI 在公告博客中花费了大量篇幅强调安全性和防止滥用,并间接回应了竞争对手 Anthropic 近期遭遇的越狱(jailbreaking)困境:

  • 拒绝恶意协助:GPT-5.6 经过训练,会拒绝提供禁止的网络协助,即使用户试图伪装意图或越狱模型。
  • 防御优于攻击:旗舰模型 Sol “在帮助人们发现并修复漏洞方面,比可靠地执行端到端攻击做得更好”。
  • 合规性声明:Sol 在 OpenAI 的“准备就绪框架”(preparedness framework)下未达到网络安全关键阈值。值得注意的是,OpenAI 在 4 月修订了其准备就绪框架,移除了一些之前的研究领域。

4. 红队测试与预览期限制

  • 安全堆栈:公司称 Sol 拥有迄今为止“最强大的安全堆栈”,加强了对高风险活动、敏感网络请求和重复滥用的保护。
  • 测试投入:OpenAI 投入了约 700,000 个 A100e GPU 小时用于自动化红队测试(red-teaming),并聘请了第三方测试人员,后者将在未来两周内继续对其进行测试。
  • 预览期干预:由于特朗普政府的密切监控,OpenAI 在预览期间采取了格外敏感的态度。公司指出,“安全措施可能会偶尔干预合法工作,特别是在防御性和进攻性活动初期看起来相似的军民两用领域。这正是预览期旨在测试的内容。”
  • 客户审批:据报道,特朗普政府将在预览期间逐案批准客户访问权限。

5. 未来展望与政府关系 OpenAI 表示,鉴于其信奉“广泛访问”的理念,该模型套件将在未来几周内全面开放。虽然公司与美国政府在此次发布前进行了合作,但明确表示不希望这种政府审批成为常态。

公司写道:“我们认为这种政府访问流程不应成为长期的默认设置。它阻碍了用户、开发者、企业、网络防御者和全球合作伙伴获得最佳工具。我们采取这一短期步骤,是因为我们认为这是在接下来几周实现更广泛可用性的最强路径,同时我们要与政府合作制定网络行政命令框架以及未来模型发布的可重复流程。”

关键要点

  • 发布速度惊人:在特朗普政府要求推迟发布的消息公布不到 24 小时后,GPT-5.6 即发布,显示 OpenAI 在监管压力下的执行效率。
  • 价格战加剧:GPT-5.6 Sol 的定价($5/$30)显著低于主要竞争对手 Anthropic 的 Claude Fable 5($10/$50),Terra 和 Luna 的价格优势更为明显,旨在通过成本优势抢占市场。
  • 功能模块化:新增的“Max”和“Ultra”模式分别针对深度推理和子代理协作,反映了 AI 从单一对话向复杂代理工作流演进的趋势。
  • 安全叙事主导:在网络安全恐慌背景下,OpenAI 强调其模型在“发现漏洞”而非“执行攻击”方面的优势,并引用 Anthropic 的越狱事件作为反面教材,以确立自身的安全标杆。
  • 政治干预常态化风险:预览期的“逐案审批”机制表明,美国政府已实质介入顶级 AI 模型的发布流程,尽管 OpenAI 对此持保留态度,但短期内难以避免。
  • 人才流动迹象:Sol 模型的“Ultra”模式被解读为可能与 OpenClaw 创始人 Peter Steinberger 在 OpenAI 的工作有关,暗示了行业顶尖人才的流动对技术路线的影响。

意义与影响

1. 技术竞争格局的重塑 GPT-5.6 的发布不仅是一次产品迭代,更是 OpenAI 在定价策略上的重大调整。通过大幅降低输入和输出成本,OpenAI 试图在高端旗舰市场(Sol)和大规模应用市场(Terra/Luna)同时挤压竞争对手的空间。特别是与 Anthropic 的直接价格对比,标志着大模型市场竞争已从单纯的能力比拼转向“能力+成本+安全”的综合较量。

2. “安全”成为监管通行证 OpenAI 此次公告极度强调安全机制和红队测试,并非偶然。在美国政治环境对 AI 安全高度敏感的当下,安全不仅是技术问题,更是政治问题。通过宣称其模型“更擅长防御而非攻击”,OpenAI 试图向监管机构证明其模型的可控性,从而为未来的广泛部署争取合法性。然而,框架的频繁修订(如 4 月的调整)也暴露了行业标准在快速技术演进中的滞后性与不确定性。

3. 政府监管与企业自主权的博弈 特朗普政府的“逐案审批”机制与 OpenAI “广泛访问”理念的冲突,揭示了 AI 发展中的核心矛盾:国家安全关切与技术创新速度之间的张力。OpenAI 明确表示不希望政府审批成为常态,这预示着未来企业与政府之间关于 AI 发布流程的谈判将更加复杂。这种“短期妥协、长期抗争”的策略,可能成为其他大型 AI 厂商应对监管的范本。

4. 代理 AI(Agentic AI)的落地加速 GPT-5.6 特别强调在长周期代理任务中的专注力,以及 Ultra 模式对子代理的支持,表明 AI 的应用场景正从“问答助手”向“自主执行者”转变。这种转变对模型的安全性提出了更高要求,因为自主代理的行为不可预测性更强。OpenAI 对此的强调,既是技术进步的体现,也是应对潜在滥用风险的必要防御姿态。

综上所述,GPT-5.6 的发布不仅是 OpenAI 技术实力的展示,更是在美国政治与监管夹缝中的一次精准突围。它既回应了政府对安全的关切,又通过极具竞争力的价格和先进的代理功能保持了市场领先地位,但其背后的政府干预机制也为 AI 行业的长期自由发展埋下了不确定性。

查看原文 →theverge.com