← 返回信息流
AI 资讯雷峰网·4 小时前

商汤曝光SenseNova-U1 Pro模型,对标GPT-Image-2瞄准设计赛道

原标题:商汤新模型 SenseNova-U1 Pro 曝光,对标 GPT-Image-2,瞄准「设计」赛道

速览

商汤科技在股东大会上预告下一代旗舰多模态基座模型SenseNova-U1 Pro,预计2026年7月测试。该模型主打“理解·生成·行动”原生统一,支持原生8K分辨率输出,并具备类似设计师的长程规划与评审能力。商汤明确将其对标GPT-Image-2,旨在通过交付级设计应用,推动AI在专业创作领域的变革。

AI 深度解读

背景

商汤正在筹备发布其新一代旗舰多模态模型 SenseNova-U1 Pro。在近期的股东大会演示中,商汤首次正式对外公告,其全套 20 余页演示 PPT 均由 SenseNova-U1 Pro 一次性生成。这一过程涵盖了模型自主进行的规划、思考、制作及评估全流程,旨在确保信息传达的逻辑性、数据准确性以及页面美观度,实现了“浑然一体”的复杂工程效果。

与此同时,行业普遍预测 OpenAI 即将发布新的国际前沿模型,并同样将“设计”领域锚定为重点发力方向。在此背景下,商汤提前曝光 SenseNova-U1 Pro,被视为与顶尖 AI 巨头的正面对垒,同时也标志着顶级多模态模型的竞争焦点正从编程领域向“设计”赛道转移。

核心内容

SenseNova-U1 Pro 的核心技术突破在于“同一内核内打通多模态理解与生成”。基于内在的图文交错思维能力,该模型在面对复杂需求时,能够像一位“会思考的设计师”一样,实现设计、生成、评审的长程循环。以城市规划为例,模型会先对整体布局进行智能评估,尝试部署不同的规划与生成策略,在内部评估生成效果并不断自主调整,最终输出可直接交付的“成品级”结果。

在具体的能力表现上,SenseNova-U1 Pro 展示了以下几个关键维度的优势:

  1. 原生 8K 分辨率输出:这是该模型率先支持的能力。相比之下,包括 GPT-Image-2 在内的当前全球最强生成模型,其原生直出分辨率上限仅为 4K。在高分辨率测试中,SenseNova-U1 Pro 能够输出 16000×24000+ 像素的导演级分镜稿(含 40-60 格及详细标注),而 GPT-Image-2 仅能输出 1024×1536 分辨率,放大后存在细节失真且情绪表现力较弱。
  2. 复杂图文混排与长文本控制:在杂志跨页生成场景中,SenseNova-U1 Pro 能以一句提示词生成 GQ 风格的横版跨页,涵盖车辆规格参数表、多角度实拍图集、时间轴及电影片场注记等,版式还原度达到商业出版可用水准。这种包含复杂多栏混排与长文本段落控制的能力,是目前图像生成模型最难实现的维度之一。
  3. 高信息密度与细节完整性:在“二十四节气”国画风格生成中,SenseNova-U1 Pro 能完整呈现全部 24 个节气、逐一标注日期与序号,并清晰划分四季分区;而在同一主题切换为横版长卷时,也能做到每格配以独立插图与气候描述。相比之下,GPT-Image-2 在同类任务中内容相对缺失。此外,在生成论文海报时,SenseNova-U1 Pro 能高密度呈现架构图、基准表格与可识别二维码,而 GPT-Image-2 版本则留白偏多、密度偏低。

关键要点

  • 架构创新:实现了多模态理解与生成在同一内核内的打通,具备“思考、理解和创作”统一的能力,商汤方面将其比喻为“编剧和导演融为一体”。
  • 分辨率突破:支持原生 8K 分辨率输出,远超目前主流模型(如 GPT-Image-2)的 4K 上限,分辨率差距可达上百倍,对专业创作场景影响巨大。
  • 长程循环能力:具备类似人类设计师的“规划-生成-评审”闭环能力,能够自主调整策略以输出成品级结果。
  • 商业级设计能力:在复杂版式、长文本控制、多图混排等高难度设计场景中,展现出接近或达到商业出版水准的能力。
  • 战略信号:商汤通过此模型向外界释放信号,表明“设计”正在成为继编程之后,顶级多模态模型的下一个主要竞争赛场。

意义与影响

SenseNova-U1 Pro 的发布不仅是一次技术能力的展示,更预示着 AI 在产业应用层面的深层变革。

首先,设计赛道成为新焦点。随着模型能力突破工业红线,AI 在产品设计、平面设计、工业设计、视频制作、城市和园区规划等领域的应用空间被极大拓展。商汤此举旨在证明其模型在复杂设计任务上的专业性和可用性,直接对标并挑战 OpenAI 等巨头在该领域的布局。

其次,技术基座的延伸。对于商汤而言,SenseNova-U1 Pro 承载的意义超越了单纯的图像生成。它将成为数字智能与物理智能融合的技术基座,驱动 AI 走向更广阔的物理空间。例如,该模型突出的统一思考与创作能力,将为商汤短片智能体 Seko 进行复杂的剧集创作提供强大支持,进一步巩固其在 AIGC 内容生产领域的领先地位。

查看原文 →leiphone.com