Agent SkillLINUX DO · AI·1 小时前

商汤研发对标OpenAI图像模型U1 Pro，预计7月内测

原标题：消息称商汤科技正研发新图像模型：代号 U1 Pro，内部称对标 OpenAI

速览

商汤科技近期正秘密研发一款面向设计场景的多模态大模型，由联合创始人林达华牵头，内部代号U1 Pro。该模型意在对标OpenAI旗下GPT-Image 2，具备“会思考”的设计能力，支持8K分辨率输出及长程循环生成。据称在内部评测中，其生成效果与GPT-Image-2高度接近甚至更具优势，预计今年7月启动内部邀请测试。

AI 深度解读

背景

在生成式人工智能（AIGC）领域，图像生成模型已成为各大科技巨头竞相布局的核心赛道。随着 OpenAI 等领先企业不断推出高性能图像生成工具，国内头部 AI 公司也在加速技术迭代，试图在特定垂直领域实现突破。商汤科技（SenseTime）作为全球领先的 AI 软件公司，近期被曝正在秘密研发一款面向专业设计场景的多模态大模型。这一动向标志着商汤在通用大模型之外，正进一步深耕垂直行业应用，试图通过“会思考”的交互逻辑重塑图像生成工作流。

核心内容

据新浪科技独家获悉，商汤科技近期正在秘密研发一款代号 U1 Pro 的多模态大模型。该模型由商汤科技联合创始人、首席科学家 林达华 亲自牵头负责，旨在对标 OpenAI 旗下备受关注的 GPT-Image 2 模型。

U1 Pro 属于商汤“日日新”（SenseNova）大模型家族成员，由商汤研究院主导推进研发。其核心定位是面向专业设计场景，打造一款具备“思考”能力的图像生成模型。据知情人士透露，该模型预计将于今年 7 月启动内部邀请测试，并随后向客户提供服务。

在功能特性上，U1 Pro 被描述为能像“会思考的设计师”一样工作。它支持设计、生成、评审的长程循环交互，这意味着模型不仅能根据指令生成图像，还能在生成后进行自我评估或接受用户反馈，进而进行多轮迭代优化，直至满足复杂的设计需求。此外，该模型支持高达 8K 分辨率的输出，满足了专业设计领域对高精度的严苛要求。

在性能表现方面，据内部评测数据显示，在相同提示词（Prompt）条件下，U1 Pro 生成的图片效果与 GPT-Image-2 高度接近，甚至在某些维度上更具优势。这一消息若属实，表明商汤在图像生成领域的技术实力已跻身全球第一梯队，具备了与国际顶尖产品正面竞争的能力。

关键要点

研发主体与负责人：由商汤科技（SenseTime）研发，联合创始人兼首席科学家 林达华 牵头，商汤研究院具体执行。
模型代号与归属：内部代号为 U1 Pro，隶属于商汤“日日新”（SenseNova）大模型家族。
对标对象：明确对标 OpenAI 的 GPT-Image 2，意在争夺高端图像生成市场。
核心功能特性：
- 长程循环交互：支持“设计-生成-评审”的闭环流程，模拟专业设计师的工作逻辑。
- 高分辨率输出：支持 8K 分辨率，适配专业设计场景。
- 多模态能力：面向复杂设计需求，具备深度理解与生成能力。
时间节点：预计今年 7 月启动内部邀请测试，并逐步向客户开放服务。
性能评估：内部评测显示，在同等提示词下，其生成效果与 GPT-Image-2 高度接近，部分场景下表现更优。

意义与影响

U1 Pro 的研发与即将推出的测试计划，对于中国 AI 行业及全球图像生成市场具有多重深远意义。

首先，这标志着国产 AI 大模型从“通用能力追赶”向“垂直场景深耕”的转变。商汤并未单纯追求通用图像生成的参数规模，而是聚焦于“设计”这一高价值垂直领域，通过引入“评审”和“长程循环”机制，解决当前 AI 图像生成中存在的可控性差、迭代效率低等痛点。这种“会思考”的模型架构，可能成为未来专业级 AI 工具的标准范式。

其次，直接对标 GPT-Image-2 并宣称在内部评测中取得优势，显示了商汤在技术底层上的自信。如果 U1 Pro 在公开测试中能稳定复现这一性能，将极大增强国内企业在高端 AIGC 工具领域的竞争力，减少对国外头部产品的依赖，为国内设计师、创意工作者提供更具本土化适配能力的替代方案。

最后，8K 分辨率的支持和面向专业场景的定位，意味着 AI 生成内容（AIGC）正在加速渗透至传统专业工作流。这不仅提升了图像生成的上限，也预示着 AI 将从“辅助创作”工具进化为“协同创作”伙伴，对设计、广告、游戏等创意产业的生产力模式产生结构性影响。

查看原文 →linux.do

商汤研发对标OpenAI图像模型U1 Pro，预计7月内测

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐