商汤研发对标OpenAI图像模型U1 Pro,预计7月内测
速览
商汤科技近期正秘密研发一款面向设计场景的多模态大模型,由联合创始人林达华牵头,内部代号U1 Pro。该模型意在对标OpenAI旗下GPT-Image 2,具备“会思考”的设计能力,支持8K分辨率输出及长程循环生成。据称在内部评测中,其生成效果与GPT-Image-2高度接近甚至更具优势,预计今年7月启动内部邀请测试。
AI 深度解读
背景
在生成式人工智能(AIGC)领域,图像生成模型已成为各大科技巨头竞相布局的核心赛道。随着 OpenAI 等领先企业不断推出高性能图像生成工具,国内头部 AI 公司也在加速技术迭代,试图在特定垂直领域实现突破。商汤科技(SenseTime)作为全球领先的 AI 软件公司,近期被曝正在秘密研发一款面向专业设计场景的多模态大模型。这一动向标志着商汤在通用大模型之外,正进一步深耕垂直行业应用,试图通过“会思考”的交互逻辑重塑图像生成工作流。
核心内容
据新浪科技独家获悉,商汤科技近期正在秘密研发一款代号 U1 Pro 的多模态大模型。该模型由商汤科技联合创始人、首席科学家 林达华 亲自牵头负责,旨在对标 OpenAI 旗下备受关注的 GPT-Image 2 模型。
U1 Pro 属于商汤“日日新”(SenseNova)大模型家族成员,由商汤研究院主导推进研发。其核心定位是面向专业设计场景,打造一款具备“思考”能力的图像生成模型。据知情人士透露,该模型预计将于今年 7 月启动内部邀请测试,并随后向客户提供服务。
在功能特性上,U1 Pro 被描述为能像“会思考的设计师”一样工作。它支持设计、生成、评审的长程循环交互,这意味着模型不仅能根据指令生成图像,还能在生成后进行自我评估或接受用户反馈,进而进行多轮迭代优化,直至满足复杂的设计需求。此外,该模型支持高达 8K 分辨率的输出,满足了专业设计领域对高精度的严苛要求。
在性能表现方面,据内部评测数据显示,在相同提示词(Prompt)条件下,U1 Pro 生成的图片效果与 GPT-Image-2 高度接近,甚至在某些维度上更具优势。这一消息若属实,表明商汤在图像生成领域的技术实力已跻身全球第一梯队,具备了与国际顶尖产品正面竞争的能力。
关键要点
- 研发主体与负责人:由商汤科技(SenseTime)研发,联合创始人兼首席科学家 林达华 牵头,商汤研究院具体执行。
- 模型代号与归属:内部代号为 U1 Pro,隶属于商汤“日日新”(SenseNova)大模型家族。
- 对标对象:明确对标 OpenAI 的 GPT-Image 2,意在争夺高端图像生成市场。
- 核心功能特性:
- 长程循环交互:支持“设计-生成-评审”的闭环流程,模拟专业设计师的工作逻辑。
- 高分辨率输出:支持 8K 分辨率,适配专业设计场景。
- 多模态能力:面向复杂设计需求,具备深度理解与生成能力。
- 时间节点:预计今年 7 月启动内部邀请测试,并逐步向客户开放服务。
- 性能评估:内部评测显示,在同等提示词下,其生成效果与 GPT-Image-2 高度接近,部分场景下表现更优。
意义与影响
U1 Pro 的研发与即将推出的测试计划,对于中国 AI 行业及全球图像生成市场具有多重深远意义。
首先,这标志着国产 AI 大模型从“通用能力追赶”向“垂直场景深耕”的转变。商汤并未单纯追求通用图像生成的参数规模,而是聚焦于“设计”这一高价值垂直领域,通过引入“评审”和“长程循环”机制,解决当前 AI 图像生成中存在的可控性差、迭代效率低等痛点。这种“会思考”的模型架构,可能成为未来专业级 AI 工具的标准范式。
其次,直接对标 GPT-Image-2 并宣称在内部评测中取得优势,显示了商汤在技术底层上的自信。如果 U1 Pro 在公开测试中能稳定复现这一性能,将极大增强国内企业在高端 AIGC 工具领域的竞争力,减少对国外头部产品的依赖,为国内设计师、创意工作者提供更具本土化适配能力的替代方案。
最后,8K 分辨率的支持和面向专业场景的定位,意味着 AI 生成内容(AIGC)正在加速渗透至传统专业工作流。这不仅提升了图像生成的上限,也预示着 AI 将从“辅助创作”工具进化为“协同创作”伙伴,对设计、广告、游戏等创意产业的生产力模式产生结构性影响。
