← 返回信息流
Agent SkillLINUX DO · AI·2 小时前

Codex端Image2生图实测:参数非硬性指令且上限1.5k

原标题:目前的image2生图

速览

测试显示Codex端Image2生图未走严格模型,而是采用调制版逻辑。用户指定的尺寸和质量并非硬性指令,模型会根据提示词复杂度内部决定输出规格,且不支持2k以上高分辨率,极限为1.5k。尽管参数执行存在偏差,但在1k至1.5k范围内,其生成品质与官方API基本一致。

AI 深度解读

背景

近期在 LINUX DO 社区中,关于 AI 图像生成技术(特别是 Codex 端)的讨论热度不减。随着市场对高质量图像生成需求的增加,各大模型提供商不断调整其底层逻辑以平衡速度、成本与画质。本文基于社区内关于“Image2”生图机制的最新测试反馈,深入剖析当前 Codex 接口在处理图像生成任务时的实际行为模式,旨在澄清用户对于“Image2”模型严格性的误解,并揭示其内部调度机制。

核心内容

目前针对 Codex 端的图像生成测试显示,其底层逻辑并未严格遵循传统的 Image2 模型规范,而是采用了一种被称为“Image Latest”的调制版本。这种“Latest”版本可以被视为 Image2 为了适应当前市场状况而进行的动态调整版。

在具体的执行过程中,用户指定的图像尺寸(Size)和质量要求(Quality)并非硬性指令。Codex 模型在接收到 Prompt(提示词)后,会进行内部自主判断,决定生成图像的质量等级(High、Medium 或 Low)。通常情况下,复杂且细节丰富的 Prompt 会被分配至 High 质量通道处理;然而,若提示词过于简单,即便用户强制指定高质量输出,系统仍可能为了效率选择速度更快的 Low 质量通道。

此外,生成的图像尺寸也不遵循严格的倍数比例规则。例如,在测试中,虽然用户要求生成 16:9 比例的图像,但最终输出的分辨率并非标准的 1920×1080 或 2560×1440 等符合 12 倍数规则的数值,而是出现了如 1672×941 这样的非标准比例。这与官方 API 中 Image2 严格遵循 12 倍数比例生成的机制形成了鲜明对比。

测试结论指出,目前通过 Codex 生成的图像存在上限,无法生成 2K 及以上的超高分辨率图片,其极限分辨率约为 1.5K。同时,Size 和 Quality 参数由模型内部黑盒判断,无法保证严格按照用户指令执行。不过,对于 1K 及 1.5K 分辨率的图像,在保持相同提示词、尺寸和质量设定的前提下,官方 API 与 Codex 生成的图像在视觉品质上基本没有差别。

关键要点

  • 模型机制调整:当前 Codex 端的生图并非严格走 Image2 模型,而是基于“Image Latest”这一调制版本,该版本更侧重于适应市场动态。
  • 质量判定自主化:用户指定的 Quality 参数(High/Medium/Low)仅供参考,模型会根据 Prompt 的复杂度内部决策。简单 Prompt 即使指定 High 也可能降级为 Low 以换取速度。
  • 尺寸比例非标准化:生成的图像尺寸不遵循严格的 12 倍数规则,可能出现如 1672×941 这类非标准比例,与官方 API 的严格规范不同。
  • 分辨率上限限制:Codex 端无法生成 2K 及以上的图片,最高极限分辨率约为 1.5K。
  • 品质等效性:在 1K 至 1.5K 的分辨率范围内,只要提示词、尺寸和质量设定一致,Codex 生成的图像与官方 API 生成的图像在品质上无明显差异。

意义与影响

这一发现对 AI 图像生成开发者及高级用户具有重要的参考价值。首先,它打破了“Image2”即意味着严格遵循官方参数规范的固有认知,揭示了在实际工程应用中,模型可能存在更灵活的内部调度策略。对于需要精确控制输出尺寸和质量的开发者而言,这意味着不能单纯依赖参数传递,而需考虑模型内部的概率性判断。

其次,明确了 1.5K 为当前 Codex 端的画质上限,有助于用户在项目规划中合理设定预期,避免在需要 2K+ 超高清输出的场景中误用该接口。最后,既然在 1K-1.5K 区间内两者品质无异,用户可根据成本、速度及灵活性需求,在官方 API 与 Codex 端之间做出更优化的技术选型。

查看原文 →linux.do