← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

实测微软M365 Copilot三大生图渠道:GPT-5模型表现最佳

原标题:微软 m365 copilot 三个生图渠道比较

速览

本文实测微软M365 Copilot的三种图片生成渠道。在直接对话窗口使用GPT-5推理模型时,中文支持完美且画面细腻真实,疑似调用gpt-image-2。相比之下,专用图像生成页面中文支持较差,而PowerPoint内置的MAI模型生成质量较低且稳定性不足。

AI 深度解读

背景

微软 Microsoft 365 (M365) Copilot 作为集成在办公套件中的 AI 助手,其核心能力之一是生成图像。然而,不同接入渠道背后的模型调用机制、语言支持能力以及生成质量存在显著差异。本文基于一名拥有 M365 五年高级订阅账号的用户在 LINUX DO 社区分享的实际测试经验,对比了 M365 Copilot 在三个不同入口生成图像的表现,旨在揭示不同渠道在模型选择、中文支持及稳定性上的真实差异。

核心内容

测试者使用统一的提示词:“创建一张图片:午后的暖阳下,一只白色的小猫在睡觉。图片上有温暖又舒服的中文诗句。” 对 M365 Copilot 的三个主要生图渠道进行了横向对比:

1. 直接聊天窗口 (m365.cloud.microsoft/chat/)

  • 模型配置:用户选择了 GPT 5.5 Think Deeper 模式。
  • 生成质量:画面细腻、真实,且对中文诗句的支持完美,文字渲染准确。
  • 模型推测:Copilot 自称基于 GPT-5 reasoning model,但明确指出图像生成由单独的图像生成系统完成。根据生成效果推测,实际调用的可能是 gpt-image-2 模型。
  • 体验评价:这是目前体验最佳、中文支持最完善的渠道。

2. Create an image 专用入口 (m365.cloud.microsoft/create/)

  • 模型配置:系统自动调用,测试者推测为 gpt-image-1.5
  • 生成质量:中文支持较差,无法准确渲染提示词中的中文诗句。
  • 体验评价:该入口此前被广泛使用,但中文处理能力明显弱于聊天窗口。测试者发现,直接在对话中生成图片能带来更好的惊喜,但关于该渠道的生成额度限制尚不明确。

3. PowerPoint 内嵌调用 (powerpoint.cloud.microsoft)

  • 模型配置:调用微软内部的 MAI image 2.5 模型。
  • 生成质量:质量极低,被形容为“幼儿园水平”。
  • 稳定性:尝试调用 gpt-image-2 等其他模型均告失败,表现为反复重试或服务器报错。
  • 体验评价:作为办公场景下的备用生图方案,其稳定性和质量均不理想。

关键要点

  • 渠道差异决定模型版本:M365 Copilot 的不同入口并非调用同一套图像生成引擎。聊天窗口倾向于调用更先进的模型(推测为 gpt-image-2),而专用图像入口可能仍在使用旧版模型(gpt-image-1.5)。
  • 中文支持存在显著断层:在聊天窗口生成的图像中,中文文字渲染完美;而在 Create an image 入口中,中文支持不佳。这表明不同模型或后端配置对多语言文本渲染的支持程度不同。
  • 办公套件内嵌功能稳定性不足:在 PowerPoint 中直接调用生图功能,不仅质量低下(使用 MAI image 2.5),且兼容性差,难以稳定调用更高级的 GPT 图像模型。
  • 提示词策略建议:若需生成包含高质量中文文字的图像,建议优先使用 M365 Copilot 的直接聊天窗口,并选择合适的推理模式(如 Think Deeper),而非依赖专用的图像生成入口或 Office 组件内嵌功能。

意义与影响

此次对比测试揭示了企业级 AI 助手在实际应用中的“碎片化”现状。尽管用户购买的是统一的 M365 订阅,但不同功能模块背后可能连接着不同的模型版本或服务等级,导致体验不一致。

对于普通用户而言,这一发现意味着在使用 Copilot 进行创意工作时,入口的选择直接决定了输出质量。特别是在涉及中文排版、文字渲染等复杂任务时,直接通过聊天窗口交互可能是目前最可靠的路径。

对于微软而言,这也反映了其多模型整合策略下的挑战。如何在保持不同产品组件(如 Chat、Create、PowerPoint)独立迭代的同时,统一模型能力、语言支持标准和生成质量,是提升用户体验的关键。此外,gpt-image-2 等新一代模型在聊天窗口中的优先部署,也暗示了微软可能正在逐步淘汰旧版图像生成模型,或将其限制在特定低频场景中。

查看原文 →linux.do