Agent SkillLINUX DO · AI·1 小时前

实测微软M365 Copilot三大生图渠道：GPT-5模型表现最佳

原标题：微软 m365 copilot 三个生图渠道比较

速览

本文实测微软M365 Copilot的三种图片生成渠道。在直接对话窗口使用GPT-5推理模型时，中文支持完美且画面细腻真实，疑似调用gpt-image-2。相比之下，专用图像生成页面中文支持较差，而PowerPoint内置的MAI模型生成质量较低且稳定性不足。

AI 深度解读

背景

微软 Microsoft 365 (M365) Copilot 作为集成在办公套件中的 AI 助手，其核心能力之一是生成图像。然而，不同接入渠道背后的模型调用机制、语言支持能力以及生成质量存在显著差异。本文基于一名拥有 M365 五年高级订阅账号的用户在 LINUX DO 社区分享的实际测试经验，对比了 M365 Copilot 在三个不同入口生成图像的表现，旨在揭示不同渠道在模型选择、中文支持及稳定性上的真实差异。

核心内容

测试者使用统一的提示词：“创建一张图片：午后的暖阳下，一只白色的小猫在睡觉。图片上有温暖又舒服的中文诗句。” 对 M365 Copilot 的三个主要生图渠道进行了横向对比：

1. 直接聊天窗口 (m365.cloud.microsoft/chat/)

模型配置：用户选择了 GPT 5.5 Think Deeper 模式。
生成质量：画面细腻、真实，且对中文诗句的支持完美，文字渲染准确。
模型推测：Copilot 自称基于 GPT-5 reasoning model，但明确指出图像生成由单独的图像生成系统完成。根据生成效果推测，实际调用的可能是 gpt-image-2 模型。
体验评价：这是目前体验最佳、中文支持最完善的渠道。

2. Create an image 专用入口 (m365.cloud.microsoft/create/)

模型配置：系统自动调用，测试者推测为 gpt-image-1.5。
生成质量：中文支持较差，无法准确渲染提示词中的中文诗句。
体验评价：该入口此前被广泛使用，但中文处理能力明显弱于聊天窗口。测试者发现，直接在对话中生成图片能带来更好的惊喜，但关于该渠道的生成额度限制尚不明确。

3. PowerPoint 内嵌调用 (powerpoint.cloud.microsoft)

模型配置：调用微软内部的 MAI image 2.5 模型。
生成质量：质量极低，被形容为“幼儿园水平”。
稳定性：尝试调用 gpt-image-2 等其他模型均告失败，表现为反复重试或服务器报错。
体验评价：作为办公场景下的备用生图方案，其稳定性和质量均不理想。

关键要点

渠道差异决定模型版本：M365 Copilot 的不同入口并非调用同一套图像生成引擎。聊天窗口倾向于调用更先进的模型（推测为 gpt-image-2），而专用图像入口可能仍在使用旧版模型（gpt-image-1.5）。
中文支持存在显著断层：在聊天窗口生成的图像中，中文文字渲染完美；而在 Create an image 入口中，中文支持不佳。这表明不同模型或后端配置对多语言文本渲染的支持程度不同。
办公套件内嵌功能稳定性不足：在 PowerPoint 中直接调用生图功能，不仅质量低下（使用 MAI image 2.5），且兼容性差，难以稳定调用更高级的 GPT 图像模型。
提示词策略建议：若需生成包含高质量中文文字的图像，建议优先使用 M365 Copilot 的直接聊天窗口，并选择合适的推理模式（如 Think Deeper），而非依赖专用的图像生成入口或 Office 组件内嵌功能。

意义与影响

此次对比测试揭示了企业级 AI 助手在实际应用中的“碎片化”现状。尽管用户购买的是统一的 M365 订阅，但不同功能模块背后可能连接着不同的模型版本或服务等级，导致体验不一致。

对于普通用户而言，这一发现意味着在使用 Copilot 进行创意工作时，入口的选择直接决定了输出质量。特别是在涉及中文排版、文字渲染等复杂任务时，直接通过聊天窗口交互可能是目前最可靠的路径。

对于微软而言，这也反映了其多模型整合策略下的挑战。如何在保持不同产品组件（如 Chat、Create、PowerPoint）独立迭代的同时，统一模型能力、语言支持标准和生成质量，是提升用户体验的关键。此外，gpt-image-2 等新一代模型在聊天窗口中的优先部署，也暗示了微软可能正在逐步淘汰旧版图像生成模型，或将其限制在特定低频场景中。

查看原文 →linux.do

实测微软M365 Copilot三大生图渠道：GPT-5模型表现最佳

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐