AI 资讯雷峰网·2 天前

阿里发布Qwen3.7-Plus：多模态智能体可一键复刻桌面软件

原标题：Qwen3.7-Plus上线！多模态智能体新基座，一键复刻桌面端专业软件

速览

6月2日，阿里巴巴发布千问3.7系列多模态大模型Qwen3.7-Plus，其视觉能力在全球Vision Arena榜单中跻身前五、中国第一。该模型实现了多模态混合智能体突破，具备深度推理、自我编程及工具调用能力，可整合“看、想、写、做、验”工作流，一键复刻手机APP和桌面端专业软件。目前，Qwen3.7-Plus已在阿里云百炼平台上线并提供API服务。

AI 深度解读

背景

6月2日，阿里巴巴正式发布了千问3.7系列多模态大模型的最新成员——Qwen3.7-Plus。此次发布标志着通义千问系列在基础模型能力上的又一次重要迭代。在当前AI技术从单一模态向多模态深度融合、从被动响应向主动智能体（Agent）演进的背景下，Qwen3.7-Plus的推出旨在解决复杂长程任务中的痛点，特别是在视觉理解与自主操作之间的衔接上寻求突破。

核心内容

Qwen3.7-Plus 作为千问3.7系列的核心产品，在文本处理和视觉理解两大基础能力上均实现了显著提升。根据官方数据，该模型在全球视觉大模型权威榜单 Vision Arena 中表现优异，成功跻身全球前五，并位列中国第一。

除了基础能力的增强，Qwen3.7-Plus 的核心突破在于实现了多模态混合智能体的新范式。该模型不再局限于简单的内容生成或问答，而是具备了一套完整的自主工作流能力：

深度感知：能够看懂图片、视频等多模态输入。
深度推理：对复杂问题进行逻辑拆解与分析。
自我编程：能够自主编写代码以解决特定问题。
工具调用：能够识别并调用外部工具或API。
验证测试：对生成的结果或代码进行自我检查。
自主迭代：基于验证结果进行自我修正和优化。

通过整合“看、想、写、做、验”五个环节，Qwen3.7-Plus 构建了一个统一的智能体工作流。这使得它能够轻松完成诸如一键复刻手机APP应用、复刻桌面端专业软件等复杂且长程的任务。目前，该模型已上线阿里云百炼平台，并对外提供API服务，供开发者集成使用。

关键要点

性能排名：在 Vision Arena 全球视觉大模型榜单中排名全球前五、中国第一。
能力突破：实现了从“感知”到“行动”的闭环，具备自我编程、工具调用及自主迭代能力。
工作流整合：将“看、想、写、做、验”五大环节整合进统一的多模态智能体工作流。
应用场景：支持一键复刻手机APP及桌面端专业软件等复杂长程任务。
服务状态：已上线阿里云百炼平台，开放API服务。

意义与影响

Qwen3.7-Plus 的发布代表了AI模型从“内容生成者”向“任务执行者”转型的关键一步。通过将视觉理解与自主编程、工具调用相结合，它极大地降低了开发者和普通用户构建复杂应用的门槛。

对于开发者而言，能够“一键复刻”现有软件意味着可以大幅加速原型开发和应用迁移的过程；对于行业而言，这种具备自我验证和迭代能力的智能体工作流，为解决长程、多步骤的复杂任务提供了新的技术路径，有望推动多模态智能体在软件工程、自动化办公等领域的规模化落地。

查看原文 →leiphone.com

阿里发布Qwen3.7-Plus：多模态智能体可一键复刻桌面软件

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐