← 返回信息流
AI 资讯雷峰网·2 天前

阿里发布Qwen3.7-Plus:多模态智能体可一键复刻桌面软件

原标题:Qwen3.7-Plus上线!多模态智能体新基座,一键复刻桌面端专业软件

速览

6月2日,阿里巴巴发布千问3.7系列多模态大模型Qwen3.7-Plus,其视觉能力在全球Vision Arena榜单中跻身前五、中国第一。该模型实现了多模态混合智能体突破,具备深度推理、自我编程及工具调用能力,可整合“看、想、写、做、验”工作流,一键复刻手机APP和桌面端专业软件。目前,Qwen3.7-Plus已在阿里云百炼平台上线并提供API服务。

AI 深度解读

背景

6月2日,阿里巴巴正式发布了千问3.7系列多模态大模型的最新成员——Qwen3.7-Plus。此次发布标志着通义千问系列在基础模型能力上的又一次重要迭代。在当前AI技术从单一模态向多模态深度融合、从被动响应向主动智能体(Agent)演进的背景下,Qwen3.7-Plus的推出旨在解决复杂长程任务中的痛点,特别是在视觉理解与自主操作之间的衔接上寻求突破。

核心内容

Qwen3.7-Plus 作为千问3.7系列的核心产品,在文本处理和视觉理解两大基础能力上均实现了显著提升。根据官方数据,该模型在全球视觉大模型权威榜单 Vision Arena 中表现优异,成功跻身全球前五,并位列中国第一。

除了基础能力的增强,Qwen3.7-Plus 的核心突破在于实现了多模态混合智能体的新范式。该模型不再局限于简单的内容生成或问答,而是具备了一套完整的自主工作流能力:

  1. 深度感知:能够看懂图片、视频等多模态输入。
  2. 深度推理:对复杂问题进行逻辑拆解与分析。
  3. 自我编程:能够自主编写代码以解决特定问题。
  4. 工具调用:能够识别并调用外部工具或API。
  5. 验证测试:对生成的结果或代码进行自我检查。
  6. 自主迭代:基于验证结果进行自我修正和优化。

通过整合“看、想、写、做、验”五个环节,Qwen3.7-Plus 构建了一个统一的智能体工作流。这使得它能够轻松完成诸如一键复刻手机APP应用、复刻桌面端专业软件等复杂且长程的任务。目前,该模型已上线阿里云百炼平台,并对外提供API服务,供开发者集成使用。

关键要点

  • 性能排名:在 Vision Arena 全球视觉大模型榜单中排名全球前五、中国第一。
  • 能力突破:实现了从“感知”到“行动”的闭环,具备自我编程、工具调用及自主迭代能力。
  • 工作流整合:将“看、想、写、做、验”五大环节整合进统一的多模态智能体工作流。
  • 应用场景:支持一键复刻手机APP及桌面端专业软件等复杂长程任务。
  • 服务状态:已上线阿里云百炼平台,开放API服务。

意义与影响

Qwen3.7-Plus 的发布代表了AI模型从“内容生成者”向“任务执行者”转型的关键一步。通过将视觉理解与自主编程、工具调用相结合,它极大地降低了开发者和普通用户构建复杂应用的门槛。

对于开发者而言,能够“一键复刻”现有软件意味着可以大幅加速原型开发和应用迁移的过程;对于行业而言,这种具备自我验证和迭代能力的智能体工作流,为解决长程、多步骤的复杂任务提供了新的技术路径,有望推动多模态智能体在软件工程、自动化办公等领域的规模化落地。

查看原文 →leiphone.com