← 返回信息流
Agent SkillLINUX DO · AI·3 小时前

GLM-5.2测试:天气卡片、鹈鹕、赛车、植物生长、3D小屋

速览

本文测试了GLM-5.2在Agent Skill场景下的单次生成能力,涵盖天气卡片、鹈鹕骑行SVG、艺术赛车、植物生长动画及3D小屋等项目。测试显示模型能一次性输出高质量代码与内容,无需二次确认,Token消耗控制在2000万以内。尽管部分效果略逊于Claude,但整体表现优异,展示了GLM-5.2在复杂创意生成方面的潜力。

AI 深度解读

背景

近期,在 LINUX DO 社区的 AI 板块中,用户分享了对 GLM-5.2 模型在代码生成与创意可视化任务中的测试体验。该测试主要依托 Claude Code 环境进行,旨在评估 GLM-5.2 在无需二次会话确认(即一次性生成)情况下的表现。测试涵盖了前端开发、SVG 图形绘制、复杂游戏概念设计以及 3D 场景构建等多个维度,整体 Token 消耗控制在 2000 万以内。测试者认为 GLM-5.2 的表现“个人感觉还不错”,但在与 Claude Opus 5(文中提及为 claude fable 5,结合语境及行业认知,极可能指代 Claude Opus 或最新旗舰模型)的对比中,指出其在光影渲染等细节上仍有提升空间。

核心内容

本次测试主要包含五个具体的 AI 生成案例,展示了 GLM-5.2 在不同类型任务中的能力边界:

  1. 天气卡片(Weather Cards)

    • 任务描述:要求扮演苹果公司顶级前端工程师,创建一个包含 CSS 和 JavaScript 的单一 HTML 文件。
    • 功能要求:生成并排显示的深色背景天气卡片,直观展示风力、降雨、晴天、下雪四种状态。
    • 技术细节:需实现飘动云朵、摇曳树木、下落雨滴、闪耀光线等动画效果。JavaScript 部分需包含切换天气状态的功能,以演示不同动画。
    • 质量要求:前端显示需精致流畅,达到“价值 200 元/月的精品天气应用”的视觉水准。
  2. 鹈鹕骑自行车(Pelican on Bicycle)

    • 任务描述:绘制一个鹈鹕骑自行车的 SVG 图形。
    • 执行结果:直接生成矢量图形,作为基础图形生成能力的测试。
  3. 艺术赛车(Artistic Racing Game Concept)

    • 任务描述:设计一个高级艺术风格的未来赛车游戏概念。
    • 核心机制
      • 视觉演变:游戏开始时,赛车和场景均为黑白线稿(类似未完成的手绘草图)。随着赛车在高速赛道中收集彩色能量、颜料球和发光色彩碎片,车身逐渐被颜色填充,转变为拥有金属材质、霓虹涂装、真实反光和细节纹理的完整赛车。背景同步从黑白线稿转化为彩色、立体、电影感的现实世界。
      • 模式切换:加入 2D 与 3D 切换机制。玩家可通过按键在 3D 赛车模式和 2D 手绘赛车模式间切换。切换时伴随线条重组、空间折叠、纸面翻转、镜头旋转等视觉特效,呈现赛车从二维跃入三维的效果。
    • 风格定位:融合黑白线稿艺术、未来主义赛车、赛博美学、动态填色及现实化场景转变,强调高级感、速度感和视觉冲击力。
    • 测试结果:生成文件 index.html.zip (11.2 KB)。测试者评价其一次性生成效果不错,但相比 Claude Opus 5 仍略有差距,主要体现为“光污染”较少,光影渲染稍弱,但经过两次微调后效果应可接受。
  4. 植物生长动画(Plant Growth Animation)

    • 任务描述:构建一个单文件 HTML/CSS/JS 演示(无外部库依赖),使用 SVG 模拟植物生长。
    • 动画细节:茎干延伸,叶片萌发并展开,需具备弹簧或风力般的“物理”质感。
    • 循环机制:动画需无缝无限循环。
    • 测试结果:生成文件 植物生长动画.zip (6.3 KB)。
  5. 3D 小屋(3D Cozy Room)

    • 任务描述:使用 Vite + React + Three.js (react-three-fiber/drei) 构建一个高级交互式等距 3D 舒适小屋。
    • 技术约束:所有对象必须通过代码建模,禁止使用外部资产。
    • 交互功能:用户点击物体时,相机平滑聚焦并显示描述信息。
    • 质量要求:提供精致、无障碍的 WebGL 体验,对标“5000 万美元初创公司”级别的产品质量。
    • 测试结果:生成文件 3D 小屋.zip (462.8 KB)。

关键要点

  • 一次性生成能力:GLM-5.2 在无需人工二次干预或会话确认的情况下,能够独立完成从简单 SVG 到复杂 3D 场景的代码生成,展示了较强的指令遵循和代码整合能力。
  • 多模态代码生成:测试覆盖了纯前端(HTML/CSS/JS)、矢量图形(SVG)、游戏逻辑概念(HTML/JS)以及现代前端框架(React/Three.js)等多种技术栈,表明模型具备广泛的编程知识储备。
  • 视觉创意实现:模型能够理解并执行高度抽象和具象结合的视觉描述,如“从黑白线稿到彩色写实”的渐变效果,以及“2D/3D 切换”的复杂交互逻辑。
  • 性能与成本:整个测试过程消耗 Token 不到 2000 万,体现了较高的效率。
  • 与竞品的对比:在与 Claude Opus 5 的对比中,GLM-5.2 在基础结构和逻辑实现上表现良好,但在光影渲染的细腻度(如“光污染”效果)上稍逊一筹,不过通过少量迭代即可弥补差距。

意义与影响

此次测试揭示了当前大语言模型在“创意编程”和“视觉化代码生成”领域的进步。GLM-5.2 能够处理需要高度审美判断和复杂状态管理的任务,如动态填色和 3D 场景交互,这表明 AI 正在从单纯的代码补全向“创意实现伙伴”角色转变。

对于开发者而言,这意味着可以利用 AI 快速生成原型(Prototype),特别是对于需要复杂动画和交互的前端项目。尽管在极致的美学渲染上可能仍需人工微调或更强大的模型辅助,但 AI 已能承担大部分基础架构和核心逻辑的实现工作,显著降低开发门槛和时间成本。此外,测试中提到的“无外部资产”约束下的 3D 建模能力,也为轻量化 Web 应用开发提供了新的思路。

查看原文 →linux.do