Agent SkillLINUX DO · AI·3 小时前

GLM-5.2测试：天气卡片、鹈鹕、赛车、植物生长、3D小屋

速览

本文测试了GLM-5.2在Agent Skill场景下的单次生成能力，涵盖天气卡片、鹈鹕骑行SVG、艺术赛车、植物生长动画及3D小屋等项目。测试显示模型能一次性输出高质量代码与内容，无需二次确认，Token消耗控制在2000万以内。尽管部分效果略逊于Claude，但整体表现优异，展示了GLM-5.2在复杂创意生成方面的潜力。

AI 深度解读

背景

近期，在 LINUX DO 社区的 AI 板块中，用户分享了对 GLM-5.2 模型在代码生成与创意可视化任务中的测试体验。该测试主要依托 Claude Code 环境进行，旨在评估 GLM-5.2 在无需二次会话确认（即一次性生成）情况下的表现。测试涵盖了前端开发、SVG 图形绘制、复杂游戏概念设计以及 3D 场景构建等多个维度，整体 Token 消耗控制在 2000 万以内。测试者认为 GLM-5.2 的表现“个人感觉还不错”，但在与 Claude Opus 5（文中提及为 claude fable 5，结合语境及行业认知，极可能指代 Claude Opus 或最新旗舰模型）的对比中，指出其在光影渲染等细节上仍有提升空间。

核心内容

本次测试主要包含五个具体的 AI 生成案例，展示了 GLM-5.2 在不同类型任务中的能力边界：

天气卡片（Weather Cards）
- 任务描述：要求扮演苹果公司顶级前端工程师，创建一个包含 CSS 和 JavaScript 的单一 HTML 文件。
- 功能要求：生成并排显示的深色背景天气卡片，直观展示风力、降雨、晴天、下雪四种状态。
- 技术细节：需实现飘动云朵、摇曳树木、下落雨滴、闪耀光线等动画效果。JavaScript 部分需包含切换天气状态的功能，以演示不同动画。
- 质量要求：前端显示需精致流畅，达到“价值 200 元/月的精品天气应用”的视觉水准。
鹈鹕骑自行车（Pelican on Bicycle）
- 任务描述：绘制一个鹈鹕骑自行车的 SVG 图形。
- 执行结果：直接生成矢量图形，作为基础图形生成能力的测试。
艺术赛车（Artistic Racing Game Concept）
- 任务描述：设计一个高级艺术风格的未来赛车游戏概念。
- 核心机制：
  - 视觉演变：游戏开始时，赛车和场景均为黑白线稿（类似未完成的手绘草图）。随着赛车在高速赛道中收集彩色能量、颜料球和发光色彩碎片，车身逐渐被颜色填充，转变为拥有金属材质、霓虹涂装、真实反光和细节纹理的完整赛车。背景同步从黑白线稿转化为彩色、立体、电影感的现实世界。
  - 模式切换：加入 2D 与 3D 切换机制。玩家可通过按键在 3D 赛车模式和 2D 手绘赛车模式间切换。切换时伴随线条重组、空间折叠、纸面翻转、镜头旋转等视觉特效，呈现赛车从二维跃入三维的效果。
- 风格定位：融合黑白线稿艺术、未来主义赛车、赛博美学、动态填色及现实化场景转变，强调高级感、速度感和视觉冲击力。
- 测试结果：生成文件 index.html.zip (11.2 KB)。测试者评价其一次性生成效果不错，但相比 Claude Opus 5 仍略有差距，主要体现为“光污染”较少，光影渲染稍弱，但经过两次微调后效果应可接受。
植物生长动画（Plant Growth Animation）
- 任务描述：构建一个单文件 HTML/CSS/JS 演示（无外部库依赖），使用 SVG 模拟植物生长。
- 动画细节：茎干延伸，叶片萌发并展开，需具备弹簧或风力般的“物理”质感。
- 循环机制：动画需无缝无限循环。
- 测试结果：生成文件 植物生长动画.zip (6.3 KB)。
3D 小屋（3D Cozy Room）
- 任务描述：使用 Vite + React + Three.js (react-three-fiber/drei) 构建一个高级交互式等距 3D 舒适小屋。
- 技术约束：所有对象必须通过代码建模，禁止使用外部资产。
- 交互功能：用户点击物体时，相机平滑聚焦并显示描述信息。
- 质量要求：提供精致、无障碍的 WebGL 体验，对标“5000 万美元初创公司”级别的产品质量。
- 测试结果：生成文件 3D 小屋.zip (462.8 KB)。

关键要点

一次性生成能力：GLM-5.2 在无需人工二次干预或会话确认的情况下，能够独立完成从简单 SVG 到复杂 3D 场景的代码生成，展示了较强的指令遵循和代码整合能力。
多模态代码生成：测试覆盖了纯前端（HTML/CSS/JS）、矢量图形（SVG）、游戏逻辑概念（HTML/JS）以及现代前端框架（React/Three.js）等多种技术栈，表明模型具备广泛的编程知识储备。
视觉创意实现：模型能够理解并执行高度抽象和具象结合的视觉描述，如“从黑白线稿到彩色写实”的渐变效果，以及“2D/3D 切换”的复杂交互逻辑。
性能与成本：整个测试过程消耗 Token 不到 2000 万，体现了较高的效率。
与竞品的对比：在与 Claude Opus 5 的对比中，GLM-5.2 在基础结构和逻辑实现上表现良好，但在光影渲染的细腻度（如“光污染”效果）上稍逊一筹，不过通过少量迭代即可弥补差距。

意义与影响

此次测试揭示了当前大语言模型在“创意编程”和“视觉化代码生成”领域的进步。GLM-5.2 能够处理需要高度审美判断和复杂状态管理的任务，如动态填色和 3D 场景交互，这表明 AI 正在从单纯的代码补全向“创意实现伙伴”角色转变。

对于开发者而言，这意味着可以利用 AI 快速生成原型（Prototype），特别是对于需要复杂动画和交互的前端项目。尽管在极致的美学渲染上可能仍需人工微调或更强大的模型辅助，但 AI 已能承担大部分基础架构和核心逻辑的实现工作，显著降低开发门槛和时间成本。此外，测试中提到的“无外部资产”约束下的 3D 建模能力，也为轻量化 Web 应用开发提供了新的思路。

查看原文 →linux.do

GLM-5.2测试：天气卡片、鹈鹕、赛车、植物生长、3D小屋

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐