NVIDIA 白嫖 GLM-5.2 无限使用并开启思考工具调用
原标题:[福利] NVIDIA 白嫖无限 GLM-5.2,附 OpenCode 开启思考与工具调用配置
速览
NVIDIA 的免费建模平台针对 GLM-5.2 模型开放了无限额度体验,用户只需注册手机号生成 API Key 并配置 Base URL 即可直接调用。目前接口默认不支持思考和工具调用,但通过 OpenCode 项目配置即可快速开启。核心在于将工具调用参数设为 false,并使用 chat_template_kwargs 开启 enable_thinking 功能,让 GLM-5.2 获得自主思考能力。这为开发者提供了免费且强大的开源大模型体验,有效降低了 LLM 应用的开发门槛,适合个人开发者、开源项目和原型验证场景。
AI 深度解读
## 这是什么
NVIDIA NIM 接口提供的免费 GLM-5.2(智谱 z-ai 模型)服务器端推理服务。原帖称“无限白嫖”,实际为免费评估端点,需 OpenCode 等前端配置思考与工具调用。
## 怎么领取 / 使用
- 访问 https://build.nvidia.com/settings/api-keys 注册并验证手机号。
- 进入 https://build.nvidia.com/z-ai/glm-5.2,同意条款,点击 “Generate API Key” 生成 Key。
- 接口信息:
Base URL:https://integrate.api.nvidia.com/v1
API Key:nvapi-...(前缀 nvapi-) - 插入 OpenCode 配置(支持思考和工具调用):
"NVIDIA": { "npm": "@ai-sdk/openai-compatible", "options": { "baseURL": "https://integrate.api.nvidia.com/v1", "apiKey": "nvapi-..." }, "models": { "z-ai/glm-5.2": { "name": "GLM-5.2", "tool_call": false, "modalities": { "input": ["text"], "output": ["text"] }, "options": { "chat_template_kwargs": { "enable_thinking": true } } } } }
## 限制与注意(额度 / 有效期 / 封号风险等)
- 免费额度:无固定额度,按使用量消耗(大型模型如 GLM-5.2 消耗较多),无长期试用或永久额度。
- 速度:默认速率限制 40 RPM(Requests Per Minute),因网络拥堵可能波动。
- 有效期:无到期日期,持续可用。
- 注意:免费端点可能因负载限速,工具调用需 OpenCode 自行管理;使用条款未明确,存在被临时限制或终止风险;未提及具体封号条件。
- 帖子未说明其他限制(例如具体 RPM、每日上限等)。
## 值不值得
值:GLM-5.2 能力强(复杂推理、agentic 任务),配合工具调用后可用性高,免费且无地域限制。
不值:免费版速度和稳定性受限,适合测试/轻度使用,重度需求建议自部署或付费通道。
查看原文 →linux.do
