caveman:Claude Code 技能,让 AI 像穴居人一样低语,砍掉 65% Token
速览
核心功能是提供 /caveman [lite|full|ultra|wenyan] 指令,自动压缩回复风格(去掉 filler words、礼貌语),支持多级 grunting 并保留完整代码块;亮点包括 65-75% Token 节省、速度提升约 3 倍、兼容 Claude Code、Cursor、Codex、Gemini 等 30+ 代理;适用场景是日常 coding 调试、架构讨论、PR 评论等高 Token 消耗场景,一键安装即可使用,长期降低 API 成本。
AI 深度解读
这是什么
JuliusBrussee/caveman 是一个完全开源的 Claude Code(Claude Code skill/plugin),也兼容 Codex、Gemini、Cursor、Windsurf、Cline、Copilot 等 30+ 款 Agent 平台的主语言 JavaScript 开源项目,GitHub ⭐ 79 377。它的核心是给所有 Agent 注入统一的「口头语压缩」技能,让大模型输出时像原始人一样说话:删掉 75% 的废话,保留 100% 技术准确度,同时让 Agent 表现得「大脑大、嘴巴小」。
通过一个命令即可切换四种等级:lite(只掉 filler)、full(默认 caveman)、ultra(电报式)或 wenyan(古文,极致简洁)。代码、命令、错误字符串完全原样不变,只压缩风格和表达形式。
解决的问题
大模型 API 的输出 Token 成本是主要痛点:每个回复都要浪费大量 Token 说「这个是……」,「根据我的理解是……」,「我来给你解释一下」等。用户实际需要的往往只是简洁的代码片段、命令或错误修复。
Caveman 直接解决这个问题:平均输出 Token 减少 65%(实测范围 22%-87%),速度提升 ~3x,成本永久下降。官方还引用了 2026 年 3 月的论文《Brevity Constraints Reverse Performance Hierarchies in Language Models》,证明对大模型施加简洁约束有时能提升准确率 26 分(某些基准测试),而不是总是「越多越好」。
核心功能
- 四档压缩开关:一键切换 lite / full / ultra / wenyan,覆盖不同场景。
- 语言独立压缩:支持葡萄牙语、西班牙语、法语等任何语言,压缩风格不改内容。
- 示例:把
「Novo ref de objeto cada render. Prop inline = novo ref = re-render. Envolva com useMemo.」这句原本 20+ Token 的输出,压缩成一行「One line.」。 - 状态栏徽章:Claude Code 侧边栏显示
[CAVEMAN] ⛏ 12.4k(已节省 Token),每轮/caveman-stats可更新。 - 自动激活机制:
- Claude Code、Codex、Gemini 内置支持。
- Cursor / Windsurf / Cline / Copilot 通过
--with-init规则文件永久生效。 - 其他 Agent 需手动
/caveman或让 Agent 自己说「Read CLAUDE.md and INSTALL.md」。
- 跨 Agent 通用:一个安装脚本即可适配所有平台(macOS/Linux/WSL/Git Bash/Windows PowerShell),只需 Node.js ≥18,30 秒完成。
- 嵌套压缩:caveman-compress 子技能可自动重写 CLAUDE.md、项目笔记等内存文件,每次新会话上下文更小,节省 Token 长期生效。
- OpenClaw 专用扩展:可把 Caveman 注入单机多 Agent 网关(OpenClaw),每个 Agent 自动获得「Lobster 式简洁」能力,无需每轮说
/caveman。
亮点 / 与同类相比
- 与其他同类相比:市面上类似「简洁化 Agent」的项目大多只针对单一平台或只能压缩部分内容,而 Caveman 是一键全平台通用、支持四档等级、同时提供本地技能仓库(JuliusBrussee/skills)和嵌套压缩能力。
- 真实数据驱动:官方提供了 benchmarks/ 目录的三个臂评估(baseline / terse / skill)和 evals/ 的复现脚本,真实 API Token 计数,未与默认 verbose 对比,delta 更诚实。
- 架构透明:维护者细节(文件所有权、CI 同步)全部在 CLAUDE.md;支持 re-run 多次、卸载时清理干净(技能文件夹和 SOUL.md 块不重复插入)。
- 长期收益:不仅单次回复省 Token,更通过 caveman-compress 让每次新会话上下文都更小,真正「成本去永久」。
- 免费开源:MIT 协议,免费、永久可用,可免费 Sponsor 支持维护(Atlas Cloud 等赞助商)。
适合谁用 / 上手
适合所有使用 Claude Code、Cursor、Gemini 等 Agent 的开发者——尤其是:
- 长期使用 AI 编码或调试的团队(每天几百次 Token 对话,节省可达数千 Token)。
- 对成本敏感、追求速度和可读性的用户。
- 需要中文以外多语言支持的用户(直接说「caveman Portuguese」即可)。
- 喜欢极致控制、想用「大脑大嘴巴小」风格的用户。
上手流程(30 秒):
- macOS / Linux / WSL:
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash - Windows:
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex - 触发方式:直接打
/caveman或让 Agent 自己执行安装命令即可。
其他 Agent 直接访问 https://github.com/JuliusBrussee/caveman 获取 --with-init 或手动安装。无需额外配置,立即生效。
