我用caveman把Claude Code的token消耗砍了65%,顺手测了一下值不值

GitHub 6万星的caveman插件真能让Claude Code省65%token?实测3个场景,手把手安装教程

前两天刷GitHub Trending,发现一个很有意思的项目。

叫caveman,翻译过来就是"山顶洞人"。repo描述也很搞笑——why use many token when few token do trick(为啥用很多token,少点token搞定不是一样吗)。

5月6号才发布,一周不到冲了6万星。开发者叫JuliusBrussee,做的是给Claude Code这类AI编程工具装一个"话痨模式关闭器"——让它说话少一点,但技术准确性不变。

我立刻装上了,顺手测了3个真实场景。想看结论的直接翻到第三部分。

第一部分:caveman到底是什么

简单说,caveman是一个AI编程工具的技能插件。你装上之后,Claude Code回答问题的时候会从"话痨模式"切换到"简洁模式"。

举个例子。

正常Claude Code解释React重新渲染问题,大概是这样:

"The reason your React component is re-rendering is likely because you're creating a new object reference on each render cycle. When you pass an inline object as a prop, React's shallow comparison sees it as a different object every time, which triggers a re-render. I'd recommend using useMemo to memoize the object."

用了caveman之后:

"New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo."

意思一样,字数少了75%。

这不是简单的删废话。caveman的原理是在提示词层面引导模型改变输出风格,不改模型参数,不影响代码准确性。输出的代码片段、配置内容完全一致,只是描述语言变简洁了。

caveman有4个压缩级别:

我主要用 full,偶尔用 lite。wenyan 试了一下,写代码注释的时候挺好玩,但正经用还是 full 比较舒服。

第二部分:实测3个场景,省了多少?

我自己跑了3个真实场景,给你们看看数据。

场景1:修复React re-render问题

正常Claude输出1180token,caveman模式159token。节省了87%。这个场景本身语言描述性不强,所以压缩效果最明显。

场景2:PostgreSQL连接池配置

正常2347token,caveman模式380token。节省84%。配置类内容本来就该简洁,这种场景caveman发挥空间很大。

场景3:一个前端项目的架构咨询

正常446token,caveman模式310token。节省30%。这个场景Claude本来就说得不算多,所以压缩空间有限。

官方给的数据更全,他们测了10个场景,平均节省65%。我的实测基本吻合。

还有一个我很喜欢的功能——caveman-compress。它能压缩你的CLAUDE.md这类记忆文件,平均压缩46%。意味着每次开新session,从第一天开始就省token。这个是长期省钱的大头。

另外,caveman自己维护的benchmark数据是在GitHub上公开的,有兴趣的可以去看他们的evals文件夹。数据比较诚实,是拿"Answer concisely"这个基线对比的,不是跟默认话痨模式比。

第三部分:安装教程,30秒搞定

支持Claude Code、Codex、Cursor、Windsurf、Cline、Copilot等30+工具。Windows/Mac/Linux都可以。

Claude Code用户(最简单):

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

装完之后,每次开Claude Code自动就是caveman模式,不用手动触发。想切换回正常模式,跟它说"normal mode"就行。

手动触发也支持,敲 /caveman 或者直接说"talk like caveman"。

Windows用户:

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

需要Node ≥18,没装的话先装一下Node。

其他工具(Cursor、Windsurf等)的安装说明在他们的INSTALL.md里,步骤稍微复杂一点,但也就多几分钟。

值不值?我算了笔账

Claude Code用的是Claude 3.5 Sonnet,官方价格是输入3美元/百万token,输出15美元/百万token。

以我的使用习惯(每天大概2小时编码),没装caveman之前每天大约消耗50万输出token。装了caveman之后降到约17.5万。

每天节省:32.5万输出token × $15/百万 = $4.875

每个月节省约$146,一年就是$1750。

当然这是我的用法。如果你每天只用1小时,省的钱按比例砍。但即便是轻度用户,每个月省个几十块也是稳稳的。

还有一点不能忽略的是,caveman-compress压缩记忆文件那46%是每天都在省的。开一个session省一点,累积起来很可观。

caveman还有几个附属工具我也挺喜欢:

这些小功能用习惯了还挺顺手的。

什么人适合用

我觉得分两类。

第一类是用AI编程工具频率高的开发者或者副业党。Claude Code、Cursor重度用户,每天省下来的token钱很可观。

第二类是给客户做AI编程服务的。之前看到有人做Claude Code代注册服务,或者帮企业部署AI编程环境,加上caveman能显著降低客户的API开销,服务更有竞争力。

如果你是偶尔用一下AI编程工具的轻度用户,caveman的意义相对小一点。但装上也无害,说不定哪天用到了忽然发现省了钱。

注意:caveman只压缩输出token,不影响思考token。有人说"会不会影响代码质量",这个担心是多余的——技术准确性完全不变,变的是描述方式。

最后

caveman这个项目让我想到一个问题:AI编程工具的"话痨模式"到底是不是必要的?

以前用Claude Code,确实有时候觉得它说得太多。一个简单的bug修复,非要先解释五分钟原理再给答案。用多了其实有点烦。

caveman的本质是让AI回到"解决问题"而不是"展示思考过程"。对于真正干活的开发者,这其实是更高效的方式。

省token是副产品,效率提升才是重点。

5月6号发布到现在不到一周,6万星,说明这个痛点是真实存在的。有兴趣的可以自己去GitHub看看:

github.com/JuliusBrussee/caveman

想用AI编程工具做副业但不想被token账单吓退?这里有一套我整理的提示词和工具组合,专门针对副业场景优化。39块,省着点用能用很久。

→ 点击查看提示词包

好了以上就是今天的分享,看完如果觉得有用,随手点个赞或者转发一下,我们下次再见。

图片

相关阅读:
《Claude Code省token的10个技巧》
《AI副业工具箱:每个普通人能上手的AI赚钱方向》
《DeepSeek配Claude Code:我的本地AI编程省税方案》