GitHub 6万星的caveman插件真能让Claude Code省65%token?实测3个场景,手把手安装教程
前两天刷GitHub Trending,发现一个很有意思的项目。
叫caveman,翻译过来就是"山顶洞人"。repo描述也很搞笑——why use many token when few token do trick(为啥用很多token,少点token搞定不是一样吗)。
5月6号才发布,一周不到冲了6万星。开发者叫JuliusBrussee,做的是给Claude Code这类AI编程工具装一个"话痨模式关闭器"——让它说话少一点,但技术准确性不变。
我立刻装上了,顺手测了3个真实场景。想看结论的直接翻到第三部分。
简单说,caveman是一个AI编程工具的技能插件。你装上之后,Claude Code回答问题的时候会从"话痨模式"切换到"简洁模式"。
举个例子。
正常Claude Code解释React重新渲染问题,大概是这样:
"The reason your React component is re-rendering is likely because you're creating a new object reference on each render cycle. When you pass an inline object as a prop, React's shallow comparison sees it as a different object every time, which triggers a re-render. I'd recommend using useMemo to memoize the object."
用了caveman之后:
"New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo."
意思一样,字数少了75%。
这不是简单的删废话。caveman的原理是在提示词层面引导模型改变输出风格,不改模型参数,不影响代码准确性。输出的代码片段、配置内容完全一致,只是描述语言变简洁了。
caveman有4个压缩级别:
我主要用 full,偶尔用 lite。wenyan 试了一下,写代码注释的时候挺好玩,但正经用还是 full 比较舒服。
我自己跑了3个真实场景,给你们看看数据。
场景1:修复React re-render问题
正常Claude输出1180token,caveman模式159token。节省了87%。这个场景本身语言描述性不强,所以压缩效果最明显。
场景2:PostgreSQL连接池配置
正常2347token,caveman模式380token。节省84%。配置类内容本来就该简洁,这种场景caveman发挥空间很大。
场景3:一个前端项目的架构咨询
正常446token,caveman模式310token。节省30%。这个场景Claude本来就说得不算多,所以压缩空间有限。
官方给的数据更全,他们测了10个场景,平均节省65%。我的实测基本吻合。
还有一个我很喜欢的功能——caveman-compress。它能压缩你的CLAUDE.md这类记忆文件,平均压缩46%。意味着每次开新session,从第一天开始就省token。这个是长期省钱的大头。
另外,caveman自己维护的benchmark数据是在GitHub上公开的,有兴趣的可以去看他们的evals文件夹。数据比较诚实,是拿"Answer concisely"这个基线对比的,不是跟默认话痨模式比。
支持Claude Code、Codex、Cursor、Windsurf、Cline、Copilot等30+工具。Windows/Mac/Linux都可以。
Claude Code用户(最简单):
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
装完之后,每次开Claude Code自动就是caveman模式,不用手动触发。想切换回正常模式,跟它说"normal mode"就行。
手动触发也支持,敲 /caveman 或者直接说"talk like caveman"。
Windows用户:
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex
需要Node ≥18,没装的话先装一下Node。
其他工具(Cursor、Windsurf等)的安装说明在他们的INSTALL.md里,步骤稍微复杂一点,但也就多几分钟。
Claude Code用的是Claude 3.5 Sonnet,官方价格是输入3美元/百万token,输出15美元/百万token。
以我的使用习惯(每天大概2小时编码),没装caveman之前每天大约消耗50万输出token。装了caveman之后降到约17.5万。
每天节省:32.5万输出token × $15/百万 = $4.875
每个月节省约$146,一年就是$1750。
当然这是我的用法。如果你每天只用1小时,省的钱按比例砍。但即便是轻度用户,每个月省个几十块也是稳稳的。
还有一点不能忽略的是,caveman-compress压缩记忆文件那46%是每天都在省的。开一个session省一点,累积起来很可观。
caveman还有几个附属工具我也挺喜欢:
/caveman-commit:自动生成规范commit信息,不超过50字符/caveman-review:PR评论只写一行,L42: bug: user null/caveman-stats:显示这session省了多少token,可以发推这些小功能用习惯了还挺顺手的。
我觉得分两类。
第一类是用AI编程工具频率高的开发者或者副业党。Claude Code、Cursor重度用户,每天省下来的token钱很可观。
第二类是给客户做AI编程服务的。之前看到有人做Claude Code代注册服务,或者帮企业部署AI编程环境,加上caveman能显著降低客户的API开销,服务更有竞争力。
如果你是偶尔用一下AI编程工具的轻度用户,caveman的意义相对小一点。但装上也无害,说不定哪天用到了忽然发现省了钱。
caveman这个项目让我想到一个问题:AI编程工具的"话痨模式"到底是不是必要的?
以前用Claude Code,确实有时候觉得它说得太多。一个简单的bug修复,非要先解释五分钟原理再给答案。用多了其实有点烦。
caveman的本质是让AI回到"解决问题"而不是"展示思考过程"。对于真正干活的开发者,这其实是更高效的方式。
省token是副产品,效率提升才是重点。
5月6号发布到现在不到一周,6万星,说明这个痛点是真实存在的。有兴趣的可以自己去GitHub看看:
github.com/JuliusBrussee/caveman
想用AI编程工具做副业但不想被token账单吓退?这里有一套我整理的提示词和工具组合,专门针对副业场景优化。39块,省着点用能用很久。
好了以上就是今天的分享,看完如果觉得有用,随手点个赞或者转发一下,我们下次再见。
图片
相关阅读:
《Claude Code省token的10个技巧》
《AI副业工具箱:每个普通人能上手的AI赚钱方向》
《DeepSeek配Claude Code:我的本地AI编程省税方案》