我用DeepSeek跑Claude Code,省了17倍的钱
一个脚本,让AI编程从每月200美元降到12美元
事情是这样的。
上周我在HackerNews上刷到一个帖子,标题很直白,「DeepClaude:Claude Code agent loop with DeepSeek V4 Pro, 17x cheaper」。89个点赞,评论区吵翻了天。
我点进去看了下,脑子里第一个反应是:这哥们疯了吧。Claude Code是Anthropic的官方编程工具,直接调用Claude的API跑,现在有人告诉你用DeepSeek的API来替代,能省17倍的钱?
你想想看,现在随便一个AI编程工具,一个月动不动一两百美元。对于我们这种自己干活、没有什么大厂预算的独立开发者来说,这个数字是真的肉疼的。
然后我仔细看了下这个项目,发现背后的逻辑比我想象的要有意思得多。不是简单粗暴的「换API」,而是一个完整的解决方案,而且上架两天就已经拿到了60多颗星。评论区有人已经开始实测了。
这篇文章,我就把这件事从头到尾给你捋清楚。
故事的开始:一个被账单逼出来的想法
项目作者叫Ali Attaran,是个在San Francisco的开发者。背景是机器学习和芯片设计,自己有挺多小项目在跑。
他之前一直在用Claude Code写代码,体验很好,但问题是,太贵了。他自己是这么说的:每个月200美元的Claude Max计划,每周还有用量上限。用着用着就超,超了就焦虑。
然后他开始想一个问题:Claude Code底层跑的是Anthropic的API,Anthropic的API接口是公开的。如果我把请求路由到别的地方去,让Claude Code以为自己还在跟Anthropic通信,实际上是在跟DeepSeek通信,是不是就行了?
结果就是DeepClaude。
简单来说:Claude Code通过设置几个环境变量就能指定API地址和密钥,DeepSeek又恰好有一个兼容Anthropic接口的endpoint。所以,不需要修改任何Claude Code的代码,只需要一个shell脚本包装一下。
就是这么一个念头,催生了一个在HackerNews上冲到第一名的项目。
技术细节:它到底是怎么工作的
我仔细看了一下这个项目的代码,核心逻辑非常简洁。
首先,Claude Code支持标准的Anthropic环境变量配置,开发者可以通过设置这些变量来改变API的请求地址和认证方式。DeepClaude做的事情,就是在启动Claude Code之前设置好这些变量。
#!/bin/sh
export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_AUTH_TOKEN="$DEEPSEEK_API_KEY"
export ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro"
export ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
exec claude "$@"
就这些。你设置好DeepSeek的API密钥,然后启动Claude Code,Claude Code会以为自己还在跟Anthropic通信,但实际上所有的请求都发到了DeepSeek的服务器。
所以理论上,这就是四行代码的事情。但作者做了更完整的东西,他写了一个完整的代理服务器来处理更复杂的情况,比如远程控制模式。
那个代理服务器在解决什么问题
这里有一个技术细节很有意思。Claude Code有一个「remote-control」模式,也就是远程控制功能。这个功能需要同时连接两个服务器:模型API的调用发到一个地方,WebSocket桥接认证发到另一个地方。
如果直接替换API地址,认证那边就断了。所以DeepClaude附带了一个Node.js的小型代理服务器,监听localhost的3200端口,把流量分开处理,模型调用发到DeepSeek,认证请求还是发到Anthropic。
这个代理还做了一个很关键的事情:SSE响应的格式规范化。DeepSeek返回的某些事件类型里缺少usage字段,而Claude Code默认这些字段是存在的,没有就会报错。代理在中间加了一层,做了数据补全。
从代码结构来看,这个项目大概率是Claude Code自己在debug模式下帮助生成的,commit记录里有来自「claude」这个用户的提交,commit信息还提到了「fix: sync model proxy」。就是很典型的AI辅助开发的场景。
真实的成本对比:17倍是怎么算出来的
说完了技术,我们来算一笔账。
这里有一个关键数据点需要先说清楚:DeepClaude默认使用DeepSeek V4 Pro作为后端,支持多后端切换。
| 后端 | 输入价格($/M) | 输出价格($/M) |
|---|---|---|
| Anthropic (原生) | $3.00 | $15.00 |
| DeepSeek V4 Pro (默认) | $0.44 | $0.87 |
| OpenRouter | $0.44 | $0.87 |
| Fireworks AI | $1.74 | $3.48 |
看输出价格,Claude的Opus是15美元每M tokens,DeepSeek V4 Pro是0.87美元每M tokens。这个比例差不多就是17倍,跟项目标题完全对得上。
但还不止这些。DeepSeek有一个自动上下文缓存机制,第一次请求后,系统会把系统提示词和文件内容缓存起来,后续重复访问的费用直接降到0.004美元每M tokens,比正常价格便宜了100多倍。
对于AI编程agent的使用场景来说,这是特别关键的一点。Agent在处理代码任务的时候,往往会反复读取同一个文件、反复发送相同的系统提示词。这个缓存机制能让实际成本再降一个数量级。
所以作者自己算的账是这样的:原来一个月200美元的Claude Max,现在换成DeepSeek V4 Pro,每个月大约只需要12美元左右。当然了,这个数字取决于你实际跑了多少tokens。
你得到了什么,又失去了什么
好了,说完美好的部分,也要说点实在的。
DeepSeek V4 Pro不是万能的。评论区里有人直接说了:如果你需要的是Sonnet级别的表现力,用DeepSeek做后端是OK的;但如果你觉得Sonnet已经不够用了,Opus才能解决问题,那DeepSeek也救不了你,还是得切回Anthropic。
简单讲就是这样:日常的、重复性的代码任务,DeepSeek V4 Pro完全能cover,而且便宜得多。但涉及到复杂推理、需要真正「思考」的任务,Opus还是领先的。
DeepClaude也支持多后端切换,用一个命令行参数就能从DeepSeek切回Anthropic。所以你可以在日常任务用DeepSeek省成本,遇到硬骨头的时候再切回Anthropic。
还有一个问题是地缘政治层面的,DeepSeek的服务器在中国。有些开发者会担心数据主权的问题,不愿意把代码发送到境外的服务器。这个是真实存在的顾虑,没有标准答案,你得自己判断自己的场景能不能接受。
评论区里的真实声音
HackerNews上这个帖子热度起来之后,评论区出现了很多真实用户的反馈,我摘几个有意思的给你看:
有人直接贴出了最简化的实现方式,四行shell脚本,不需要任何代理,就能达到DeepClaude 90%的效果。作者自己也在底下承认了,他说 remote-control 模式确实需要代理,但如果不用那个功能的话,就是这么简单。
也有人说自己之前用DeepSeek配合OpenCode和Hermes,发现基础工具的使用体验差距很大。但这个比较不一定公平,因为不同工具的定位不一样。
比较有意思的一个讨论是关于分层策略的:有人说我用Opus做架构设计和代码审查,用本地Qwen 3.6 27B做具体实现。这种分层策略其实跟DeepClaude的思路是一致的,不是非此即彼,而是让不同的模型各司其职。
还有人说,DeepSeek官方文档里其实已经写了怎么把Claude Code直接接入他们的API,根本不需要第三方工具。这条信息没被广泛注意到,有点可惜。
这背后其实是一场更大的战争
说真的,我看到DeepClaude的时候,第一个想到的倒不是技术问题,而是一个更大的格局问题。
你想想看,Claude Code是Anthropic做的最好用的编程工具之一,它的官方后端是Claude API。但现在有人发现,换一个后端,这个工具照样能跑,而且成本降了17倍。
这说明什么?说明Claude Code本身的产品力和技术架构是解耦的。它的价值在于用户体验和工作流设计,而不在于它绑定的底层模型。
这就好像iPhone,当年iPhone用的是AT&T的网络,但iPhone的产品力来源于苹果的设计和生态,而不是网络本身。后来LTE出来了,苹果换运营商合作,iPhone还是iPhone。
AI工具正在经历同样的事情。当底层模型越来越同质化(Claude、GPT、DeepSeek、Gemini之间的差距在缩小),真正有价值的东西变成了:产品体验、工作流设计、以及你有没有在正确的场景用正确的模型。
评论里有一条说得很好:「AI战争已经开始了」。
这不是模型和模型之间的战争,而是生态和生态之间的战争。谁能做出让用户离不开的工具链,谁就能在模型战争里立于不败之地。Anthropic做出Claude Code,DeepSeek能成为它最便宜的后端,这件事本身就很有意思。
对于做副业的人来说,这意味着什么
说回我们这些具体干活的独立开发者。
如果你正在用AI编程工具来开发你的副业项目,DeepClaude的价值是很直接的:降低你的工具成本。一个月省下来的钱,可能比你那个副业一个月赚的钱还多。
但更重要的可能是思路上的启发。
你现在用的是什么AI编程工具?有没有可能换一个更便宜的后端来跑它?你有没有尝试过分层策略,简单任务用便宜模型,复杂任务再切贵模型?
工具是工具,模型是模型。这两者完全可以分开采购。你喜欢的那个IDE或者CLI工具,不代表你一定要用它官方推荐的模型。这里面的信息差,其实还挺大的。
DeepClaude本身只是一个脚本,但它代表了一种更理性的使用AI工具的方式,不被品牌和定价绑架,用最合适的成本完成手上的工作。
好了,就说这么多。我自己已经打算去试试了,看看DeepSeek跑Claude Code到底顺不顺畅,以及省下来的钱够不够买咖啡的。
如果你试了,记得回来告诉我怎么样。屏幕前的兄弟,把你的实测结果发在评论区吧。
我们下次见。
以上。
相关链接: